r eh K ao g v n Ay Z S P iy ch
" rozpoznať reč "
r eh k ay ay n y b iy ch
" vrak pekné pláže "
Prečo je to tak zložité? Ak program má slovník 60.000 slov (časté v dnešných programov), sekvencia z troch slov by mohol byť ktorýkoľvek z 216 biliónov možností. Je zrejmé, že ani najsilnejšie počítač nie je prehľadávať všetky z nich bez pomoci.
To pomoc prichádza v podobe programu výcviku. Podľa Johna Garofolo:
Tieto štatistické systémy vyžadujú veľké množstvo príkladov tréningových dát k dosiahnutiu ich optimálny výkon - niekedy v poriadku tisícov hodín ľudskej transkripciu reči a stovky megabajtov textu. Tieto údaje školení slúži na vytvorenie akustickej modely slov, zoznamov slov, a [...] víceslovnými pravdepodobnosti sietí. Tam je nejaké umenie na to, ako jeden vyberá, spracováva a pripravuje je toto školenie dát pre " trávenie " v systéme a ako modely systémové " naladení " pre zvláštne použitie. Tieto údaje môže znamenať rozdiel medzi dobre fungujúci systém a zle fungujúci systém. - Aj pri použití rovnakej základnej algoritmus
Kým vývojári softvéru, ktorí nastaviť systém je počiatočná slovnej zásoby plniť veľa z tohto tréningu, je koniec Užívateľ musí tiež stráviť nejaký čas trénovať ho. V obchodnom prostredí, primárne užívatelia programu musia stráviť nejaký čas (niekedy len za 10 minút) hovorenie do systému trénovať ju a na ich konkrétne vzory reči. Musí tiež systém naučiť rozpoznať výrazy a skratky, najmä pre spoločnosť. Špeciálna edícia programov rozpoznávania reči pre lekárske alebo právnické kancelárie majú pojmy všeobecne používané v týchto oblastiach už vyškolených do nich.
Ďalej sa pozrieme na niektoré slabiny a nedostatky v systémoch rozpoznávania reči.
Rozpoznávanie reči : slabé stránky a nedostatky
Žiadny systém rozpoznávania reči je 100 percent dokonalý; niekoľko faktorov, môže znížiť presnosť. Niektoré z týchto faktorov sú otázky, ktoré aj naďalej zlepšovať, ako technológia zlepšuje. Iní môžu byť znížené - ak nie celkom opravené - užívateľ
Low signál-šum
Tento program potrebuje " počuť ". slová zreteľne vyslovovaných, a žiadne ďalšie hluk zavedená do zvuku sa rušiť to. Hluk môže pochádzať z rôznych zdrojov, vrátane hluku pozadia v kancelá