Budeme sa bližšie pozrieť na presne tak, ako to robí to ďalej.
Rozpoznávanie reči a štatistický modeling
systémy rozpoznávania reči Čoskoro sa pokúsil uplatniť súbor gramatických a syntaktických pravidiel na reči. V prípade, že slová povedané zapadajú do určitého súboru pravidiel, by mohol program určiť, čo tie slová. Avšak, ľudský jazyk má početné výnimky z vlastných pravidiel, aj keď je hovorené dôsledne. Akcenty, dialekty a maniere môžu výrazne zmeniť spôsob, akým určité slová alebo frázy sú hovorené. Predstavte si, že niekto z Bostonu hovoriť slová ". Stodoly " Nechcel vysloviť " r " vôbec, a slovo vyjde rýmov s ". John " Alebo si vezmime vetu, " budem vidieť oceán &Quote .; Väčšina ľudí nemá vyslovovať svoje slová veľmi starostlivo. Výsledok by mohol vyjsť ako " Idem da pozri odkopáva oceán &Quote .; Oni beží niekoľko slov spoločne so žiadnym znateľným prestávky, napríklad " Idem " a ". oceán " Systémy založený na pravidlách boli neúspešné, pretože oni nemohli zvládnuť tieto varianty. To tiež vysvetľuje, prečo skoršie systémy nemohli zvládnuť súvislé reči. - Ste museli hovoriť každé slovo zvlášť, s krátkou pauzou medzi nimi
systémy rozpoznávania reči Dnešné používať výkonné a zložité štatistické modelovanie systémov. Tieto systémy používajú pravdepodobnosti a matematické funkcie určiť najpravdepodobnejší výsledok. Podľa Johna Garofolo, skupina Speech manažér v Informačnom Technology Laboratory Národného inštitútu pre štandardy a technológie, dva modely, ktoré dominujú polia sú dnes Hidden Markov model a neurónové siete. Tieto metódy zahŕňajú zložité matematické funkcie, ale v zásade, berú informácie známej systému, aby zistili informácie od neho.
The Hidden Markov model je najviac obyčajný, takže budeme sa bližšie pozrieť pri tomto procese. V tomto modeli, každý fonémový je ako článok reťaze, a hotový reťaz je slovo. Avšak, konáre reťaz z v rôznych smeroch je napríklad program pokúsi prispôsobiť digitálny zvuk fonémy, ktorý je s najväčšou pravdepodobnosťou príde nabudúce. Počas tohto procesu, program priradí pravdepodobnosti skóre na každej fonémová, na základe jeho vstavaný slovník a školenie užívateľov
Tento proces je ešte komplikovanejšia pre fráz a viet. - Systém musí prísť na to, kde každé slovo sa zastaví a spustí. Klasickým príkladom je výraz " rozpoznať reč, " čo znie veľa ako " vrak pekná pláž &qu