Získavanie vedomostí
/ Knowledge Discovery >> Získavanie vedomostí >> technológie >> počítač >> internet >> web design vývoj >>

Expert Stuff: Okuliare Mike Cohen

viac, než robiť veci s panvou, a tak tým, že kŕmenie veľké množstvo dát k tomuto modelu. - sme to na volanie jazykového modelu. Je to štatistický model slovných sekvencií, ako pravdepodobné, že rôzne slová sú nastať vzhľadom na to, čo nedávna slová boli. Tým, kŕmenie modelu veľké množstvo dát, to jednoducho počíta všetky tieto štatistiky o to, čo je pravdepodobné, že dôjde nabudúce, a to je jazyk modelu. Takže teraz, tieto tri modely, akustický model, alebo model so všetkými tými základnými zvuky, lexikónu, alebo model, ako všetky slová získať výraznejší, a nakoniec jazykový model, alebo ako sa všetky tie slová dostať navlečené dohromady dostať skompilovaný dohromady.

Takže lexikálne modely sú postavené zoraďovať akustických modelov, jazyk je model postavený zoraďovať slovo modelov, a to všetko dostane zostavené do jedného obrovského reprezentácie hovorenej angličtine, povedzme, a že sa stane model, ktorý dostane sa naučil z dát, a že uznáva alebo hľadanie, keď niektorí akustika prísť a je potrebné zistiť, čo je môj najlepší odhad na to, čo práve povedal.
Ako sa vám brať do úvahy akcenty a dialekty pri navrhovaní pre rozpoznávanie reči ?

Jednou zo základných vecí, s ohľadom na druh prístupu riadené dátami, ktorej berieme, je snažíme sa mať veľmi veľké, široké sady školení. Máme veľké množstvo dát prichádzajúci zo všetkých druhov ľudí so všetkými druhmi akcentov povediac: všetky druhy vecí, a tak ďalej a tak ďalej, a najdôležitejšia vec je mať dobré pokrytie vo vašej tréningovej sady, čo sa blíži , vo Máme dostatok inštancie Brooklyn akcenty - a nie len vďaka mne - ale máme ľudí z Brooklynu, ktorý hovoril s našimi systémami, ako že robíme dobrú prácu, keď sa ľudia s Brooklyn akcentmi hovoriť do nášho systému

Na druhú stranu, ak niekto prišiel a mal veľmi zvláštne a neobvyklé spôsoby, ako vyslovovať veci, ktoré nebolo dobre zahrnuté v našich dát, budeme mať väčšie ťažkosti ich rozpoznávania.

Niekedy výslovnosťou sú dosť radikálne odlišné, povedzme, že v britskej angličtiny proti americkej angličtine, môžeme vybudovať samostatný model, alebo čiastočne zmiešané model, alebo čokoľvek iného. To je akýsi oblasti výskumu. Kedy by sme mali stavať samostatné modely oproti spojiť všetko do jedného veľkého modelu, alebo akéhokoľvek kompromisu medzi tým? To variácia je jedným z najväčších výziev, jeden z množstva veľkých problémov v oblasti, ktorá sťažuje. Mať dobrý tréning sady je jedným zo spôsobov, ktoré riešime s tým, keď

Page [1] [2] [3] [4] [5] [6] [7] [8]