Takže lexikálne modely sú postavené zoraďovať akustických modelov, jazyk je model postavený zoraďovať slovo modelov, a to všetko dostane zostavené do jedného obrovského reprezentácie hovorenej angličtine, povedzme, a že sa stane model, ktorý dostane sa naučil z dát, a že uznáva alebo hľadanie, keď niektorí akustika prísť a je potrebné zistiť, čo je môj najlepší odhad na to, čo práve povedal.
Ako sa vám brať do úvahy akcenty a dialekty pri navrhovaní pre rozpoznávanie reči ?
Jednou zo základných vecí, s ohľadom na druh prístupu riadené dátami, ktorej berieme, je snažíme sa mať veľmi veľké, široké sady školení. Máme veľké množstvo dát prichádzajúci zo všetkých druhov ľudí so všetkými druhmi akcentov povediac: všetky druhy vecí, a tak ďalej a tak ďalej, a najdôležitejšia vec je mať dobré pokrytie vo vašej tréningovej sady, čo sa blíži , vo Máme dostatok inštancie Brooklyn akcenty - a nie len vďaka mne - ale máme ľudí z Brooklynu, ktorý hovoril s našimi systémami, ako že robíme dobrú prácu, keď sa ľudia s Brooklyn akcentmi hovoriť do nášho systému Na druhú stranu, ak niekto prišiel a mal veľmi zvláštne a neobvyklé spôsoby, ako vyslovovať veci, ktoré nebolo dobre zahrnuté v našich dát, budeme mať väčšie ťažkosti ich rozpoznávania. Niekedy výslovnosťou sú dosť radikálne odlišné, povedzme, že v britskej angličtiny proti americkej angličtine, môžeme vybudovať samostatný model, alebo čiastočne zmiešané model, alebo čokoľvek iného. To je akýsi oblasti výskumu. Kedy by sme mali stavať samostatné modely oproti spojiť všetko do jedného veľkého modelu, alebo akéhokoľvek kompromisu medzi tým? To variácia je jedným z najväčších výziev, jeden z množstva veľkých problémov v oblasti, ktorá sťažuje. Mať dobrý tréning sady je jedným zo spôsobov, ktoré riešime s tým, keď