Získavanie vedomostí
/ Knowledge Discovery >> Získavanie vedomostí >> technológie >> počítač >> internet >> web design vývoj >>

Ako Google Knihy Works

é skenovacie zariadenie používa sklenenú dosku, ktorá úplne splošťuje každú stránku, zaistiť, že softvér OCR (optické rozpoznávanie znakov) je schopný identifikovať písmená a čísla vytlačená na stránkach digitalizované. Po naskenovaní, tieto znaky možno upravovať a prehľadávať s počítačom.

Ak chcete eliminovať potrebu sklenených platní a zníženie možnosti poškodenia kníh, ktoré chce zachovať, Google patentoval nový proces skenovania kníh. Pracovníci jednoducho položte knihu na otvorenej knihy skenera, pre ktorý ani sklenená doska, ani žiadne iné zariadenie, ktoré by vyrovnajte knihu. Pokročilý softvér Google skenuje knihy a účty pre zakrivenie stránok, čo znamená, že to nie je degradácii rozpoznávania znakov. Tieto skenery pracujú rýchlosťou asi 1000 strán za hodinu.

Google vyvinul dohody s významnými knižnicami pre spustenie projektu. New York Public Library, rovnako ako univerzitné knižnice na Harvard, Michigan a Stanforde, všetci súhlasili, aby spoločnosť Google skenovať ich zväzkov. S pomocou týchto inštitúcií, Google už naskenované okolo 12 miliónov kníh [zdroj: von Lohmann].

rozpínavosti projektu znamená, že jeho najväčší prísľub je zabezpečenie prístupu ku knihám, že ľudia by sa inak nikdy vidieť. Študent na Floride môžu pristupovať špeciálne indiánske kolekciu na druhej strane krajiny. Ľudia, ktorí si nemôžu dovoliť cestovať do vidieť starovekej texty vo Francúzsku by mohol prechádzať tieto zväzky z ich obývacích izieb. A vďaka mimoriadne úsilie spoločnosti Google, zrakovo postihnuté osoby môžu prezerať knihy na zväčšených zobrazeniach používanie Braillovho písma zariadení, alebo počúvať dokumenty prostredníctvom čítania nahlas-technológií.

Najprv Knihy Google plánuje digitalizovať funguje len na verejnosti doména, ktorá tvorí asi 20 percent všetkých kníh [zdroj: Toobin]. V Spojených štátoch, knihy zadať verejnú doménu 70 rokov po smrti autora; ako public domain, už nie sú chránené autorskými právami.

Avšak, ako Google naskenované, to začalo digitalizáciu aj autorsky chránené texty. Spoločnosť nedal materiály chránené autorskými právami on-line v plnom rozsahu, namiesto obmedzovania obsahu on-line na asi 20 percent obsahu tejto knihy. Google vyhlasoval, že toto považovalo za použitia materiálov chránených autorskými právami.

Ostatné nesúhlasil. Autori Guild a Association of American Publishers podal skupinovej žaloby, podnecuje diskusie o Google Books v Spojených štátoch a po celom svete.
G

Page [1] [2] [3] [4] [5]