Získavanie vedomostí
/ Knowledge Discovery >> Získavanie vedomostí >> zdravie >> lekárstvo >> moderná medicína >>

Ako Chrípkové trendy Google Works

a alebo zimnica

Google inžinieri používajú päť rokov historických veľkých dát - a máme na mysli veľké. Oni poklepal do svojej databázy 50 miliónov z najčastejšie používaných prefiltered vyhľadávacích dotazov na vytvorenie základnej línie všeobecného výskytu chrípky. Počiatočné algoritmus pre prediktívnu nástroj opierala iba o regionálnej vyhľadávanie dát dotazu sa chrípky (regionálne na základe IP adresy), vrátane zastrešujúcich tém, ako sú všeobecné príznaky chrípky, nachladnutia a antivírusových liekov.

Algoritmus porovnáva real -time vyhľadávací dotaz dáta - slovo alebo frázu, ktorú ste použili ako hľadaný termín, napríklad " bolesti hrdla " - Proti predvolenú pre stanovenie úrovne regionálne aktivity chrípky, v rozmedzí medzi piatimi klasifikáciou od minimálnej po intenzívne. Teoreticky, GFT by mohlo poskytnúť aktuálne-dňový hlásenia (takmer v reálnom čase) z chrípky a predpovedať vypuknutia pandémie týždne pred CDC zostavuje správu.

Podľa GFT vynálezcom, hoci, GFT je reporting v reálnom čase sa rozumie ktoré majú byť použité ako doplňujúce informácie na klinické a virologické údajov v tradičnej ostrahy (CDC a svojich sietí). Rýchla detekcia GFT je určený na pomoc pri včasné odhalenie nielen epidémiách chrípky, ale aj vírusové identifikáciu kmeňov a potenciál pre pandémiu
GFT :. Model aktualizácie, presnosť a Trap
Big dáta

Pred každým nový rok chrípková sezóna, model Google Flu Trends sa obnovuje s 45 otázok najužitočnejších chrípky súvisiace z obdobia pred rokom (tieto špeciálne vyhľadávacie termíny sú vybrané pomocou logistickej regresie, ale presné otázky a ako sú vážené proti ostatným sú držané prísne tajné).

Navyše, odhady posezónnu GFT sú hodnotené podľa tradičných správ o dohľade údaje použité CDC, aby videli, ako dobre dve stretnutia. Na schopnosti prediktívnu nástroj je presne odhadnúť, kedy tej tohtoročnej chrípková sezóna začína, kedy bude vrcholiť sezóna, a ako ťažké to bude založená, môže byť model aktualizovaný. Keď to prvýkrát začal v roku 2008, GFT mal priemernú koreláciu 97 percent s CDC údajov [zdroj: Ginsberg].

V septembri 2009, model pre USA verziu aplikácie Google Chrípkové trendy dostal svoje prvé aktualizáciu, aby zahŕňala vyhľadávanie dát dotaz z ohniska H1N1. To bolo preto, že modelka GFT je úplne podcenil H1N1 pandémie prasacej chrípky (ktorá sa stala v lete). A potom to pokračovalo minúť.

V priebehu chrípkovej sezóny 2011/2012, GFT precenil výskyt

Page [1] [2] [3] [4] [5]