Získavanie vedomostí
/ Knowledge Discovery >> Získavanie vedomostí >> technológie >> počítač >> počítačová bezpečnosť >>

Ako by mohol algoritmus mieste trollovia na internete?

užívateľským pripomienky hostované by Disqus pre dané lokality Breitbart.com, CNN.com a IGN.com, klenout sa nad 18 mesiacov od marca 2012 do augusta 2013. Údaje sa skladala z približne 1.750.000 užívateľov (takmer 49.000 z nich zakázala), 1.26 miliónov nite a 39 miliónov pracovných miest (takmer 838.000 z nich sa ruší a 1350000 z nich hlásené). Oni zúžil zakázané užívateľské dáta dole na približne 12.000 užívateľov, ktorí po marci 2012 sa pripojil k stránok, mal prinajmenšom päť miest a boli zakázané trvalo na niečo iné, než spam identifikátorov URL [Zdroj: Cheng].

Vedci získaných dát vrátane poštového obsahu, aktivít používateľov, reakcia Spoločenstva a moderátor podujatia. Oni nákupný správ užívateľov, ktorí boli nikdy zakázaných na správy užívateľov, ktorí boli trvalo zakázané, a pozrel sa na zmeny v správaní zakázaných užívateľov nad ich čas. Tím zistil, že pracovné miesta budúcich zakázaných trollov tendenciu mať nasledujúce vlastnosti:

  • chudobný pravopisu a gramatiky
  • Ďalšie vulgárne výrazy
  • viac negatívnych slov
  • menej zmierlivý alebo predbežný jazyk
  • nižšia pochopiteľnosť čítania na základe niekoľkých čitateľnosti testov (vrátane automatizované čitateľnosti Index), ktorý zhoršil k dobe zákazu
  • použitie rôznych žargónu a funkciu slová od členov non-zakázané komunity
  • viac odklonu od témy
  • oveľa väčší počet pracovných miest než pripomienkového priemerného používateľa
  • tendencia koncentrovať svoje odpovede v jednotlivých nití
  • tendencie provokovať ďalšie odpovede od ostatných
  • horšie správanie v priebehu času končiť na svojom pracovnom mieste v stále väčšej miere odstránené pred zákazom

    Na CNN.com, priemerný užívateľ inklinoval Pre pridanie asi 22 pracovných miest počas 18 mesiacov, zatiaľ čo budúce zakázané Užívatelia zaslali okolo 264 časov predtým, ako boli zakázané [zdroje: Cheng, Collins]. Obec bola tiež menej pravdepodobné, že tolerovať troll v priebehu času.

    Pomocou merateľné výsledky, vedci boli schopní vyvinúť algoritmus (súbor krokov, používané na vyriešenie problému, alebo vykonať úlohu), ktorý používa ako iba piatimi komentáre určiť, kto by bol zakázaný v budúcnosti s presnosťou 80 percent. S 10 miest, výsledky boli 82 percent presné, ale výkon kulminoval okolo 10 miest. Skoršie užívateľ posty boli lepšie pre predpovedanie, či by si zakázané neskôr. Tím dosiahol podobnú úroveň presnosti počas všetkých troch on-line

    Page [1] [2] [3]