Získavanie vedomostí
/ Knowledge Discovery >> Získavanie vedomostí >> technológie >> počítač >> počítačový softvér >>

Ako Kompresia súborov Works

ý vchod pre " môže urobiť pre vás &Quote .; Program pokračuje týmto spôsobom, zdvihol všetky opakované bitov informácií, a potom sa vypočíta ktoré vzormi by mala zapísať do slovníka. Táto schopnosť prepísať slovníka je " adaptívne " Súčasťou LZ adaptívneho slovníka založené na algoritme. Spôsob, akým program vlastne robí to je celkom zložité, ako môžete vidieť na diskusiách o Data-Compression.com.

Bez ohľadu na to, aké konkrétne spôsob použijete, to in-hĺbkové vyhľadávanie systém umožňuje kompresiu súboru oveľa efektívnejšie, než by ste mohli jednoduchým výberom z slova. Používanie vzorov sme vyššie vybral, a pridanie " __ " pre priestory, sme prišli s touto väčšou slovníka:

  1. ask__
  2. what__
  3. ste
  4. r__country
  5. __ can__do__for__you

    A to menšie veta: " 1not__2345 __ - __ 12354 "

    Táto veta teraz zaberá 18 jednotiek pamäti, a náš slovník zaberá 41 jednotiek. Takže sme stlačený celkovej veľkosti súboru z 79 jednotiek 59 jednotiek! To je len jeden spôsob, ako stlačenie frázu, a nie nutne najúčinnejší jednej. (Uvidíme, či môžete nájsť lepší spôsob, ako!)

    Tak, ako dobrý je tento systém? Pomer file-redukčný, závisí od mnohých faktorov, vrátane typu súboru, veľkosť súboru a kompresný schéma.

    Vo väčšine jazyky sveta, niektoré písmená a slová sa často vyskytujú spoločne v rovnakom vzore. Vzhľadom k tejto vysokej miere redundancie, textové súbory, komprimovať veľmi dobre. Zníženie 50 percent alebo viac je typický pre dobrú veľkosti textového súboru. Väčšina programovacích jazykov sú tiež veľmi redundantné, pretože používajú relatívne malú zbierku príkazov, ktoré sú často ísť spolu v nastavenom vzoru. Súbory, ktoré obsahujú veľké množstvo jedinečné informácie, ako sú obrázky alebo súbory MP3, nemožno komprimovať veľa s týmto systémom, pretože nemajú opakovať veľa vzorov (viac o tom v ďalšej časti).

    Ak súbor má veľa opakovaných vzorov, sadzba zníženie spravidla zvyšuje s veľkosťou súboru. Môžete vidieť len pri pohľade na náš príklad - ak by sme mali viac Kennedyho prejavu, by mali mať možnosť odkazovať na vzory v našom slovníku častejšie, a tak získať viac zo súborového priestoru každej položky. Tiež viac všadeprítomné vzory mohli objaviť v dlhodobejšom práci, čo nám umožňuje vytvoriť efektívnejší slovník.

    Táto efektivita závisí tiež na konkrétnom algoritme programom kompresie. Niektoré programy sú obzvlášť vhodné pre vy

    Page [1] [2] [3] [4] [5]