Budeme sa zaoberať tým, ako súbor-compression systémy vysporiadať s redundanciou podrobnejšie v V ďalšej časti.
redundancie a algoritmy
Väčšina kompresné programy používajú variáciu LZ adaptívneho slovníka na báze algoritmu zmenšiť súbory. &Quot; LZ " odkazuje na Lempel Ziv, a tvorcovia algoritmu je, a " Slovník " sa vzťahuje k metóde katalogizovať kusov dát.
Systém pre úpravu slovníky sa líšia, ale mohlo by to byť tak jednoduché, ako číslovaného zoznamu. Keď sme sa prejsť Kennedyho slávna slová, vyberáme slová, ktoré sa opakujú, a dať ich do číslované indexu. Potom sme jednoducho napíšte číslo namiesto písania mimo celé slovo.
Takže, ak to je naša dictionary:
- ask
- what
- your
- country
- can
- for
- you
Our veta teraz znie: " 1 nie 2 3 4 5 6 7 augusta-1 02 8 5 6 7 3 4 "
Ak ste vedel, že systém, môžete ľahko rekonštruovať pôvodnú frázu len s použitím tohto slovníka a číslo vzor. To je to, čo expanzia Program na vašom počítači robí, keď to rozbalia stiahnutý súbor. Dalo by sa tiež stretol komprimované súbory, ktoré sa otvárajú seba nahor. Ak chcete vytvoriť tento druh súboru, programátor obsahuje jednoduchý rozširujúce program s komprimovaného súboru. To automaticky rekonštruuje pôvodný súbor, akonáhle je to stiahnuť.
Ale koľko miesta sme skutočnosti uložené s týmto systémom? &Quot; 1 nie je 2 3 4 5 6 7 8 - 1 2 8 5 6 7 3 4 ''; je určite kratšia ako " Nepýtaj sa, čo vaša krajina môže urobiť pre vás; opýtať sa, čo môžete urobiť pre svoju krajinu; " ale majte na pamäti, že musíme zachrániť slovník sám spolu so súborom
V skutočnom kompresné schéma, prísť na to, rôzne požiadavky na súbor by byť pomerne komplikované .; ale pre naše účely, vráťme sa k myšlienke, že každá postava a každý priestor zaberá jednu jednotku pamäte. Už sme videli, že plné frázy zaberá 79 jednotiek. Naše stlačený veta (vrátane medzier), zaberá 37 jednotiek, a slovník (slová a čísla), tiež zaberá 37 jednotiek. To nám dáva veľkosť súboru 74, takže sme sa znížila veľkosť súboru veľmi veľa.
Ale to je len jedna veta! Môžete si predstaviť, že v prípade, že kompresný program praco