Získavanie vedomostí
/ Knowledge Discovery >> Získavanie vedomostí >> technológie >> počítač >> počítačový softvér >>

Ako Kompresia súborov Works

val cez zvyšok Kennedyho prejavu, by bolo nájsť tieto slová a ďalšie mnohokrát viac časov. A, ako uvidíme v ďalšej časti, bolo by to aj prepisovanie slovník, aby čo najviac efektívnu organizáciu je to možné.
Vyhľadávanie Patterns

V našom predchádzajúcom príklade sme si vybral všetky opakovať slová a dať tým, v slovníku. Pre nás, to je najviac zrejmý spôsob, ako napísať slovník. Ale kompresný program to vidí úplne inak: To nemá žiadnu predstavu o jednotlivých slov - vyzerá to len pre vzory. A aby sa čo najviac zmenšiť veľkosť súboru, je starostlivo vyberá, ktoré vzory majú byť zahrnuté do slovníka.

Ak sa blížime k frázu z tohto pohľadu, skončíme s úplne iným slovníka.

V prípade, že kompresný program naskenovaný Kennedyho frázu, prvé redundancia, že by naraziť bude len pár listov dlho. V " opýtajte sa, čo vaše, " tam je opakovaná vzor listu " t " nasledovaný medzerou - v " nie je " a ". to, čo " Ak program kompresný napísal do slovníka, mohlo by to napísať " 1 " Zakaždým, keď " t " bol nasledovaný medzerou. Ale v tejto krátkej vety, tento vzor nenastane dosť, aby to stojí za to záznam, takže program by nakoniec ho prepísať

Ďalšia vec je program všimnúť, je ". Ou, " ktorý sa objaví v oboch " Vášho " a ". country " Ak by sa jednalo o dlhší dokument, písania tohto vzoru do slovníka môže ušetriť veľa miesta - " ou " je celkom obyčajná kombinácia v anglickom jazyku. Ale ako sa kompresný program prepracoval tejto vety by bolo rýchlo zistiť lepšou voľbou pre slovníkového hesla: Nielen, že je " ou " opakoval, ale celé slová " vaše " a " country " sú obaja opakoval, a oni sú vlastne opakuje spolu, ako frázy " vaša krajina &Quote .; V tomto prípade by program prepísať slovníka položku " ou " so vstupom na ". vašej krajine "

Termín quot; môžete urobiť pre " je tiež opakuje, jeden čas nasleduje " Vášho " a jeden čas nasleduje " tí, " dáva nám opakovaný vzor " môže urobiť pre vás &Quote .; To nám umožňuje napísať 15 znakov (vrátane medzier) s jedným číslom hodnotou, zatiaľ čo " vaša krajina " necháva len nám napíšte 13 znakov (vrátane medzier) s jedným číslom hodnotu, takže by program prepísať " svoju krajinu " Vstup len ako " r zemi, " a potom napísať samostatn

Page [1] [2] [3] [4] [5]