Tömörítés
Tömörítés I. Fogalma: A tömörítés egy olyan eljárás, amelynek segítségével egy fájlból egy kisebb fájl állítható elő.
Történeti áttekintés A tömörítés igénye nem elsődlegesen a számítógépek adattárolása miatt merült fel, hanem a számítógép hálózatok megjelenése volt az, ami arra sarkalta a kutatókat, hogy a rendelkezésre álló átviteli közegen, egységnyi idő alatt minél több hasznos információt vigyenek át. Akkoriban fontos dolog volt ez, mivel az átviteli közegek lassúak voltak és két gép kommunikációjában bizony ez volt a szűk keresztmetszet.
A matematikusok azonban csakhamar előálltak olyan algoritmusokkal, amelyek segítségével az adatokat tömörítették és a kevesebb byte-ot nyilván hamarabb el is tudták küldeni. Voltak gazdaságossági vonatkozásai is, hiszen voltak, vannak olyan vonalak, amelyekért a felhasznált idő után kell fizetni. Ilyen vonalak használatánál az átviteli költségeket jelentősen lehet csökkenteni tömörítés segítségével.
Típusai Alapvetően kétféle adattömörítési megoldás létezik: Ha a tömörített fájlból teljes mértékben visszanyerhető az eredeti fájl (``bitről bitre''), akkor veszteségmentes. Az adatok mérete csökken amellett, hogy annak minősége bármilyen módon változna; adatvesztés nem következik be. Az eljárások között azok jobbak, melyek nagyobb tömörítést érnek el. A veszteségmentesen elérhető méretcsökkenés jelentősen kisebb, mint a veszteségesen elérhető, tipikus mértéke 15% 50%.
A tömörített adatból később egy fordított eljárással pontosan visszanyerhető az eredeti adat. Az olyan adatoknál, mint a szöveges dokumentumok követelmény a veszteségmentes tömörítés, hiszen akár egyetlen bit változás is megváltoztathatja a szöveg jelentését. Általánosan alkalmazható, minden fájltípusra. Pl.: ARJ, ZIP, RAR
Második típus Ha a tömörített fájlból nem teljes mértékben visszanyerhető az eredeti fájl, akkor veszteséges tömörítésről beszélünk. Csak akkor alkalmazható, ha kis eltérések nem számítanak, pl. kép- és hangfájlok esetén (pl.:.bmp - >.jpg, wav - > mp3). Ilyen esetekben csekély, a felhasználó számára nem észrevehető veszteség megengedhető. Ezen gyakorta jelentkező esetek a tömörítés hatásosságára széles választékot kínálnak a felhasználónak, attól függően, hogy inkább kevéssé tömörített jó minőségű vagy jobban tömörített, de nagyobb veszteséget hagyó tömörítési eljárást kíván alkalmazni.
A képek vagy hangok tömörítésénél egyúttal az emberi érzékszervek érzékenysége határozhatja meg az adattömörítés módját, hisz megengedhető olyan veszteség, amely számunkra nem észrevehető változást okoz csupán. A veszteséges tömörítési eljárások általában hatékonyabbak, (kisebb méretű fájlt állítanak elő), de nem minden esetben alkalmazhatóak-egy futtatható programot akár egy bitnyi eltérés is használhatatlanná tenne. Pl.: JPG, JPEG(kép), MP3 (hang), MPG, MPEG (film)
Elve A tömörítések többek között a fájlban levő ismétlődéseket használják ki. Azok a fájlok amelyek nem ennyire ``rendezettek'', kevésbé tömöríthetőek. Például jól tömöríthető egy szövegfájl, de egy tömörített fájl pedig szinte egyáltalán nem tömöríthető tovább.
Példa nem veszteséges Eredeti adatsor: 3,7,8,8,8,8,8,9,3,5,6,6,6,6,8 Tömörített: 3,7,0,5,8,9,3,5,0,4,6,8 a 0-t az ismétlés előjelzésére használjuk (feltételezve, hogy az eredeti állományban nem volt) veszteséges Eredeti adatsor: 3,7,8,8,8,8,8,9,3,5,6,6,6,6,8 Tömörített: 3,0,7,8,3,0,5,6,8 a 0-t az ismétlés előjelzésére használjuk (feltételezve, hogy az eredeti állományban nem volt), a 7-est, 9-est 8- sal, az 5-öst 6-sal helyettesítve.
Műveletek 1.Becsomagolás: Az archív állomány létrehozása az eredeti megtartása mellett.. 2.Kicsomagolás: Az archív (becsomagolt) állomány visszaállítása eredeti állapotába.
Hangtömörítés: A hangtömörítési eljárások nagy része veszteséges tömörítés, vagyis a tömörítés folyamán információ vész el: a cél az, hogy ez az információvesztés ne okozzon hallható minőségromlást, illetve a minőségromlás minél kisebb legyen. Az, hogy ezt a célt mennyire sikerül elérni (vagyis hogy egy adott mértékű tömörítés esetén mekkora a minőségromlás) határozza meg az eljárás sikerességét, jóságát. (Szigorúan véve ezen eljárások nem adattömörítések, hanem lényegtelen adatokat mellőző kódolások, mivel adatvesztést okoznak.)
A módszer lényege az úgynevezett pszichoakusztika, vagyis hogy az emberi fül nem minden létező hangot hall meg, illetve nem minden hangmagasságra egyformán érzékeny. Az eljárások megpróbálják a kevéssé hallott, vagy nem hallható részeket elhagyni, vagy beolvasztani a jobban hallható részekbe úgy, hogy ezzel adatcsökkenést tudjanak elérni. Pl. MP3, WMA
Képtömörítés A képtömörítési eljárások egy része is veszteséges tömörítés. Többnyire olyan információkat hagynak el a képből, amelyek nélkül az emberi szem, az eredetivel csaknem azonos (megkülönböztethetetlen) jelként fog fel. Ezekre az algoritmusokra jellemző, hogy minőségromlás nélkül képesek az eredeti anyagot akár tized, vagy kisebb részére is tömöríteni. Pl.: JPG, JPEG
Mozgókép tömörítés A mozgókép-tömörítési eljárások fő célja, hogy a nagyon nagy méretű video anyagok méretét csökkentse, és így gazdaságosabbá tegye tárolásukat, illetve lehetővé tegye azok tárolását korlátozott kapacitású médiákon (mint amilyen a CD és a DVD). Szinte mindegyik veszteséges tömörítés. Az eljárások alapelve a legtöbb esetben az, hogy a mozgókép egymást követő álló képkockákból áll, és ezek gyakran csak kevéssé térnek el az őket megelőző, őket követő képkockáktól; ha csak a változást tároljuk le, akkor a szükséges adatmennyiség nagyságrendekkel csökkenthető.
Az eljárások abban különböznek, hogy milyen módon igyekeznek megtalálni ezen hasonlóságokat és eltéréseket; milyen módon határozzák meg azt, hogy az eredeti képet, vagy pedig az előzőektől való különbséget használják. Pl.: MPEG-1 MPEG-2 (VCD, SVCD, DVD) MPEG-3 MPEG-4: DivX
Vége