12. Képtömörítés. Kató Zoltán. Képfeldolgozás és Számítógépes Grafika tanszék SZTE (

Hasonló dokumentumok
H=0 H=1. Legyen m pozitív egészre {a 1, a 2,, a m } különböző üzenetek halmaza. Ha az a i üzenetet k i -szer fordul elő az adásban,

Informatikai Rendszerek Alapjai

Az Informatika Elméleti Alapjai

Nagy Gábor compalg.inf.elte.hu/ nagy

Nagy Gábor compalg.inf.elte.hu/ nagy

Az Informatika Elméleti Alapjai

Informatikai eszközök fizikai alapjai. Romanenko Alekszej

Diszkrét matematika 2.C szakirány

MPEG-1 MPEG-2.

Fraktál alapú képtömörítés p. 1/26

Multimédia alapú fejlesztéseknél gyakran használt veszteséges képtömörítő eljárások pszichovizuális összehasonlítása

Tömörítés, csomagolás, kicsomagolás. Letöltve: lenartpeter.uw.hu

VIDEOTECHNIKA A videotömörítés alapjai

Digitális képek. Zaj és tömörítés

Új kódolási eljárás, a szabvány július óta elérhető

Informatikai Rendszerek Alapjai

KÓDOLÁSTECHNIKA PZH december 18.

Súlyozott automaták alkalmazása

Compressed Sensing. Sipos Roland Adatbányászat szeminárium Május 22.

VIDEOTECHNIKA. Előadásvázlat. Mócsai Tamás BME Hálózati Rendszerek és Szolgáltatások Tanszék szeptember

Nagy Gábor compalg.inf.elte.hu/ nagy

VIDEOTECHNIKA. Előadásvázlat. Mócsai Tamás BME Hálózati Rendszerek és Szolgáltatások Tanszék szeptember

Tömörítés, kép ábrázolás A tömörítés célja: hogy információt kisebb helyen lehessen tárolni (ill. gyorsabban lehessen kommunikációs csatornán átvinni

Informatikai eszközök fizikai alapjai Lovász Béla

A MULTIMÉDIA TECHNOLÓGIÁK

A MULTIMÉDIA TECHNOLÓGIÁK ALAPJAI Előadásvázlat. BME Hálózati Rendszerek és Szolgáltatások Tanszék 2015.

Zárthelyi dolgozat feladatainak megoldása õsz

Jel, adat, információ

Az Informatika Elméleti Alapjai

Tömörítés, kép ábrázolás

3.5. Videotömörítési algoritmusok

Színes képek feldolgozása

A digitális földfelszíni mûsorszórás forráskódolási és csatornakódolási eljárásai

Híradástechikai jelfeldolgozás

Veszteséges képtömörítő eljárások pszichovizuális összehasonlítása

Tömören a tartalomról Transzkódolási eljárások HFC szemmel

Kiegészítések a segédlethez

2. Pont operációk. Kató Zoltán. Képfeldolgozás és Számítógépes Grafika tanszék SZTE (

Így működik a H.264 kódolás

Tömörítés. I. Fogalma: A tömörítés egy olyan eljárás, amelynek segítségével egy fájlból egy kisebb fájl állítható elő.

Mohó algoritmusok. Példa:

A továbbiakban Y = {0, 1}, azaz minden szóhoz egy bináris sorozatot rendelünk

13. Egy x és egy y hosszúságú sorozat konvolúciójának hossza a. x-y-1 b. x-y c. x+y d. x+y+1 e. egyik sem

Shannon és Huffman kód konstrukció tetszőleges. véges test felett

MUNKAANYAG. Érdi Péter. Információ technikai megoldások (tömörítések, stb.) A követelménymodul megnevezése: Távközlési szaktevékenységek

Adatrejtés videóban. BME - TMIT VITMA378 - Médiabiztonság feher.gabor@tmit.bme.hu

INTERNETES MÉDIA-KOMMUNIKÁCIÓ

Számítógépes Grafika SZIE YMÉK

dolás, felbontható kód Prefix kód Blokk kódk Kódfa

Digitális jelfeldolgozás

INTERNETES MÉDIA-KOMMUNIKÁCIÓ

Digitális videorendszerek

Hibadetektáló és javító kódolások

Pesti Kálmán: A H.264 eszközkészlete és előnyei a korábbi videó tömörítési eljárásokkal szemben DIPLOMAMUNKA. Pesti Kálmán.

Állókép és videó kódolások

Hibajavító kódolás (előadásvázlat, november 14.) Maróti Miklós

Multimédia technológiák alapjai gyakorlat I-II.

Jel, adat, információ

VIDEOTECHNIKA Az MPEG szabványcsalád

Digitális videorendszerek

Alapfogalmak a Diszkrét matematika II. tárgyból

Analóg digitális átalakítók ELEKTRONIKA_2

A hangtömörítés és az audiokodekek

JPeG fájlformátum: Négy legfontosabb szabványuk: Közös név. ISO/EIC besorolás. ITU Ajánlás. Formális cím JPEG ISO/IEC ITU-T T.

Diszkrét matematika 2.C szakirány

Megoldás Digitális technika I. (vimia102) 4. gyakorlat: Sorrendi hálózatok alapjai, állapot gráf, állapottábla

IP ALAPÚ KOMMUNIKÁCIÓ AZ ELEKTRONIKUS VAGYONVÉDELMI RENDSZEREKBEN IP-BASED COMMUNICATION IN ELECTRONIC SECURITY SYSTEMS. Bevezetés

Az Informatika Elméleti Alapjai

3. Szűrés képtérben. Kató Zoltán. Képfeldolgozás és Számítógépes Grafika tanszék SZTE (

NEURONHÁLÓS HANGTÖMÖRÍTÉS. Áfra Attila Tamás

TANTÁRGYPROGRAM. Az oktatásért felelős tanszék: Távközlési Tanszék Tantárgy ekvivalencia:

Számítógépes hálózatok

Bevezetés az informatikába Tételsor és minta zárthelyi dolgozat 2014/2015 I. félév

Nagy Gábor compalg.inf.elte.hu/ nagy

2.8. Képtárolási módok

Az adatkezelés eszközei

Kommunikációs hálózatok 2 Analóg és digitális beszédátvitel

2. Fejezet : Számrendszerek

Az Informatika Elméleti Alapjai

Informatikai alapismeretek

h í r e k A digitális televízió és az MPEG-2

Informatika Rendszerek Alapjai

Wavelet transzformáció

Bevezetés az informatikába gyakorló feladatok Utoljára módosítva:

Kvantumcsatorna tulajdonságai

Beszédinformációs rendszerek 5. gyakorlat Mintavételezés, kvantálás, beszédkódolás. Csapó Tamás Gábor

A videojel bitsebesség csökkentési eljárásai

Mérés és adatgyűjtés

Kódoláselméleti alapfogalmak

Elektronika Előadás. Digitális-analóg és analóg-digitális átalakítók

(11) Lajstromszám: E (13) T2 EURÓPAI SZABADALOM SZÖVEGÉNEK FORDÍTÁSA

4. Szűrés frekvenciatérben

16. Tétel. Hangkártya szabványok. Hangállományok tömörítése, szabványok, kódolási módszerek Az MPEG Audio. Egyéb állományformátumok (PCM, WMA, OGG).

MISKOLCI EGYETEM GÉPÉSZMÉRNÖKI ÉS INFORMATIKAI KAR

Számítógépes Hálózatok 2008

Szignálok, Adatok, Információ. Számítógépes Hálózatok Unicast, Multicast, Broadcast. Hálózatok mérete

Bevezetés. Kató Zoltán. Képfeldolgozás és Számítógépes Grafika tanszék SZTE (

Mintavételezés és AD átalakítók

5. A gráf, mint adatstruktúra Gráfelméleti bevezető

GIGászok harca. Határokon túl, avagy stream manipuláció és feldolgozás Gbps adatsebesség felett. Tamás Gergely Péter. HFC Technics

Átírás:

12. Képtömörítés Kató Zoltán Képfeldolgozás és Számítógépes Grafika tanszék SZTE (http://www.inf.u-szeged.hu/~kato/teaching/)

2 Miért van szükség tömörítésre? A rendelkezésre álló adattárolási és továbbítási kapacitás véges Pl. a tömörítetlen videó bitrátája 1Gbps! Mi teszi lehetővé a tömörítést? A természetes képeknek struktúrája van szomszédos pixelek hasonlóak Egy videó szomszédos frame-einek tartalma nagyjából azonos Kép / videó tömörítés: a reprezentációhoz szükséges bitek számát csökkentjük Veszteségmentes: az eredeti kép pontosan visszaállítható Veszteséges: az eredeti kép nem állítható vissza, de vizuálisan nem érzékelünk különbséget. Képelemzéshez általában nem használható!

3 Információ és adat REDUNDÁNS ADAT INFORMÁCIÓ Adat = Információ + Rdundáns adat

4 Bitek számának triviális csökkentése Compression Ratio = 10LOG Channel Bit Rate N Q F N = pixelek száma Csökkenti a felbontást mintavételezési hibák Q = bitek száma pixelenként (kvantálástól függ) Artifaktumok (hamis élek) F = frame ráta (videó esetén) Elmosódás A képminőség megtartása így nem lehetséges

5 Információelméleti megközelítés szimbólumok, forrás-abc: a, a, 1 2..., a J előfordulási valószínűségek: S ( P( a1 ), P( a2),..., P( a J ) ) entrópia (bit/szimbólum): H( S) J j1 P( a j ) log P( a 2 j )

6 Shannon-féle kódolási tétel Legyen S egy H(S) entrópiájú információforrás. Ekkor H( S) m( S), ahol m(s) a minimális átlagos kódhossz S veszteségmentes kódolására (vagyis H(S) a veszteségmentes kódoláshoz szükséges átlagos bitszám alsó korlátja).

7 Huffman kódolás A Huffman kódolás egy optimális változó hosszúságú kódot szolgáltat. (TIFF és JPEG is használja.) A kódolás egy élcímkézett bináris kódfát épít fel mohó (greedy) stratégiával egy minimumos prioritási sor segítségével. J szimbólum esetén az eljárás (J-1)-lépéses: egy lépésben a 2 legkisebb valószínűségű elemet (szimbólumot vagy részfát) kiveszünk a sorból és a belőlük alkotott új részfát visszahelyezzük a sorba (a 2 elem valószínűségösszegével).

8 Huffman kódolás szimbólum A 12 B 2 C 7 D 52 E 14 F 13 előfordulás gyakorisága (%) =100% minimumos prioritási sor B 2 C 7 A 12 F 13 E 14 D 52

9 Huffman kódolás B 2 C 7 A 12 F 13 E 14 D 52 2+7=9 B C Fa1 Fa1 9 A 12 F 13 E 14 D 52

10 Huffman kódolás Fa1 9 A 12 F 13 E 14 D 52 B 9+12=21 9 A C F 13 E 14 Fa2 21 D 52 Fa2

11 Huffman kódolás F 13 E 14 13+14=27 Fa2 21 D 52 F E Fa3 Fa2 21 Fa3 27 D 52

12 Huffman kódolás 21+27=48 Fa2 21 Fa3 27 D 52 21 27 Fa4 48 D 52 9 A F E B C Fa4

13 Huffman kódolás 48+52=100 Fa4 48 D 52 48 D Fa5 100 21 27 9 A F E B C Fa5

14 Huffman kódolás 0 100 1 0 48 D 0 1 21 27 1 0 1 Élcímkézés: 0: balra, 1: jobbra 9 A 0 1 F E B C

15 Huffman kódolás szimbólum kód A 001 B 0000 C 0001 D 1 E 011 F 010 B 0 21 9 A 0 1 C 0 0 48 D 27 1 0 1 F 100 A változó hosszúságú prefixmentes kódot a gyökértől a levélig vezető út élcímkéinek konkatenáltja adja. 1 1 E

16 Huffman kódolás szimbólum kód A 001 B 0000 C 0001 D 1 E 011 F 010 kódolt üzenet: 10100000100110110001 dekódolás: 10100000100110110001 D F B D A D E C az eredeti üzenet: DFBDADEC A változó hosszúságú kód egyértelmű dekódolhatósága a prefix-mentességnek köszönhető.

17 JPEG formátum/szabvány A JPEG (Joint Photographerts Experts Group) az ISO és az CCITT szabványügyi szervezetek által létrehozott munkacsoport. A JPEG egy veszteséges transzformáció kódolás DCT-vel kvantálótáblákkal és az együtthatók (és a 0 lefutások) Huffman kódolásával.

18 JPEG kódolás a kódolandó kép felbontása 8x8-as részképekre, és a blokkok kódolása (egymástól függetlenül): 1. eltolás: a képpont-értékekből levonunk 2 m-1 -et (ha az intenzitástartomány [0,2 m -1]); 2. 2D DCT végrehajtása; 3. a kapott együtthatók kvantálása (a megkívánt tömörítési arányhoz konstruált tábla szerint); 4. a cikk-cakk minta szerint kiterített kvantált együtthatók speciális futamhossz és Huffman kódolása.

19 JPEG kódolás DPCM: Differential/Delta Pulse-Code Modulation RLC: Run-Length encoding

20 Példa JPEG kódolásra (1.) 8x8-as blokk eltolás (-128) eltolt blokk

(forward) transzformáció: inverz transzformáció: ahol: megegyeznek a bázisfüggvények, 2 1) (2 cos 2 1) (2 )cos ( ) ( ), ( ), (, 2 1) (2 cos 2 1) (2 )cos ( ) ( ), ( ), ( 1 0 1 0 1 0 1 0 n X n Y n x n y n Y y n X x Y X Y X C y x f n Y y n X x y x y x f Y X C. 1 1,2,..., 2 / 0 1/ ) ( ha, ha, n u n u n u Diszkrét koszinusz transzformáció (discrete-cosine transform, DCT) 21

22 DCT bázisképek n=4

23 DCT bázisképek 6 báziskép a 64-ből (n=8)

24 Blokkméret és a DCT kódolás eredeti kép részlete dekódolt képrészlet (n=2) dekódolt képrészlet (n=4) dekódolt képrészlet (n=8) (Mindhárom kódolás az együtthatók negyedét használta fel.)

25 Példa JPEG kódolásra (2.) eltolt blokk DCT együtthatók

26 Kvantálás X n1 k0 n1 l0 y kl B kl n1 k0 n1 l0 kl B kl Xˆ kl y kl kl y round T kl kl, ahol: T kl a kvantálótábla megfelelő pozícióján lévő nem-negatív egész (esetünkben c).

27 Példa JPEG kódolásra (3.) együtthatók kvantálás kvantált együtthatók kvantálótábla round(-415/16) = -26

28 1D futamhossz kódolás (RLC) Az 1950-es évektől javasolt technika a FAX-üzenetek kódolására. A képet soronként kódolja: egy sort a 0-k és 1-ek folytonos csoportjainak hossza jellemez. Feltételezi, hogy minden sor 0-k csoportjával indul (melynek hossza 0 is lehet). A kódolás önmagában is hatékony, de a kapott kód további tömörítése is általános

29 Példa JPEG kódolásra (4.) kvantált együtthatók 0 -lefutás 26, 3, 0, 3, 2, 6, 2, 4, 1, 4, 1, 1, 5, 1, 2, 1, 1, 1, 2, 0, 0, 0, 0, 0, 1, 1, 0,, 0 kvantált együtthatók a cikk-cakk bejárás szerint veszteségmentes entrópia kódolás (futamhossz + Huffman)

30 JPEG dekódolás a blokkok dekódolása (egymástól függetlenül): 1. a kvantált együtthatók dekódolása és 8x8-as elrendezésük a cikk-cakk minta szerint; 2. a kvantálás invertálása ; 3. 2D inverz DCT végrehajtása; 4. visszatolás : a képpont-értékekhez hozzáadunk 2 m-1 -et; a dekódolt kép összerakása a 8x8-as blokkokból.

31 A JPEG hibája eredeti blokk különbségkép dekódolt blokk

32 Példa JPEG tömörítésre eredeti, 262 KB 12:1, 22 KB 43:1, 6 KB eltérés az eredetitől

33 Színes képek JPEG tömörítése YUV,YIQ színtérben az intenzitás (Y) és kromatikus (UV illetve IQ) információ szeparált Az emberi látás kromatikus felbontása kisebb jobban tömöríthető

34 JPEG folyamat színes képekre Kódoló R G B Image Quantizer Quantization Table YVU color coordinate zigzag Differential Coding Chrominance Downsampling (4:2:2 or 4:2:0) Huffman Encoding Huffman Encoding 8 X 8 FDCT Bit-stream Dekódoló Bit-stream Dequantizer Quantization Table De-zigzag De-DC coding Huffman Decoding Huffman Decoding Chrominance Upsampling (4:2:2 or 4:2:0) 8 X 8 IDCT YVU color coordinate R G B Decoded Image

35 Blokkosodás JPEG képeken eredeti kép tömörített kép 79:1

36 JPEG 2000 Az újabb szabvány (ISO group Joint Photographic Experts Group, ISO/IEC 29 WG01) a DCT helyett wavelet transzformációt használ. A JPEG 2000 képeken általában nem érzékelhető a torzulás még 50:1 arányú tömörítés mellett sem.

37 Original

38 JPEG 27:1

39 JPEG2000 27:1

40 JPEG JPEG2000 eredeti kép tömörítési arány: 150:1 JPEG2000 JPEG

41 Mi az MPEG? "Motion Picture Expert Group", 1990-ben létrehozott szervezet az audio és video átvitel szabványosítására. Többféle szabvány. Pl. MPEG-1: VHS minőség CD-n (320 x 240 + CD audio @ 1.5 Mbits/sec). Video tömörítés a framek közötti temporális redundanciát használja ki: Temporális DPCM a redundancia kiszűrésére A mozgáskompenzált hiba kódolása: DCT+Huffman. Minőséget alapvetően befolyásolja a jó mozgásbecslés Predikció a mozgás trajektóriák mentén A jó minőségű kódolás számításigényes (dekódolás nem)

42 Mozgás kompenzált predikció First frame Second frame

43 MPEG-1 I frame Intra-coded frame P frame Inter-coded frame or Predicted frame

44 Felhasznált anyagok Palágyi Kálmán: Digitális Képfeldolgozás /pub/digitalis_kepfeldolgozas További források az egyes diákon megjelölve