ELŐADÁS VÁZLATOK. Multimédia eszközök és szoftver II. Vezetőtanár: Csánky Lajos Dr. Nádasi András

Hasonló dokumentumok
A szem a fény hullámhossz szerinti összetételét a szem színérzet formájában érzékeli.

Hang, hangmagasság. Hangelfedés A hallásküszöb függ az egy időben hallott hangoktól. Ez a hangelfedés jelensége.

16. Tétel. Hangkártya szabványok. Hangállományok tömörítése, szabványok, kódolási módszerek Az MPEG Audio. Egyéb állományformátumok (PCM, WMA, OGG).

AKUSZTIKAI ALAPOK. HANG. ELEKTROAKUSZ- TIKAI ÁTALAKITÓK.

A digitális földfelszíni mûsorszórás forráskódolási és csatornakódolási eljárásai

Informatikai alapismeretek II.

A szerzői jogra vonatkozó általános jogszabályok Szoftverlicenszek Szerzői jogi kérdések az interneten Creative Commons

2.1. Jelátalakítás és kódolás

Multimédia eszközök és szoftver I. Vezetőtanár: Csánky Lajos Dr. Nádasi András

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

Adatrejtés videóban. BME - TMIT VITMA378 - Médiabiztonság feher.gabor@tmit.bme.hu

NEURONHÁLÓS HANGTÖMÖRÍTÉS. Áfra Attila Tamás

Elemek a kiadványban. Tervez grafika számítógépen. A képek feldolgozásának fejl dése ICC. Kép. Szöveg. Grafika

A valóság határait ostromoljuk

Multimédiás alkalmazások

A digitális képfeldolgozás alapjai. Készítette: Dr. Antal Péter

Kiegészítés a Párbeszédes Informatikai Rendszerek tantárgyhoz

Audio-video tartalom-előállítás 2. kis ZH tananyag (részlet) 2015/16 ősz

JVJ DVD-8808 Könyöklő DVD lejátszó Használati utasítás

Multimédia az oktatásban

Elektromágneses hullámok, a fény

Kiegészítő kártya digitális bemenetei és kimenetei G1: Koaxiális kimenet G2: Koaxiális bemenet G3: Optikai kimenet G4: Optikai bemenet

I 2 C, SPI, I 2 S, USB, PWM, UART, IrDA

4a 4b 4c. 8a 8b 8c 11. 9a 9b 9d 9e 9c

Színelméleti alapok: 10. Tétel

HANGTECHNIKUS SZAKKÉPESÍTÉS SZAKMAI ÉS VIZSGAKÖVETELMÉNYEI I. ORSZÁGOS KÉPZÉSI JEGYZÉKBEN SZEREPLŐ ADATOK

Távközlő hálózatok és szolgáltatások Távközlő rendszerek áttekintése

Tartalomjegyzék 4. Előszó. 1 Figyelmeztetés 2

Környezet. A. Fizikai környezet. A munkakörnyezet ergonómiai értékelése

(1) Sztereóerõsítõ. Kezelési útmutató XM-ZR Sony Corporation Printed in Czech Republic (EU)

1. Tétel. Multimédia alapfogalmai

11. Orthogonal Frequency Division Multiplexing ( OFDM)

Hangtechnikus Hangtechnikus Hangmester Hangtechnikus

Új távgépíró üzemmód, a PSK31

Nemlineáris és femtoszekundumos optika Szakmai záróbeszámoló OTKA K 47078

Élje át a hatást nagy képernyœn

3.5. Videotömörítési algoritmusok

Realtek HD Audio Manager Felhasználói útmutató a Vista operációs rendszerhez

Mérési útmutató. Széchenyi István Egyetem Távközlési Tanszék. QPSK moduláció jellemzőinek vizsgálata

vonalsugárzók a kiváló beszéd érthetőségért

Következõ: Lineáris rendszerek jellemzõi és vizsgálatuk. Jelfeldolgozás. Lineáris rendszerek jellemzõi és vizsgálatuk

Az 5-2. ábra két folyamatos jel (A és B) azonos gyakoriságú mintavételezését mutatja ábra

A tömörítési eljárás megkezdéséhez jelöljük ki a tömöríteni kívánt fájlokat vagy mappát.

Az analóg médiák: fénykép(analóg fényképezővel készített), analóg hangfelvétel, analóg videofelvétel.

A projekt eredetileg kért időtartama: 2002 február december 31. Az időtartam meghosszabbításra került december 31-ig.

1.4 fejezet. RGB színrendszerek

Mintavételezés: Kvantálás:

A MATLAB programozása. Féléves házifeladat. RGBdialog

A PC története. Informatika alapjai-9 Személyi számítógép (PC) 1/12. (Personal computer - From Wikipedia, the free encyclopedia)

Walk-DVR-CF. StP Műszaki Fejlesztő, Gyártó és Kereskedelmi Kft. StP Kft. ÁLTALÁNOS LEÍRÁS

1: Idõ(tartam), frekvencia (gyakoriság) mérés

1. Ismertesse az átviteltechnikai mérőadók szolgáltatásait!

MŰSORSZÓRÓ SZOLGÁLAT MŰSZAKI IRÁNYELVEI

Hangtechnikus Hangtechnikus Hangmester Hangtechnikus

T Ö R P E M O T O R O K

Jelalakvizsgálat oszcilloszkóppal

Elektromos zajcsökkentés vezetékelés és földelés szerepe. BME Fizika Tanszák Nanoszeminárium előadás Balogh Zoltán

NTSC, PAL és SECAM lefedettség

Számítógép perifériák I.

Irányítás és az alap csatlakozások

A szóbeli vizsgatevékenység sikertelen, ha a vizsgafeladat értékelése 50% alatt van.

Akuszto-optikai fénydiffrakció

Az Ön kézikönyve PANASONIC SL-CT820

SEAGUARD. Integrált Biztonság-felügyeleti Rendszer

Kódolás, hibajavítás. Tervezte és készítette Géczy LászlL. szló 2002

Conrad Szaküzlet, 1067 Budapest, VI. Teréz krt. 23. Tel: Rendelési szám:

Hauptwerk orgona (HW4.0 és 3.x verzió) online szoftveres visszhangosítása

Külső fül: Középfül: Belső fül:

FAUR KRISZTINA BEÁTA, SZAbÓ IMRE, GEOTECHNIkA

Smart Full HD LED TV. 2-oldalas Ambilight rendszerrel 42PFH6309/88

7. é v f o l y a m. Összesen: 54. Tematikai egység/ Fejlesztési cél. Órakeret. A testek, folyamatok mérhető tulajdonságai. 6 óra

TANTÁL KFT. NLPC Gold nyelvoktató berendezés. kezelési utasítás

5. Tisztítás Felületek tisztítása HT40 PRO belső szélzsák tisztítása...14

3. számú mérés Szélessávú transzformátor vizsgálata

Tartalomjegyzék. Tartalomjegyzék... v Elõszó... xi

Gáz- és olajvezetékek hírközlő rendszerének kábelei

= szinkronozó nyomatékkal egyenlő.

- Biztosítani kell, hogy amikor a terméket bekötjük a hálózati kábel nincs szétlapítva és sérülésmentes.

Optoelektronikai Kommunikáció. Az elektromágneses spektrum

Környezet. A munkakörnyezet ergonómiai. Területei: (Munkatevékenység) (Munkahely-elrendezés) (Használati eszközök) A. Fizikai környezetk

Összehasonlító elmozdulásmérés új lehetőségei a koherens optikai méréstechnikában

Felhasználói kézikönyv.

Az Ön kézikönyve PANASONIC DVD-S38

BESZERELÉSI ÉS HASZNÁLATI ÚTMUTATÓ. Fejtámlamonitor

I. EXPOZÍCIÓS PROGRAMOK FÉLAUTOMATA PROGRAMOK...

CityTab Supreme 10. Colorovo. táblagép. * modelltől függően elérhető funkció. CT Supreme 10 Win Manual KBD.indd

Hangkártya programozása

Kábel + scart rádiójel vezérlésű rendszer. Kezelési utasítás

Képszerkesztés elméleti feladatainak kérdései és válaszai

2. OPTIKA 2.1. Elmélet Geometriai optika

2,4GHz Vezeték nélküli csatlakozófejes AV jeltovábbító Használati útmutató (Használatba helyezés előtt kérjük olvassa el)

Elektronikus dobókocka

Veszteséges képtömörítő eljárások pszichovizuális összehasonlítása

Colin Hargis Elektromágneses összeférhetõség - útmutató erõsáramú mérnökök részére

Képfeldolgozási módszerek a geoinformatikában

A házi-mozi rendszerek beállítási problémáinak vizsgálata MATLAB program segítségével

A TWAIN adatforrás használata

Műszaki Kiadó kínálata a TIOP 1.1.1/07/1-es pályázathoz

Kanadai DOC közlemény Fontos biztonsági utasítások fejezet Üzembehelyezés A monitor kicsomagolása... 4

Digitális hangtechnika. Segédlet a Kommunikáció-akusztika tanulásához

Átírás:

126 ELŐADÁS VÁZLATOK Multimédia eszközök és szoftver II. Vezetőtanár: Csánky Lajos Dr. Nádasi András GDF MULTIMÉDIA VEZETŐTANÁR: CSÁNKY LAJOS és DR: NÁDASI ANDRÁS

128 Hang, hangmagasság A hang anyagi közegben terjedő mechanikai rezgés. A hangnak van frekvenciája, hangszíne, burkológörbéje, hangereje, terjedési sebessége. Az ember a különböző frekvenciájú hangokat különböző hangmagasságú hangoknak érzékeli. A hangok megoszlása a frekvenciák szerint: Elnevezés Infrahang Hallható hang Ultrahang Frekvencia - 16 Hz 16 20.000 Hz 20.000 Hz - GDF MULTIMÉDIA VEZETŐTANÁR: CSÁNKY LAJOS és DR: NÁDASI ANDRÁS

129 Hangszín, burkológörbe Ha a hang egyetlen frekvenciájú rezgést tartalmaz, akkor ezt a hangot tiszta hangnak nevezzük. Ez a magányos hang vagy a részhang. A természetes hangok több, különböző frekvenciájú és amplitúdójú részhangból állnak. A természetes hang részhangjainak összessége a frekvencia spektrum. A legmélyebb részhang a természetes hang alapfrekvenciája. A további részhangok frekvenciái általában kapcsolatban állnak az alaphang frekvenciájával, legtöbbször annak egészszámú többszörösei, ezek a felhangok. Összetételük, amplitúdójuk és fázisuk határozza meg a természetes hang hangszínét. Az alaphang és a felhangok frekvencia tartományon belüli viselkedését az eredő hangjel burkológörbéje szemlélteti.

130 Hangérzékelés A hallás a hangforrás által a levegőben keltett nyomásingadozások érzékelése. Az emberi hallás a frekvencia és hangnyomás függvényében korlátozott. Sok emberen végzett kísérletekkel meghatározták, hogy az ember a frekvencia függvényében milyen hangnyomás szintet képes még éppen meghallani. Ez a hallásküszöb. A hallásküszöb nyomás értéke frekvencia függő. Az ember hallásküszöbe függ az egy időben hallott hangoktól is. Egy zavaró hang megemeli a többi hang hallásküszöbét. Emiatt kell zajos környezetben meg kell emelni a hangerőt, ha azt akarjuk, hogy partnereink megértsék mondanivalónkat.

131 Hangelfedés A hallásküszöb értéke függ az egy időben hallott hangoktól. Ez a hangelfedés jelensége. A hangelfedést megvizsgálták tiszta szinuszos hangokra, keskenyés szélessávú zajokra, és azt találták, hogy a hallható hangok tartományában különböző frekvenciákon a hangelfedés mértéke a magasabb frekvenciákon erősebben jelentkezik. A hangelfedés jelenségét hasznosítják a digitális hangállományok tömörítésénél.

132 Hangerő A hangerő a hangrezgés amplitúdója, amit a hangnyomás fejez ki. Értékét akusztikus decibelben mérik. Az akusztikus decibel érték az ember hangérzékeléséhez alkalmazkodó, a hangerő nagyságának tízes alapú logaritmusának húszszorosával arányban lévő szám. A hallásküszöbnek a 0 decibel felel meg, a fájdalomküszöb értéke 120 decibel. Vegyük észre, hogy az emberi fül milliószoros (10 6 ) hangerő különbséget képes érzékelni. A hallásküszöb és a fájdalomküszöb hangnyomásának értéke frekvenciafüggő (Fletcher görbék).

Fletcher görbék 133

134 Hangok analóg rögzítése, lejátszása Hangrögzítés: (1) A hangjel hangnyomásának átalakítása elektromos jellé, melyben az elektromos jel frekvenciái és amplitúdói megfelelnek az eredeti hangjel frekvenciáinak és amplitúdóinak. (2) A elektromos jel analóg rögzítése. Lejátszás: (1) A rögzített jelek érzékelése, elektromos jellé alakítása. (2) Az elektromos jelek felerősítése, és hangszóróval hangnyomássá alakítása.

135 Digitális hangrögzítés A digitális hangrögzítés a hangok analóg rögzítéséhez hasonlóan történik, az egyetlen különbség a rögzítés módjában van. (1) A hangjel hangnyomásának átalakítása analóg elektromos jellé, melyben az elektromos jel frekvenciái és amplitúdói megfelelnek az eredeti hangjelnek. (2) Az analóg elektromos jel átalakítása digitális jelsorozattá mintavételezéssel és kvantálással. (3) A digitális jelsorozat rögzítése.

136 Mintavételezés Mintavételezéskor az időben és értékben folytonos analóg elektromos jeleket a mintavételezési frekvencia által megszabott ütemben diszkrét impulzussorozattá alakítják át. Az egyes impulzusok amplitúdója azonos az analógjelnek az adott pillanat szerinti értékével. Ez az impulzus sorozat a mintavételezett impulzussorozat. A mintavételezett impulzussorozat információtartalma bizonyos feltételek teljesülése esetén - megegyezik az eredeti analóg jel információtartalmával. A mintavételezett impulzussorozatból az eredeti analóg jelet akkor lehet torzítás nélkül visszaállítani, ha a mintavételezési frekvencia legalább kétszerese az eredeti analóg jelben előforduló legnagyobb frekvenciának (Shannon tétel).

137 Kvantálás Kvantálás: a mintavételezett impulzussorozat amplitúdó értékeinek bináris számokká történő átalakítása. Az amplitúdó értékek megadására meghatározott számú bit áll rendelkezésre. A rendelkezésre álló bitek száma a kvantálási hossz. A kvantálási hossz határozza meg, hogy a megkülönböztethető amplitúdó értékek számát. 8, 16, 20 vagy 24 bit kvantálási hosszal 256, 65.536, 1.048.576 vagy 16.777.216 amplitúdó értéket lehet megkülönböztetni. Minél több amplitúdó értéket lehet megkülönböztetni, annál pontosabban lehet visszajátszáskor visszaállítani a digitális jelsorozatból az eredeti analóg jelet.

138 A digitalizálás minősége A hanganyagok digitalizálását különböző mintavételezési frekvenciával és kvantálási hosszal lehet elvégezni. A digitalizált hangállományból az eredeti hangállományt mindig csak bizonyos hibával lehet visszaállítani. A hiba mértéke jellemzi a digitalizálás minőségét. A mintavételezési frekvencia értéke határozza meg, hogy a digitalizált hangállomány milyen frekvenciájú részhangokat tartalmaz az eredeti analóg hanganyagból. Ha a mintavételezési frekvencia értéke legalább kétszerese az eredeti hangjelben előforduló legnagyobb frekvenciának, akkor a visszaállított hanganyag hangfrekvenciák szempontjából hibamentes lesz.

139 Kvantálási hiba A kvantálás mindig okoz hibát, mert korlátozva van a digitális hangállományban a lehetséges amplitúdó értékek száma. Az analóg hangjel amplitúdója általában nem állítható vissza hibamentesen, mert mindig van különbség az eredeti amplitúdó érték és a rögzített amplitúdó érték között. A hiba abszolút értéke kisebb mint két kvantálási lépcső közötti érték. A kvantálási hiba a kvantálás hosszával csökken. A kvantálási hiba különösen kis amplitúdó értékek esetén jelentős nagyságú. 8, 16, 20 illetve 24 bit kvantálási hossznál az átfogható hangerő tartomány 1 : 256, 1 : 65.536, 1 : 1.048.576 illetve 1 : 16.777.216 értékű, ami megfelel 48,1, 96,3, 120,4 illetve 144,5 decibelnek.

140 A digitalizált hangállomány mérete Egy digitalizált hangállomány minden mintavételezési helyen a kvantálási hossz szerinti bitet tartalmazza. Ha 44,1 KHz mintavételezési frekvenciával és 16 bit (2 bájt) kvantálási hosszal digitalizálnak egy mono hangállományt, akkor a digitális hangfájl hossza másodpercenként 44.100 Hz 2 bájt = 88.200 bájt = 86,1 kbájt Több csatornás üzemmódban csatornánként történik a mintavételezés és a kvantálás. Sztereó üzemmódban a digitális hangállomány mérete a mono hangállomány méretének a duplája: Méret [bájt] = Mintavételezési frekvencia [Hz] Kvantálási hossz [bit] Játszási idő [sec] Csatornaszám 8

141 Hangkártya szabványok Az IBM nem foglalkozott a PC-k hangtechnikai szolgáltatásaival. Mivel nem volt IBM által elfogadott hangkártya, a szoftvercégek olyan hangkártyákat részesítettek előnyben, melyek bizonyos mértékig el voltak terjedve. Mivel ezen hangkártyák szoftverje gyorsan bővült, a hangkártya vásárlók a sok szoftverrel támogatott hangkártyákat szerezték be. Így jöttek létre de facto hangkártya szabványok: - AdLib szabvány: Bevezette az FM szintézist. Mono üzemmódban működő MIDI rendszert hozott létre. - SoundBlaster szabvány: Bevezette a mintavételezést és kvantálást a hangrögzítésben, kidolgozta a hullámtáblázat használatát. - Roland MT-32 szabvány: Bevezette a hangkártyán a hullámtáblázatot tartalmazó ROM tárat.

142 FM szintézis Az FM (Frequency Modulation) szintézis módszer speciális hangszínnel rendelkező zenei hangok előállítására. Először előállítanak egy tiszta szinuszos hangrezgést (vivőfrekvenciát), majd ezt egy vagy több lépcsőben modulálják. A vivőfrekvencia és a moduláció megfelelő beállításával különböző burkológörbéjű szintetikus hangok állíthatók elő. Ezek a hangok hasonlíthatnak a hangszerhangokhoz. Egy FM szintetizátorban több operátor található. Az egyik operátor egy másik operátor kimenőjelét modulálja. A frekvenciagenerátor kimenőjele több módosítás hasonlít a tervezett hangszer burkológörbéjéhez.

143 SoundBlaster kártyák A SoundBlaster szabvány a digitális hangtechnikát a CD technikából vette át, amivel lehetővé vált a PC-kben a hangok digitális felvétele, tárolása, szerkesztése és kezelése. A kártyákon 11,025, 22,05 és 44,1 khz-es mintavételezési frekvenciával 16 bites kvantálási hosszal dolgozó ADC található. Van még a SoundBlaster kártyákon Yamaha OPL3 szintetizátor, ami szintetikus hangokat hullámtáblázat segítségével állít elő.

144 Hullámtáblázat szintézis A szintetizátorok a szintetikus hangokat hullámtáblázatban tárolt hangmintákból készítik el. A hangminták valódi hangszerekből származó hangok digitális mintái. A hullámtáblázatot használó hangkártyáknál a szintetikus hangok minősége függ a hangminták minőségétől, a mintavételezési frekvenciától, a kvantálási hossztól, az egy hangszerhez tartozó minták számától. A SoundBlaster kártyákon 11,025, 22,05 vagy 44,1 KHz mintavételezési frekvenciát, illetve 8 vagy 16 bites kvantálási hosszt használnak.

145 Hullámtáblázat A hullámtáblázatban hangszerenként egy vagy több hangminta található. Több hangminta esetén a hullámtáblázat a hangszer különböző frekvenciájú hangmintáit tartalmazza. A különböző frekvenciájú szintetikus hangszerhangokat hullámtáblázatból kiolvasott a hang frekvenciájának módosításával állítják elő. Azért van egy hullámtáblázatban a hangszerekből több, különböző magasságú hang, hogy a szintetikus hang valósághű legyen. Egy tipikus hullámtáblázat 4 Mbájt méretű és 700 hangminta van benne.

146 A SoundBlaster kártyával átadott Audio - Wave Studio - Creative CD - Creative Midi - Creative Wave - Creative Remote - Creative Mixer - Soundo'LE PCI 128 program

147 Hangállomány tömörítés indokai A digitális hangállományok hosszú állományok. Tárolásukhoz sok hely, mozgatásukhoz és kezelésükhöz sok idő szükséges. Egy 16 bit kvantálási hosszal és 44,1 KHz mintavételezési frekvenciával felvett hangállomány hossza csatornánként és percenként: 44.100 Hz 16 bit 60 sec 8 = 5.292.000 bájt = 5.168 kbájt = 5,05 Mbájt Ha a környezeti hangtér megvalósításához 6 csatornát használnak, egy percnyi műsort tartalmazó hangállomány hossza 6 5,05 Mbájt = 30,3 Mbájt. A digitális hangállományok méretét tömörítéssel lehet csökkenteni. A tömörítési eljárások a hangelfedés jelenségét hasznosítják, a pszichoakusztikus redundanciát csökkentik kódoláskor.

148 Pszichoakusztikus tömörítés (1) A kódoló a hangjelek frekvencia elosztását elemzi, majd a hangelfedés jelenségét figyelembe véve törli az ember által nem hallott részeket a hangállományból. A kódolás ezért érzékelésen alapuló zajszűrés vagy érzékelésen alapuló részsáv-kódolás, a kódolás eredménye hangadat tömörítés. A kódoló egy szűrőbank segítségével sávokra bontja a hangadatok alkotóelemeit, és a sávokba eső alkotóelemeket elemzi. Ha egy sávban nincs hang, a kódoló a sávot nem kódolja. Ha a sávban van hang, és a hang elnyomja a zajt, a kódoló kódolja a sávot. Mivel kevesebb hangadat kerül kódolásra, csökken a kimenő állományban lévő adatmennyiség. Mivel a nem kódolt adatok többsége zaj, ezért csökken a kimenő állományban a zaj.

149 Pszichoakusztikus tömörítés (2) Az adatcsökkentés a kódolási és kvantálási fázisban valósul meg, amikor a kódoló szétosztja a rendelkezésre álló adatbiteket a szűrőbank kimenetén megjelenő hangsávok között. Kódolásnál a kódoló a bitfolyam bitjeit a sávokban található hanganyag dinamikus jellege szerint osztja szét a sávok között. Nagyobb hangerővel szóló hangok a sávokban több bitet kapnak, mint a kisebb intenzitással szólók. Mivel az elosztásra kerülő bitek száma a állandó, ezért ha egy sávban nagy intenzitású a hang, akkor ez a sáv sok bitet kap, míg a csendesebb sávok kevesebbet. Így a nagy intenzitású hang nemcsak az adott sávban fedi el a zajt, hanem az egész hallható hullámsávban csökkenti azt.

150 Pszichoakusztikus tömörítés (3) A pszichoakusztikus kódolású hangállomány a sávok számával megegyező számú hangcsatornát tartalmaz. Elvileg minden csatornában másodpercenként azonos számú bit található. Valójában a tömörített hangállományból sok sáv (csatorna) bitjei hiányoznak, ezért csökken a hangállomány mérete. Mivel a kódoló a másodpercenként meghatározott számú bitet oszt szét a sávok között, ezért a tömörítés és a másodpercenként továbbított bitek között szoros kapcsolat áll fenn. Mennél nagyobb a tömörítés annál kevesebb az egy másodperc alatt továbbított bitek száma (fordított arány). Mivel a bitsebesség egyszerűen mérhető paraméter, ezért a hangállományok tömörítésénél nem a tömörítést, hanem a bitsebességet használják.

151 Pszichoakusztikus dekódolás A dekódolás egyszerű művelet. A soksávos (sokcsatornás) a kódolt bitfolyamból digitális analóg átalakítóval visszaállíthatók a hangszóróban megszólaló hangok. Az eredeti és a dekódolt hangadatok formája ugyan különbözik egymástól, de a különbséget az ember nem vagy alig hallja, mert többnyire a hiányzó hangelemek a hangadatok lényegtelen, ember által nem hallható alkotóelemek. Kísérleti úton igazolták, hogy 12 tömörítés esetén is CD minőségű hangnak tekinthető a dekódolt hangadat.

152 Hangállomány tömörítési eljárások A tömörítésnél a kódoló a hangállományt tartalmát dinamikusan elemzi, és sávokra bontja. Az elemzés módja és a sávok száma a különféle tömörítési eljárásoknál különböző, ezért a tömörített hangállományból származó hang minőségileg eltérő lehet. Le kell azonban szögezni, hogy nagyon kevesen érzékelik ezt a különbséget. Az ismertetett tömörítési eljárások: - MPEG Audio - Dolby Digital AC-3 - MPEG2 Advanced Audio Coding (AAC)

153 MPEG Audio - Mintavételezési frekvencia: 32, 44,1, illetve 48 KHz - Kvantálási hossz: 8, 16, vagy 20 bit - Egy vagy két hangcsatornát kezel - Tömörítés: érzékelésen alapuló részsáv kódolás - Csatornánkénti bitsebesség: 32 kbit/sec 224 kbit/sec közötti érték, állítható - Három réteg (eljárás): - Layer 1: Egyszerű eljárás. Csatornánként 128 kbit/sec bitsebesség felett használható - Layer 2: Közepes bonyolultságú eljárás. Csatornánként 128 kbit/sec bitsebesség körül használható - Layer 3: Bonyolult eljárás. Csatornánként 64 kbit/sec bitsebesség körül használható (MP3)

154 Példa: Mekkora egy MP3 fájl tömörítése Mekkora tömörítéssel rendelkezik egy MP3 fájl, amit 64 kbit/sec sebességgel játszanak le. Az eredeti hangállomány sztereo hangállomány, amit 44,1 KHz mintavételezési frekvenciával és 16 bites kvantálási hosszal rögzítettek. A lejátszás hossza lényegtelen, mert a tömörítést 1 sec hossz segítségével is meg lehet állapítani. 1 sec hosszú eredeti hangállományban a bitek száma: 44.100 Hz 16 bit 2 [csatorna] = 1.411.200 bit = 1.378,1 kbit Mivel a tömörített MP3 hangállomány lejátszása 64 kbit/sec sebességgel történik, a kódoló olyan tömörítést valósít meg, ami 1 sec hosszú állomány bitjeinek számát 64 kbit értékre csökkenti. A tömörítés 1.378,1 kbit 64 kbit = 21,5 tömörítés

155 Környezeti hangtér A Dolby Laboratories a filmtechnika részére dolgozta ki az analóg Dolby Stereo hangrendszert. Ebben négy csatornában, öt (baloldali, középső, jobboldali, két környezeti) hangszóróval állítottak térhatású hangot. Az 5.1 csatornás Dolby Stereo Digital a Dolby Stereo digitális változata, melyben a két környezeti hangszórót két független csatorna vezérli, és megjelent benne a mélysugárzó (LFE: Low Frequency Effect) csatorna is. Az 5.1 csatorna kódolási szempontból 6 csatorna. A használt mintavételezési frekvenciák 32, 44,1 vagy 48 KHz, a kvantálási hosszak 8, 16 vagy 20 bit.

156 Példa: Dolby Digital hangfájl mérete Mekkora egy 1 perc hosszú, 5.1 csatornás Dolby Digital hangfájl mérete, ha a mintavételezési frekvencia 48 KHz, a kvantálási hossz 20 bit. 48.000 Hz 20 bit 6 [csatorna] 60 sec 8 = 43.200.000 bájt = 42.187,5 kbájt = 41,2 Mbájt Vegyük észre, hogy hatalmas a fájlméret. Emiatt kell a környezeti hangtér hangállományait tömöríteni.

157 Dolby Digital hangrendszer A Dolby Digital (AC-3) a DVD lemezek számára módosított Dolby Stereo Digital hangrendszer, melyben a hangállományt érzékelésen alapuló részsáv kódolási technika használatával tömörítik, hogy 1 5.1 hangcsatornán keresztül kissebességű adatátvitel váljon lehetővé. A Dolby Digital rendszerben a hangfelvételhez 6 mikrofont használnak, a 6 bemenő jelből állít elő a Dolby Digital kódoló egyetlen folytonos bitfolyamot. A bitfolyamot a Dolby Digital dekódoló szétbontja, és előállítja a hangszórók számára a vezérlést.

Dolby Digital rendszer vázlata 158

159 Dolby Digital csatornák A Dolby Digital rendszerben hat teljesen önálló digitális hangcsatorna van. Három csatornán jön a hang a hangtér baloldali, középső és jobboldali hangszóróihoz. A környezeti hangtér kialakítását két hátsó különálló hangszóró biztosítja. Ez az öt csatorna teljesen egyenrangú, mindegyik 20 Hz és 20.300 Hz között ± 0,5 db ingadozással viszi át a hangot. A hatodik csatorna, a 0,1 csatorna el is hagyható. Csak 20 Hz és 120 Hz között viszi át a hangot. Ez a mélysugárzó csatorna különböző alacsony frekvenciás hatások keltésére szolgál.

160 Lekeverés (Downmixing) A Dolby Digital dekókódoló 5.1 (6), 4, 2 és 1 hangszóró felé tudja szétosztani a 5.1 csatornás bitfolyamot. Ez nagyon előnyös multimédiarendszerek öszszeállításakor.

161 Dolby Digital kódolás A Dolby Digital rendszerben a mintavételezett hangadatokat AC-3 kódolási technikával tömörítik. Az AC-3 (Audio Coding number 3) érzékelésen alapuló digitális részsáv kódolási (zajcsökkentési és tömörítési) eljárás. A Dolby Digital kódoló a hallható hangtartományt az emberi hallás frekvencia érzékenységének megfelelően 32 különböző szélességű frekvenciasávra osztja. Az egyes sávokban lehetővé válik a zaj erőteljes kiszűrése.

162 Példa: Dolby Digital hangfájl tömörítés Egy 5.1 csatornás 48 KHz mintavételezési frekvenciával és 20 bit kvantálási hosszal rögzített hanganyag hossza percenként (6 48000 16 60) 8 = 43.200.00 bájt = 41,2 Mbájt Legyen a Dolby Digital bitfolyamban a bitsebesség 384 kbit/sec. Ez percenként 60 sec 384 kbit/sec : 8 = 2.880 kbájt = 2,81 Mbájt hanganyag továbbítást jelent. Az eredeti állomány és a tömörített állomány aránya: ami 14,7 -es tömörítést jelent. 41,2 : 2,81 = 14,7

163 MPEG2 Advanced Audio Coding (AAC) Az MPEG2 AAC kódolás a környezeti hangteret 5 hangszóróval valósítja meg. Az MP3 kódolás továbbfejlesztésének tekinthető. A kódolásnál a mintavételi frekvencia 8 KHz és 96 KHz között lehet, a kvantálás hossza 8 és 24 bit között van, míg a részsávok száma 1 és 48 között változhat. Az újítások az MP3-hoz képest: - módosított diszkrét koszinusz transzformációt használ a szűrőbank, - van ideiglenes zaj átalakítás (TNS: Temporary Noise Shaping), - van előrejelzés, - a kvantálási lépcsőfokok kisebbek, - csökkentették a kódolási redundanciát. MPEG2 AAC (1)

Szűrőbank: Az AAC kódoló a szűréshez módosított diszkrét koszinusz transzformációt használ. A módosított eljárás az MP3 eljárásnál jobb zajszűrést, ezáltal nagyobb tömörítést biztosít. Ideiglenes zaj alakítás (Temporaly Noise Shaping): Újítás az időfrekvencia kódolás területen. A kódoló a kvantálási zaj elosztását az időfüggvényében a frekvencia tartomány előrejelzés szerint alakítja ki. Ezzel különösen a beszéd válik érthetőbbé. Előrejelzés: A beszéd felismerés céljára kidolgozott módszer. Arra épít, hogy bizonyos hanganyagok esetében az előrejelzés egyszerű. Kvantálás: A nagyobb kvantálási hossz miatt a bitsebesség hatékonyabban használható fel. 164

165 MPEG2 AAC (2) Bitfolyam formátum: A kibocsátott digitális információ a minimális kódolási redundancia biztosítása érdekében entrópia kódoláson megy keresztül. Az MPEG2 AAC kódolás legjelentősebb alkalmazói a filmipar és a digitális TV. Az eljárás meglepően jó kódolási hatékonysága miatt valószínűleg elterjed az Interneten is, mert kis sávszélességet igényel. Az MPEG2 AAC eljárás kidolgozása után, megjelentek használatát lehetővé tevő alkalmazási szoftverek és hardver megoldások. Elterjedését segíti, hogy bármely bitsebességhez a nagyon jó hangminőséget biztosít.

166 MIDI (Musical Instrument Digital Interface) A MIDI digitális hangszercsatoló interfész, ami lehetővé teszi, hogy elektronikus hangszerek és a számítógép egymás között adatokat cseréljenek. A MIDI szabvány nem ismeri a beszédet. A MIDI állományok a zeneeszközökre (General MIDI), a hangok jellemzőire és lejátszására és a szintetizátor működésére vonatkozó utasításokat tartalmaznak. A MIDI állományok emiatt kisebbek kb. század akkorák mint a WAV fájlok.

167 General MIDI (1) A General MIDI szabvány a MIDI szabvány továbbfejlesztése, egységesíti a szintetizátorok által használt hullámtáblázatokban a zeneeszközök kiosztását, és kibővíti a MIDI szabványt néhány új utasítással. Az eredeti MIDI szabvány nem definiálta a hullámtáblázatban a hangszerek helyét, ezeket a MIDI szerzők határozták meg. Ezért minden lejátszásra kerülő MIDI állomány esetében illeszteni kellett a lejátszásra kerülő MIDI állomány hangszer kiosztását a saját rendszer (szintetizátor) hangszer kiosztásához. Ha ez nem történt meg, a MIDI állomány lejátszásakor megszólaló zeneeszközök fajtája véletlenszerűen alakult ki.

168 General MIDI (2) A General MIDI szabvány 128 hangszer helyét rögzíti a táblázatban, ezért ezzel a szabvánnyal kompatibilis MIDI állományok minden MIDI rendszerben azonnal lejátszhatók. A MIDI utasítások két vagy három bájtból állnak. A két bájtos utasítások a szintetizátor működését befolyásolják. A szintetizátorra vonatkozó parancsokkal meg lehet változtatni a szintetizátor működését (például le lehet állítani az összes csatornában futó programot), továbbá definiálni lehet egy-egy szintetizátor csatornában megszólaló hangszert.

169 General MIDI (3) A három bájtos utasítások a hangokra vonatkoznak. Első bájtjuk egy állapotbájt, melynek négy bitje definiál egy szintetizátor csatornát, négy bitje pedig egy parancsot. Egy MIDI állományban tehát 16 szintetizátor csatorna parancsai lehetnek. A MIDI utasítás második bájtja a hangjegyet, míg a harmadik bájt a lejátszás dinamikáját határozza meg. A General MIDI állomány tartalmazza a lejátszásra kerülő zeneszám lejátszásához szükséges összes információt, ezért játszható le azonnal.

170 Szintetizátorok A MIDI állományban levő utasításokat a hangkártyán levő szintetizátor vagy külső szintetizátor értelmezi és szólaltatja meg. A külső szintetizátort hangkártya MIDI csatlakozójába bedugaszolt MIDI kábellel kell a számítógéphez csatlakoztatni. A szintetizátorok bemeneti csatornáikon fogadnak utasításokat, mindegyik csatorna egy hangszert kezel. Az OPL3 (MPC 3 előírás) szintetizátornak 16 csatornája van, tehát 16 hangszer hangját képes megszólaltatni.

171 MIDI állományok készítése A MIDI állományok készítéséhez MIDI sorrendvezérlő programot kell használni. Ez a program teszi lehetővé a MIDI utasítások rögzítését, szerkesztését és visszajátszását. MIDI klaviatúra segítségével, a zeneszám lejátszásával állítható elő a MIDI állományt. A lejátszott zeneszámot a sorrendvezérlő feljegyzi és megjeleníti. A megjelenítés történhet kottában vagy egyszerűsített megjelenítési módban. Mivel a sorrendvezérlők számítógépes alkalmazások számos szolgáltatásuk van.

172 Sorrendvezérlő szolgáltatások 1. Csatornák megjelenítése: Mindegyik sorrendvezérlő képes megjeleníteni az egyes csatornák tartalmát. 2. Hangjegyek megjelenítése: Minden egyes csatorna hangjait meg lehet kotta formájában jeleníteni, így látható és szerkeszthető magasságuk, időtartamuk és egyéb paraméterük. 3. Hangjegyek átrendezése: Kottához értő felhasználók módosíthatják az egyes hangjegyeket a kotta alapján. A létrehozott módosítások azonnal meghallgathatók. 4. Lejátszási tempó beállítása: A sorrendvezérlőknél általában lehetőség nyílik a lejátszási sebesség központi módosítására. 5. Hangnem megváltoztatása: Meg lehet változtatni az egész MIDI állomány vagy egy részletének a hangnemét. 6. Hangszerek módosítása: módosíthatók a megszólaló hangszerek.

173 A fény, a színek, a fényerősség A fény 380 nm és 780 nm hullámhosszúság közötti elektromágneses sugárzás, amit a szem érzékel. A szem a fény hullámhossz szerinti összetételét színérzet formájában érzékeli. Az elektromágneses sugárzás intenzitását a szem fényerősség formájában érzékeli. A fényerősség növekedésekor a szem pupillája összehúzódik, emiatt a szem rendkívüli dinamikával rendelkezik. A szem mintegy 10 4 fényerősség változást tud érzékelni.

174 Az emberi látás (1) Az emberi látásnak számos korlátja van, erre alapozva valósul meg a képfájlok veszteséges tömörítése. Ezek közül néhány az alábbi: (1) Az emberi látás a fényerőváltozásokra érzékenyebb, mint a színváltozásokra. (2) A színfelbontás a színárnyalatok elkülönítési képességét adja meg. A színfelbontás szín és fényerősség függő. (3) A színérzékelés nem függ az intenzitástól.

175 Az emberi látás (2) (4) Az emberi látás időbeli felbontása azt fejezi ki, hogy mennyi ideig kell egy látványnak tartani, hogy azt az ember különálló látványnak érzékelje. Az 1/15 másodpercnél rövidebb ideig tartó képeket nem lehet egymástól elkülönítve érzékelni. Villogásmentes élmény viszont csak akkor keletkezik, ha a képváltások száma meghaladja a szem fúziós frekvenciáját, ami kb. 50 Hz (5) Az ember számára kellemes képek oldal arányai 4:3. Az oldal méretekre érvényes, hogy a rövidebbik oldal legyen 20 0 alatt látható. A fentiek alapján határozták meg a TV rendszereknél 600 sor körül a sorszámot, sugároznak TV rendszerek legalább 50 félképet, van a SVGA monitoroknál 800 600 képpontos felbontás, és a monitoroknál legalább 60 Hz képváltási frekvencia érték.

176 Színlátás Az ember a 380 és 780 nm közötti hullámhosszúságú fényeket a hullámhosszúság függvényében különböző színűnek. A 380 nm körüli hullámhosszúságú fény ibolyaszínű, míg a 780 nm körüli vörös színű. A látható fénytartományon belül az emberi látás nem egyenletes érzékenységű. Az azonos fényerejű, de eltérő színű fényeket az ember különböző fényerejűnek érzékeli. Az emberi szem a zöld színek tartományában a legérzékenyebb.

177 Metamer színű fények Az emberi szem két fényt nemcsak akkor lát azonos színűnek, ha a két fény spektrális összetevői megegyeznek, hanem bizonyos feltételek mellett eltérő spektrális összetevőjű fényeket is. Az azonos színűnek látott, de különböző spektrális összetevőjű fények a metamer színű fények. Az emberi szem fogyatékossága miatt majdnem az egész színtartományt be lehet mutatni három egyfrekvenciás (egyszínű) fényforrás segítségével a fényforrások színének keverésével és intenzitásának változtatásával. Ezért használnak a mai megjelenítő rendszerek (számítógép monitorok, TV képernyők, stb.) színes képek előállítására három egyfrekvenciás fényforrást, nevezetes egy vörös (R: Red), egy zöld (G: Green) és egy kék (B: Blue) fényforrást. A színes képeknél nem a valósághű (színhelyes) visszaadásra van szükség, hanem a valóságnak fehér fénnyel megvilágított képét kell bemutatni.

178 RGB szín-koordinátarendszer RGB alapszín-koordinátarendszer A műszaki életben leggyakrabban használt szín-koordinátarendszer, mert a színeknek a képernyőn történő megvalósításával kapcsolatos. A képernyőn minden színt az RGB alapszínek additív keverésével állítanak elő. A képernyőn a három alapszín úgy van értelmezve, hogy R + G + B = 1 ; fehér szín R + G + B = 0 ; fekete szín

179 YUV szín-koordinátarendszer Az emberi látáshoz illesztett szín-koordinátarendszer, ahol Y a világosságkód (luminancia), U és V a színkód (krominancia). A PAL, SECAM TV rendszerekben, és a képtömörítésben használják. Az Y, U és V értéket az RGB értékekből az alábbi egyenletekkel lehet meghatározni: Y = 0,3R + 0,59G + 0,11B U = (B-Y) 0,493 V = (R-Y) 0,877

180 Szín-koordinátarendszerek (3) További szín-koordinátarendszerek: - YIQ: Y a világosságkód, I, Q a színkód - CIE (XYZ): X a világosságkód, Y, Z a színkód - HSB: H a színezettség, S a telítettség, B a fénysűrűség Az egyes szín-koordinátarendszerek egymásba transzformálhatók. A transzformáció minden esetben kerekítési veszteséget okoz.

181 Példa: RGB YUV transzformáció Transzformáljuk az RGB (128, 128, 128) értékű színkoordinátát YUV színkoordinátarendszerbe. Az eredmények egészszámok lehetnek. Y = 0,3 R + 0,59 G + 0,11 B = 38,4 + 75,52 + 14,08 = 142,08 = 142 U = (B Y) 0,493 = (128 142) 0,493 = - 6,9 = - 7 V = (R Y) 0,877 = (128 142) 0,877 = - 12,3 = - 12 A törtrészek eltüntetése a kerekítési veszteség.

182 Grafikusfájlok a multimédiában A multimédiarendszerekben használt grafikusfájlok (1) Állóképeket (grafikákat), vagy (2) Mozgóképeket tartalmazhatnak. A grafikusfájlok a képernyőn bittérképes formában jelennek meg. Ebben a formában a színes kép minden képpontját 4 32 bit színinformáció írja le, ezért a képállományok nagyméretűek. A képállományokat a háttértárban tárolhatjuk - vektorgrafikus formában, vagy - bittérképes formában.

183 Vektorgrafikus formátum A vektorgrafikus fájl rajzoló (vektor) utasítások halmaza. A rajzoló utasítások leírják a geometriai alakzatok milyenségét (pont, vonal, ív, szöveg, stb.), helyét, méretét, irányítását, színét, stb. Megjelenítéskor a program értelmezi a rajzoló utasításokat, kialakítja a bittérképes ábrát, és felrajzolja azt a képernyőre. A vektorgrafika jellemzői: - kisméretű grafikusfájlok, - vonalas ábrák, - egyszerű műveletvégzés (nagyítás, kicsinyítés), - torzításmentes nagyítás, kicsinyítés - CAD, CAM, CNC a fő alkalmazási terület. - a megjelenítés időtartama tartalomfüggő. Bittérképes grafika

A bittérképes grafikusfájl a képpontok megjelenítésével kapcsolatos színinformációkat tartalmazó állomány. Megjelenítéskor a képernyő mindegyik pontja a pontról tárolt színinformációk szerint veszi fel színét és fényességet. A bittérképes grafika jellemzői: - nagyméretű grafikusfájlok, - foltszerű ábrák, - nehéz az ábrán a műveletvégzés, - kicsinyítéskor, nagyításkor van torzítás, - multimédia a fő alkalmazási terület. 184

185 A képek jellemzői 1. Mitől függ a képernyőn megjelenő kép mérete (miképpen látható a képernyőn?). 2. Mit jelent a képernyőn megjelenő kép színmélysége (mennyire élethű)?

186 Kép a képernyőn A képernyőn megjelenő kép méretét két paraméter határozza meg: (1) a kép vízszintes és függőleges mérete képpontban, (2) a képernyő felbontása. Ha a képméret és a képernyő felbontása nem azonos, akkor - a kép a képernyőnek csak egy részében jelenik meg, vagy - a kép egy része levágásra kerül.

187 320 240 képpontos kép a képernyőn 640 800 1024 Kép: 320 240 480 (25%) 600 (16%) 768 (9,8%) 1024 768 képpontos kép a képernyőn

188 640 800 1024 480 (39%) 600 (61%) 768, Kép: 1024 768 (100%)

189 Egy kép színmélysége Színinformáció mennyisége pontonként Megjeleníthető színek száma színmélység 4 bit 16 8 bit 256 16 bit 65 536 (64 K) 24 bit 16 777 216 (16 M) Az emberi szem érzékelő képességét, és a jelenlegi monitorok megjelenítő képességét figyelembe véve, 16 bit színinformáció minden igényt kielégít.

190 A képállomány-méretének becslése Képállomány egy BMP fájlban helyezkedik el. A fájlban vezérlési információk és adatok találhatók. A vezérlési információk mérete a fájl méretének kevesebb, mint 0,1%-a. A képállomány becsült mérete az adatokból számítható ki: A grafikus fájl becsült mérete bájtban: Vízszintes képpont Függőleges képpont Színinformáció [bit] 8 =

191 Fájl méretek Kiszámítandó egy 320 240 képpontból álló képállomány becsült mérete a színinformáció függvényében: Színinformáció 8 bit 320 240 8 8 = 76.800 bájt = 75 kbájt Színinformáció 16 bit 320 240 16 8 = 153.600 bájt = 150 kbájt Színinformáció 24bit 320 240 24 8 = 230.400 bájt = 225 kbájt

192 Képek digitalizálása Ha egy papírképet kívánunk beépíteni egy multimédiaalkalmazásba a képet lapolvasóval kell beolvasni a számítógépbe. A beolvasáskor az analóg képből létrejön a digitális kép, ezzel a kép egy multimédiaalkalmazásba beépíthetővé válik. A beolvasáskor a lapolvasó digitalizálja a képet, BMP típusú képfájlt állít elő. A lapolvasóban beállítható - a fényerősség és kontraszt, - a beolvasásra kerülő képméret, - a felbontás, - a használt színmélység, stb.

193 Felbontás (1) A kép mintavételezésekor kapcsolódnak össze az analóg kép képelemei a digitális kép képpontjaival. A kép vízszintes és függőleges méretétől, valamint a lapolvasó felbontásától függ a képállományba kerülő képpontok száma. A képernyőn megjelenő kép képpontjainak száma az alábbiak szerint állítandó be: Vízszintes képpontszám = Képszélesség [inch] Lapolvasó felbontása [dpi] Függőleges képpontszám = Képmagasság [inch] Lapolvasó felbontása [dpi] Ne felejtsük el 1 inch = 25,4 mm

194 Felbontás (2) Beolvasandó egy 13 9 cm-es (5 3,5 ) fénykép, amit be 200 dpi felbontással digitalizálnak. A digitalizált kép 5 200 = 1000 és 3,5 200 = 700 képpontból fog állni. Ennyi képpont csak egy 1024 768 képpont felbontású monitoron helyezhető el. Ha csökkenteni kívánjuk a beolvasásra kerülő képpontok számát, csökkenteni kell a lapolvasó felbontását. Ha a lapolvasó felbontását 100 dpi értékre csökkentjük, a fenti fénykép beolvasásakor egy 5 100 = 500 és 3,5 100 = 350 képpontból állókép lesz a képernyőn, ami egy 640 480 képpont felbontású monitorra is elhelyezhető. Fényképek beolvasásához 80-120 dpi közötti lapolvasó felbontást használnak, mert ilyen felbontás mellett a kép még jó minőségű lesz.

195 Kvantálás A lapolvasóban a fényerősség és a színmélység beállításával lehet megadni mintavételezett képelemek színkódjainak értékét. A színmélység definiálja a kvantálási hosszt, ezzel a képfájlban a színinformációt, azaz a képfájl méretét. A képet célszerű a lehető legnagyobb színmélységgel rögzíteni (beolvasni), azaz 24 32 bites színinformációt használni. Az alkalmazás igényeihez igazodva lehet később csökkenteni a színmélységet. Ekkor csökken a képfájl mérete, és felgyorsul a kép megjelenítése a képernyőn. A képdigitalizálásnál a kvantálás lényegében integrálás.

196 Példa: képdigitalizálás Egy 4 4 képet akarunk 240 240 képponton megjeleníteni. Mekkora felbontással olvassuk be a képet? 240 képponton kell 4 -t megjeleníteni. Egy inch hosszra 240 4 = 60 képpont esik. A lapolvasón a beolvasásnál 60 dpi értéket kell beállítani. 64 kszín színmélység beállítás esetén a BMP képfájl becsült mérete: 240 240 [képpont] 16 [bit] 8 = 115.200 bájt = 92,9 kbájt

197 Képállományok tömörítése A képfájlok nagyméretű állományok, tárolásukhoz sok hely, mozgatásukhoz sok idő szükséges. Célszerű csökkenteni a képállományok méretét, különösen, ha kis sávszélességű csatornákon (pl. az Interneten) kell továbbítani azokat. A leggyakrabban használt képtömörítési eljárások: - GIF (Graphic Interchange Format): veszteségmentes tömörítési eljárás vonalas illetve kevés színt használó képek számára - JPEG (Joint Photographic Expert Group) veszteséges tömörítési eljárás színes fényképek, és fényképhez hasonlító képek számára. A JPEG eljárás a többi tömörítési eljárás alapeljárása.

198 GIF A képpontok színkódjai gyakran ismétlődő adatsorozatok. Az adatsorozatokat beírják egy mintatáblázatba, az állományban viszont az adatsorozatokat egy pointer helyettesít. Az adatsorozatok általában több bájt hosszúak, a pointer mérete viszont legfeljebb 1 bájt, a helyettesítés tehát jelentős hely megtakarítást eredményez. GIF fájlokban elérhető méretcsökkenés az ismétlődő minták számától függ. Nagy, azonos színű mezőket tartalmazó képek esetében a tömörítés 10 is lehet, vonalas ábráknál általában 5 tömörítés érhető el. Vigyázat! A GIF eljárást licence díj megfizetése nélkül csak 16 bit színinformációig lehet használni!

199 Példa: GIF tömörítés Legyen egy 92,9 kbájt méretű BMP képfájlunk, melynek mérete a GIF eljárás szerinti tömörítés után 10,56 kbájtra csökken. Mekkora tömörítést lehetett a GIF eljárás használatával elérni? 92,9 kbájt 10,56 kbájt = 8,8 -os tömörítés

200 JPEG: tömörítés A JPEG tömörítő program tömörítéskor elhagy a képből bizonyos adatokat. Mivel a tömörítés érzékelésre támaszkodik, ezért az elhagyásra kerülő adatok az emberi szem érzékelési tulajdonságainak figyelembe vételével kerülnek kiválasztásra. A JPEG tömörítő program hatékonyan tömöríti a színes és szürke skálás képeket, fekete fehér képek tömörítésére viszont nem érdemes használni. A tömörítéshez a tömörítő programban egy paramétert lehet beállítani. A tömörítő program vagy kis fájlméretet készít, melyben a képminőség rossz, vagy nagy méretű fájlt állít elő minőségű képpel. A beállítás tehát kompromisszum a tömörített fájl mérete és a kibontott kép minősége között. A kibontott színes képeknél nincs minőségromlás, ha olyan paraméter kerülnek beállításra, melynél a tömörítés 10 körüli érték. Szürke skálás képeknél a kép minőségromlása már 5 tömörítésnél észrevehető.

201 JPEG: transzformáció A program először YUV szín-koordinátarendszerbe transzformálja a képfájlok RGB színinformációit, majd elválasztja egymástól a világosságés a színkódokat. Ezzel alkalmazkodik az emberi látás jellemzőihez. Az ember ugyanis a képben bekövetkező kis mértékű világosság változásokat inkább észreveszi, mint a színekben bekövetkező nagy mértékű változásokat. A program ezért elsősorban a színkódok mennyiségét csökkenti. A következő lépésben az eljárás csökkenti színkód-mennyiségét. Ez a JPEG nyelvezetben a 4:2:2 vízszintesen megfelezett színinformáció -, míg a 4:1:1 - vízszintesen és függőlegesen megfelezett színinformáció beállítás.

202 JPEG: színkód összenyomás Az eredeti képfájlban egy képpont egy világosság- és a két színkódját azonos számú bit alkotja. A 4:2:2 beállításnál két képpont színkódjai közül az eljárás az egyiket elhagyja, vagyis a két egymás utáni képpontnak azonos színkódot állít be. Ezzel megváltozik ugyan a kép látványa, de ez alig vehető észre. A legtöbb képnél ugyanis két egymás melletti képpont színe nem vagy alig különbözik egymástól. A 4:1:1 beállításnál az eljárás két sor színkódjait közösen kezeli. Egy képpont színkódja az utána következő képpont, az alatta lévő képpont, és az alatta lévő képpont mellett található képpont színkódjává válik, vagyis négy képpontnak azonos lesz a színkódja. A színkód összenyomás méretcsökkenést eredményez.

203 JPEG: adatok Ha például a világosságkód és a két színkód 4-4 bit hosszú, akkor 4:2:2 beállítás esetén az összenyomott fájlban két képpontot 24 (12 + 12) bit helyett 16 (12 + 4) bit definiál, vagyis egy képpont színinformációja 12 bitről 8 bitre csökken. Emiatt az új képfájl mérete az eredetinek kétharmada. 4:1:1 beállítás esetén a transzformált fájlban négy képpontot 48 (12 + 12 + 12 + 12) bit helyett 24 (12 + 4 + 4 + 4) bit definiál, vagyis a színinformáció 12 bitről 6 bitre csökken. Emiatt a képfájl mérete az eredetinek a fele lesz. A csökkenés adatveszteséggel jár, de az ember általában nem érez minőségromlást a szem tökéletlen színérzékelése miatt. Szürkeskálás képeknél nincs színkód, ezért nem lehet ily módon fájlméretet csökkenteni, ezért kisebb a tömörítés ezeknél a képeknél.

204 JPEG: tömörítési eljárás A program a következő fázisban a képfájlban található képpontokat 8 8 tagból álló makro-blokkokra bontja, majd diszkrét koszinusz transzformációval kiszámítja blokkokat alkotó frekvencia komponensek amplitúdóját. Ezután a program elhagyja azokat a frekvencia komponenseket, melyeknek amplitúdója kisebb a paraméterezés alkalmával beállított értéknél. Mennél nagyobb ez az érték, annál több a tömörítésnél elmaradó adatmennyiség, azaz kisebb a tömörített képfájl mérete. Ezután a program a megmaradó frekvenciakomponensekből készít egy pont-raszteres képet. Mivel a világosságkódok frekvenciakomponenseinek amplitúdója általában nagyobb a színkód frekvenciakomponensek amplitúdójánál, ezért az előbbiek kevésbé módosulnak a tömörítés alkalmával. A megmaradt adatokat a program Huffmann-kódolással tömöríti. A tömörített fájl tartalmazza kibontásához szükséges összes információt.

A JPEG tömörítési eljárás műveletei 205

206 Tömörítés JPEG eljárással Legyen egy 320 240 képpontból álló fájl, melyben a színmélység 16 Mszín (színinformáció 24 bit, True Color). Az eredeti képfájl mérete: 320 240 24 8 = 230.400 bájt A fájl mérete színkód összenyomás után: 4:2:2 beállítás: 320 240 16 8 = 153.600 bájt 4:1:1 beállítás: 320 240 12 8 = 115.200 bájt 12 tömörítés esetén a fájl mérete 19.200 bájtra csökken. Az emberi szem tömörített kép kibontása után minőségromlást nem fog érzékelni.

207 Kibontás A tömörített fájl kibontása ellenkező irányú folyamat. A kibontó program először létrehoz a Huffmann tömörítés kibontásával egy átmeneti képfájlt, majd kiszámítja az egyes blokkokat alkotó képpontok világosságkódját és színkódjait. Ekkor kialakul egy olyan képfájl, melyben minden képpontnak van egy világosságkódja és két színkódja. Ezt követően a program a képpontok világosságkódjából és két színkódjából RGB színkódot állít elő. Ez a képfájl a képernyőn megjeleníthető. Mivel az egyes blokkok külön-külön kerülnek tömörítésre, a blokkok határán lehet a kódértékek között eltérés. A kibontó programok általában összehangolják a blokkok közti átmenetet. Ezáltal a képernyőn szebb kép jelenik meg.

208 Példa: JPEG tömörítés Egy képfájlban 320 240 képpont van 15 bites színmélységgel. A képfájlt 4:2:2 színkód összenyomást használó JPEG eljárással tömörítjük. A tömörítés végén a tömörített képfájl mérete 15 Kbájt. Mekkora a tömörítés, és hogyan alakul ki ez a tömörítés a művelet közben? Eredeti képfájl mérete: 320 240 [képpont] 15 [bit] 8 = 144.000 bájt = 140,625 kbájt Fájl méret 4 : 2 : 2 színkód összenyomás után: 320 240 [képpont] 10 [bit] 8 = 96.000 bájt = 93,75 kbájt Teljes tömörítés 140,625 kbájt 15 kbájt = 9,375 -os tömörítés (Tömörítés: 1,5 és 6,25 )

209 Animáció (1) Az animáció állókép-sorozatok segítségével előállított mozgás szimuláció. Az animáció önálló állóképekből indul el, ezek összerakásával kelti a mozgás érzetét. A videofilm folyamatos mozgásról készített pillanatfelvételek sorozata. A pillanatfelvétel mindig folyamatos mozgás egy adott pillanatát rögzítő állókép. Az animáció látványosabb, több információ közölhető vele, mint állókép megjelenítéssel, de nagyobb számítógép teljesítmény szükséges hozzá, mint állókép megjelenítéshez. Animációk olyan kisebb teljesítményű számítógépeken is lejátszhatók, melyek nem képesek videoanyagok megjelenítésére.

210 Animáció (2) Az animáció képernyőn megjelenő multimédiaalkalmazás. Az alkalmazások képernyőképei két részből, a háttérből és az előtérből állnak. A háttér a képernyőkép alapja. Az animáció elkészítésekor számítógép programokkal létre kell hozni a hátteret és az előteret. Animáció létrehozása történhet: Animáció szerkesztő program segítségével, amikor az animációs képsorok külön állományban kapnak helyet. Az állomány a multimédia alkalmazásban, vagy külön is lejátszható. Objektum animáció segítségével, amikor az animáció egy vagy több elem mozgatása a képernyőn. Az animációs képsorokat a multimédia alkalmazás tartalmazza, azt csak az alkalmazásban lehet használni.

211 Animáció típusok - Állandó előtérrel készülő animáció - Állandó háttérrel készülő animáció - Objektum animáció

212 Állandó előtérrel készülő animáció Az animációs állományban az egyes képek háttere képről-képre keveset változik, miközben az előtér változatlan marad. Ma számítógép segíti az animáció elkészítését. Számítógéppel a háttér változó részeit képenként külön külön kell megszerkeszteni. Az egyes képkockákon az előtérben lévő változatlan képek másolással vihetők át a következő képkockára, tehát ezeket csak egyszer kell megrajzolni.

213 Állandó háttérrel készülő animáció Az animációs állományban az egyes képek háttere állandó. Az állandó hátteret minden egyes képkocka tartalmazza, erre kell képkockánként rárajzolni a változó előteret. Mivel állandó háttér teszi ki a képek nagy részét, ezért az így készülő animáció könnyen és gyorsan létrehozható. Az előtérben található tárgyakat apró részekre kell bontani, és rá kell rajzolni az állandó háttérre. A számítógép használata egyszerűsíti a rajzolást. Az előtérben a mozgást ábrázoló képek részleteit a számítógép hozza létre, a tervezőnek csak az animációs mozgás kezdő és végső állapotát kell megadni. A számítógép kiszámítja, és megrajzolja a közbenső állapotot ábrázoló képeket.

214 Objektum animáció A legegyszerűbb animációs módszer. Nem animációs állományt, hanem egy grafikus objektumot hoznak létre, melyet egy program mozgat a képernyőn egy előre megadott útvonalon. A hatás fokozása érdekében a grafikus objektummal bizonyos műveletek végezhetők (nagyítás, kicsinyítés, elforgatás, stb.), de az objektumnak mindvégig ugyanannak kell lenni. Az objektum mozgatás közben változtathatja alakját (például körből négyszög lehet vagy fordítva), azonban ezekhez az alakváltozásokhoz szükséges objektumokat előre el kell készíteni.

215 Eszközök az animációs képek megrajzolására A legtöbb animáció készítő szoftver rendelkezik az alábbi eszközökkel, melyek megkönnyítik az animáció készítést: (1) Objektum mozgatás előre definiált pálya mentén (2) Fázisrajzolás (tweening) (3) Képúsztatás (4) Animáció hangosítás

216 Fázisrajzolás Meg kell rajzolni a képsor kulcsrajzait, és a program elkészíti a közbenső rajzokat. Két kulcsrajz között a mozgás kötelezően folytonos. A fázisrajzolás angol neve tweening. Képúsztatás Képúsztatáskor egy kép néhány képváltás alatt egy másik képbe alakul át. Meg kell rajzolni az átalakulás első és utolsó képét, össze kell párosítani egymással a két kép jelentős pontjait, majd meg kell adni, hogy az átalakulás hány kép alatt játszódjon le. Ennek alapján a program elkészíti a többi képet.

217 Lejátszó program A lejátszó program egy kész animáció állományt jelenít meg. A megjelenítés során szükség lehet erőforrásokra, melyeket a lejátszó programnak el kell érni. Célszerű, ha az animáció készítő programban és a lejátszó programban azonosak az elérési útvonalak. Ezt biztosítja, ha mindkét programot a programok által javasolt könyvtárszerkezetbe telepítjük.

218 Színes TV adás A digitális videotechnika a színes televízióval van szoros kapcsolatban. A videotechnika alapját a televízió technika alkotja. A világon a színes TV műsorszórás valamelyik színes TV rendszer szerint történik. Jelenleg három különböző színes TV rendszer terjedt el a világon, napjainkra egyik TV rendszernek sincs már számottevő műszaki előnye vagy hátránya a másik kettőhöz képest. A színes TV műsorszórásnál az adó egyetlen jelet sugároz, ez tartalmazza a színes képjelet és a hangot. Az egyidejűleg sugárzott képés hangjelet különböző vivőfrekvencia választja szét. A színes képjel a világosságkód és a színkódok egy csatornás kombinációja.

219 Színes TV vétel A sugárzott videojelet a TV készülékek szétbontják képjelre és hangjelre, majd a képjelet dekódolják, kialakítják belőle a világosságkódot és a színkódokat. A fekete-fehér TV készülék a világosságkódból állítja elő a képet, emiatt lehet fekete-fehér TV készüléken venni a színes TV műsorokat. A színes TV készülék a színes képet a világosságkódból és a két színkódból állítja elő. A különböző TV rendszerekben különböző módon történik a világosságkód és a két színkód létrehozása, emellett különböznek egymástól a vivőfrekvenciák és a sávszélességek is.

220 Színes TV rendszerek, és műszaki adataik 1. NTSC (National Television Standard Committee) - képváltási frekvencia: 29,97 képkocka/másodperc - képernyő felbontás: 525 sor/kép - sávszélesség 5,5 MHz. 2. SECAM (SEquentiel Couleur Avec Mémoire) - képváltási frekvencia: 25 képkocka/másodperc - képernyő felbontás: 625 (819) sor/kép - sávszélesség 6 MHz. 3. PAL (Phase Alternation Line) - képváltási frekvencia: 25 képkocka/másodperc - képernyő felbontás: 625 sor/kép - sávszélesség: 6 MHz.

221 TV rendszer képernyők műszaki adatai Vízszintes felbontás: Függőleges felbontás: (Sorok száma képarány) képpont/sor Sorok száma NTSC: 525 4/3 = 700 képpont/sor 525 sor Ajánlott monitor felbontás: 640 480 PAL/SECAM: 625 4/3 = 833 képpont/sor 625 sor Ajánlott monitor felbontás: 800 600

222 A videojelek digitalizálása (1) Analóg videojeleket multimédiarendszerekben csak a számítógép digitális rendszerének megkerülésével lehet megjeleníteni (pl. overlay kártyával). Ha az analóg videojelet számítógéppel kívánjuk megjeleníteni, akkor megjelenítéséhez az analóg videojelet digitalizálni kell. Mivel az analóg videojel vezérlési információt, képjeleket és hangjeleket tartalmaz, az első feladat a vezérlési információ eltávolítása. Ezt követi a képjeleknek és hangjeleknek szűrőkkel történő szétbontása. A hangjeleket a hangkártya digitalizálja a korábbiakban ismertetett módon.

223 A videojelek digitalizálása (2) A képjelek digitalizálásakor az analóg jelből indulnak ki, melyben analóg formában rögzített képkockák vannak. A digitalizálás során alakul ki a digitális képállomány, melyben képkockák képpontjainak digitális adatai találhatók. Minden képkocka vízszintesen L képpontot, függőlegesen pedig K sort tartalmaz. A digitális képállomány a képkockákat alkotó képpontok halmaza, ami számítástechnikai tárolásra és feldolgozásra egyaránt alkalmas. A képjelek digitalizálásakor megkülönböztetjük a leképezés, a mintavételezés és a kvantálás műveletét.

224 Digitális képalkotás Analóg kép Leképzés Kétdimenziós képfüggvény Mintavételezés Mintavételezett képkocka Kvantálás Digitális képkocka

225 Leképzés Az analóg TV videojelekből kétdimenziós képfüggvény jön létre. Origó: a kép bal felső sarka. A képfüggvényben minden pontot a pont jellemeznek. - világosságkódja (luminanciája) és - színkódjai (krominanciái)

226 Mintavételezés (1) Mintavételezéskor a képkockát a mintavételezési frekvencia által meghatározott számú képelemre bontják. Minden mintavételezett jel egy képelemet határoz meg. A kép minőségét befolyásolja a képelemek száma, több képelem jobb minőségű képet jelent. A mintavételezett jel tartalmazza a képelem világosságkódjának és színkódjainak értékét. Kiinduló feltételezés, hogy a mintavételezési frekvencia a maximálisan átvitt frekvenciának mintegy kétszerese, azaz 10 MHz. Egy PAL videofilm esetében másodpercenként 10 millió mintavételezett jel jön létre, ami 25 képkockát alakít ki. Egy képkockára tehát 0,4 millió mintavételezett jel esik.