Hang A multimédia alapjai II. webprogramozó anyagi közegben k terjed mechanikai rezgés Jellemz i: frekvencia, hangszín, n, burkológörbe, rbe, hanger, terjedési sebesség Hangmagasság Az ember a különbk nböz frekvenciájú hangokat különbk nböz hangmagasságú hangoknak érzékeli. A hangok megoszlása sa a frekvenciák szerint: Tiszta hang egyetlen frekvenciájú rezgést tartalmaz magányos hang vagy a részhangr A természetes hang részhangjainakr összessége a frekvencia spektrum Hangszín, n, burkológörbe rbe A legmélyebb lyebb részhang r a természetes hang alapfrekvenciája. A további részhangok r frekvenciái általában kapcsolatban állnak az alaphang frekvenciájával, val, legtöbbsz bbször r annak egészsz szszámú többszörösei, sei, ezek a felhangok. Összetételük, amplitúdójuk és s fázisuk f határozza meg a természetes hang hangszínét. Az alaphang és s a felhangok frekvencia tartományon belüli li viselkedését t az ered hangjel burkológörb rbéje szemlélteti. lteti. Hangérz rzékelés A hallás s a hangforrás által a leveg ben keltett nyomásingadoz singadozásoksok érzékelése. Az emberi hallás s a frekvencia és s hangnyomás függvényében korlátozott. Sok emberen végzett v kísérletekkelk meghatározt rozták, hogy az ember a frekvencia függvényében milyen hangnyomás s szintet képesk még éppen meghallani. Ez a hallásk sküszöb. A hallásk sküszöb b nyomás értéke frekvencia függf gg. 1
Hangérz rzékelés Az ember hallásk sküszöbe függ f az egy id ben hallott hangoktól l is. Egy zavaró hang megemeli a többi t hang hallásk sküszöbét. Emiatt kell zajos környezetben k megemelni a hanger t, ha azt akarjuk, hogy partnereink megérts rtsék k mondanivalónkat. nkat. Hangelfedés A hallásk sküszöb értéke függ f az egy id ben hallott hangoktól. Ez a hangelfedés s jelensége. a hallható hangok tartomány nyában különböz frekvenciákon kon a hangelfedés mértéke a magasabb frekvenciákon kon er sebben jelentkezik A hangelfedés s jelenségét t hasznosítj tják k a digitális hangállom llományok tömörítésénélt Hanger a hangrezgés s amplitúdója, amit a hangnyomás s fejez ki. Értékét t akusztikus decibelben mérikm akusztikus decibel az ember hangérz rzékeléséhez alkalmazkodik, a hanger nagyságának nak tízes t alapú logaritmusának húszszorosh szszorosával arányban lév l szám. A hallásk sküszöbnek a 0 decibel felel meg, a fájdalomküszöb értéke 120 decibel. Vegyük észre, hogy az emberi fül f l milliószoros (10 6 ) hanger különbséget képesk érzékelni. A hallásk sküszöb és s a fájdalomkf jdalomküszöb hangnyomásának nak értéke frekvenciafügg gg (Fletcher görbék) Fletcher görbék Hangrögz gzítés A hangjel hangnyomásának nak átalakítása elektromos jellé,, melyben az elektromos jel frekvenciái és s amplitúdói i megfelelnek az eredeti hangjel frekvenciáinak inak és amplitúdóinak. inak. Az elektromos jel analóg g rögzr gzítése. 2
Lejátsz tszás A rögzr gzített jelek érzékelése, elektromos jellé alakítása. Az elektromos jelek feler sítése, se, és hangszóróval hangnyomáss ssá alakítása. Digitális hangrögz gzítés A hangjel hangnyomásának nak átalakítása analóg g elektromos jellé,, melyben az elektromos jel frekvenciái és s amplitúdói megfelelnek az eredeti hangjelnek. Az analóg g elektromos jel átalakítása digitális jelsorozattá mintavételez telezéssel és kvantálással. A digitális jelsorozat rögzr gzítése Mintavételez telezés az id ben és értékben folytonos analóg elektromos jeleket a mintavételez telezési frekvencia által megszabott ütemben diszkrét impulzussorozattá alakítj tják át. Az egyes impulzusok amplitúdója azonos az analógjelnek az adott pillanat szerinti értékével. Ez az impulzus sorozat a mintavételezett telezett impulzussorozat. A mintavételezett telezett impulzussorozat informáci ciótartalma bizonyos feltételek telek teljesülése se esetén - megegyezik az eredeti analóg g jel informáci ciótartalmával. Visszaáll llítás A mintavételezett telezett impulzussorozatból l az eredeti analóg g jelet akkor lehet torzítás nélkül l visszaáll llítani, ha a mintavételez telezési frekvencia legalább kétszerese k az eredeti analóg g jelben el fordul forduló legnagyobb frekvenciának nak (Shannon( tétel) tel) Kvantálás a mintavételezett telezett impulzussorozat amplitúdó értékeinek bináris számokk mokká történ átalakítása. Az amplitúdó értékek megadására meghatározott számú bit áll rendelkezésre. A rendelkezésre álló bitek száma a kvantálási hossz kvantálási hossz meghatározza a megkülönb nböztethet amplitúdó értékek számát. 8, 16, 20 vagy 24 bit kvantálási hosszal 256, 65.536, 1.048.576 vagy 16.777.216 amplitúdó értéket lehet megkülönb nböztetni. Minél l több t amplitúdó értéket lehet megkülönb nböztetni, annál l pontosabban lehet visszajátsz tszáskor skor visszaáll llítani a digitális jelsorozatból l az eredeti analóg g jelet. 3
A digitalizálás s min sége A hanganyagok digitalizálását t különbk nböz mintavételez telezési frekvenciával val és kvantálási hosszal lehet elvégezni. A digitalizált lt hangállom llományból l az eredeti hangállom llományt mindig csak bizonyos hibával lehet visszaáll llítani. A hiba mértm rtéke jellemzi a digitalizálás min ségét. mintavételez telezési frekvencia meghatározza, hogy a digitalizált lt hangállom llomány milyen frekvenciájú részhangokat tartalmaz az eredeti analóg g hanganyagból. Ha a mintavételez telezési frekvencia értéke legalább kétszerese az eredeti hangjelben el fordul forduló legnagyobb frekvenciának, nak, akkor a visszaáll llított hanganyag hangfrekvenciák k szempontjából hibamentes lesz. Kvantálási hiba A kvantálás s mindig okoz hibát, mert korlátozva van a digitális hangállom llományban a lehetséges amplitúdó értékek száma. Az analóg g hangjel amplitúdója általában nem állítható vissza hibamentesen, mert mindig van különbsk nbség g az eredeti amplitúdó érték és s a rögzr gzített amplitúdó érték között. A hiba abszolút értéke kisebb mint két k t kvantálási lépcsl pcs közötti érték. A kvantálási hiba a kvantálás s hosszával csökken. A kvantálási hiba különösen k kis amplitúdó értékek esetén n jelent s s nagyságú. Kvantálási hiba 8, 16, 20 illetve 24 bit kvantálási hossznál az átfogható hanger tartomány 1 : 256, 1 : 65.536, 1 : 1.048.576 illetve 1 : 16.777.216 érték, ami megfelel 48,1, 96,3, 120,4 illetve 144,5 decibelnek. A digitalizált lt hangállom llomány méretem Egy digitalizált lt hangállom llomány minden mintavételez telezési helyen a kvantálási hossz szerinti bitet tartalmazza. Ha 44,1 KHz mintavételez telezési frekvenciával val és 16 bit (2 bájt) b kvantálási hosszal digitalizálnak lnak egy mono hangállom llományt, akkor a digitális hangfájl hossza másodpercenkm sodpercenkéntnt 44.100 Hz 2 bájt b = 88.200 bájt b = 86,1 kbájt A digitalizált lt hangállom llomány méretem Több csatornás üzemmódban csatornánk nként nt törtt rténik a mintavételez telezés és a kvantálás. Sztereó üzemmódban a digitális hangállom llomány mérete m a mono hangállom llomány méretm retének a duplája: Méret [bájt] = Mintavételez telezési frekvencia [Hz] Kvantálási hossz [bit] Játszási si id [sec] Csatornaszám 8 4
Hangkártya szabványok AdLib szabvány ny: : Bevezette az FM szintézist. zist. Mono üzemmódban m köd m MIDI rendszert hozott létre. l SoundBlaster szabvány ny: : Bevezette a mintavételez telezést és s kvantálást a hangrögz gzítésben, kidolgozta a hullámt mtáblázat használat latát. t. Roland MT-32 szabvány ny: : Bevezette a hangkárty rtyán n a hullámt mtáblázatot tartalmazó ROM tárat. FM szintézis zis Frequency Modulation módszer speciális hangszínnel nnel rendelkez zenei hangok el áll llítására El sz ször r el áll llítanak egy tiszta szinuszos hangrezgést (viv frekvenci frekvenciát), majd ezt egy vagy több t lépcsl pcs ben modulálj lják. A viv frekvencia és s a moduláci ció megfelel beáll llításával különbk nböz burkológörb rbéj szintetikus hangok állíthatók k el. Ezek a hangok hasonlíthatnak a hangszerhangokhoz FM szintetizátor tor Egy FM szintetizátorban torban több t operátor találhat lható. Az egyik operátor egy másik m operátor kimen jel jelét t modulálja. lja. A frekvenciagenerátor kimen jele többt módosítás s után n hasonlít t a tervezett hangszer burkológörb rbéjéhez. SoundBlaster kártyák A SoundBlaster szabvány a digitális hangtechnikát t a CD technikából l vette át, amivel lehet vé vált a PC-kben a hangok digitális felvétele, tárolt rolása, szerkesztése se és s kezelése. A kártyk rtyákon 11,025, 22,05 és s 44,1 khz-es mintavételez telezési frekvenciával val 16 bites kvantálási hosszal dolgozó ADC találhat lható. Van még m g a SoundBlaster kártyákon Yamaha OPL3 szintetizátor, tor, ami szintetikus hangokat hullámt mtáblázat segíts tségével állít t el. Hullámt mtáblázat szintézis zis A szintetizátorok torok a szintetikus hangokat hullámt mtáblázatban tárolt t hangmintákb kból l készk szítik el. A hangminták k valódi hangszerekb l l származ rmazó hangok digitális mintái. i. A hullámt mtáblázatot használó hangkárty rtyáknál l a szintetikus hangok min sége függ f a hangminták min ségét l, a mintavételez telezési frekvenciától, a kvantálási hossztól, az egy hangszerhez tartozó minták számától. A SoundBlaster kártyákon 11,025, 22,05 vagy 44,1 KHz mintavételez telezési frekvenciát, illetve 8 vagy 16 bites kvantálási hosszt használnak. Hullámt mtáblázat A hullámt mtáblázatban hangszerenként nt egy vagy többt hangminta találhat lható. Több hangminta esetén n a hullámt mtáblázat a hangszer különböz frekvenciájú hangmintáit it tartalmazza. A különbk nböz frekvenciájú szintetikus hangszerhangokat hullámt mtáblázatból l kiolvasott a hang frekvenciájának nak módosításával állítják k el. Azért van egy hullámt mtáblázatban a hangszerekb l l több, t különböz magasságú hang, hogy a szintetikus hang valóságh gh legyen. Egy tipikus hullámt mtáblázat 4 Mbájt méret és s 700 hangminta van benne. 5
Hangállom llomány tömörítés t s indokai A digitális hangállom llományok hosszú állományok. Tárolásukhoz sok hely, mozgatásukhoz és kezelésükh khöz z sok id szüks kséges. Egy 16 bit kvantálási hosszal és s 44,1 KHz mintavételez telezési frekvenciával val felvett hangállom llomány hossza csatornánk nkéntnt és percenként: nt: 44.100 Hz 16 bit 60 sec 8 = 5.292.000 bájtb = 5.168 kbájt = 5,05 Mbájt Hangállom llomány tömörítés t s indokai Ha a környezeti k hangtér r megvalósításához 6 csatornát t használnak, egy percnyi m sortm tartalmazó hangállom llomány hossza 6 5,05 Mbájt = 30,3 Mbájt jt. A digitális hangállom llományok méretm retét t tömörítésselt lehet csökkenteni. A tömörítési t eljárások a hangelfedés s jelenségét hasznosítj tják, a pszichoakusztikus redundanciát csökkentik kódolk doláskor. Pszichoakusztikus tömörítés A kódolk doló a hangjelek frekvencia elosztását elemzi, majd a hangelfedés s jelenségét figyelembe véve v ve törli t az ember által nem hallott részeket r a hangállom llományból. A kódolk dolás s ezért érzékelésen alapuló zajsz rés s vagy érzékelésen alapuló részsáv-kódolás, a kódolk dolás s eredménye hangadat tömörítés. t Pszichoakusztikus tömörítés A kódolk doló egy sz r bank segíts tségével sávokras bontja a hangadatok alkotóelemeit, és s a sávokba es alkotóelemeket elemzi. Ha egy sávban s nincs hang, a kódolk doló a sávots nem kódolja. k Ha a sávban s van hang, és s a hang elnyomja a zajt, a kódolk doló kódolja a sávot. s Mivel kevesebb hangadat kerül l kódolk dolásra, csökken a kimen állományban lév l adatmennyiség. Mivel a nem kódolt k adatok többst bbsége zaj, ezért csökken a kimen állományban a zaj. Pszichoakusztikus tömörítés Az adatcsökkent kkentés s a kódolk dolási és kvantálási fázisban f valósul meg, amikor a kódoló szétosztja a rendelkezésre álló adatbiteket a sz r bank kimenetén megjelen hangsávok között. k Pszichoakusztikus tömörítés Kódolásnál l a kódolk doló a bitfolyam bitjeit a sávokban találhat lható hanganyag dinamikus jellege szerint osztja szét t a sávok s között. k Nagyobb hanger vel szóló hangok a sávokbans több bitet kapnak, mint a kisebb intenzitással szólók. Mivel az elosztásra sra kerül bitek száma állandó, ezért ha egy sávban s nagy intenzitású a hang, akkor ez a sáv s v sok bitet kap, míg m g a csendesebb sávok kevesebbet. Így a nagy intenzitású hang nemcsak az adott sávban fedi el a zajt, hanem az egész hallható hulláms msávban csökkenti azt. 6
Pszichoakusztikus tömörítés A pszichoakusztikus kódolású hangállom llomány a sávoks számával megegyez számú hangcsatornát t tartalmaz. Elvileg minden csatornában másodpercenkm sodpercenként nt azonos számú bit találhat lható. Valójában a tömörített t tett hangállom llományból l sok sávs (csatorna) bitjei hiányoznak, ezért csökken a hangállom llomány mérete. m Mivel a kódolk doló a másodpercenkm sodpercenként nt meghatározott számú bitet oszt szét t a sávok s között, k ezért a tömörítést és s a másodpercenkm sodpercenként nt tovább bbított bitek között k szoros kapcsolat áll fenn. Mennél l nagyobb a tömörítés t s annál l kevesebb az egy másodperc alatt tovább bbított bitek száma (fordított arány). Bitsebesség Mivel a bitsebesség g egyszer en en mérhetm rhet paraméter, ezért a hangállom llományok tömörítésénél l nem a tömörítést, t hanem a bitsebességet használj lják. Pszichoakusztikus dekódol dolás A soksávos (sokcsatornás) s) a kódolt k bitfolyamból digitális analóg átalakítóval visszaáll llíthatók k a hangszóróban megszólal laló hangok. Az eredeti és s a dekódolt dolt hangadatok formája ugyan különbk nbözik egymást stól, de a különbsk nbséget az ember nem vagy alig hallja, mert többnyire t a hiányz nyzó hangelemek a hangadatok lényegtelen, l ember által nem hallható alkotóelemek. Kísérleti úton igazolták, hogy 12 tömörítés esetén n is CD min ség hangnak tekinthet a dekódolt dolt hangadat. Hangállom llomány tömörítési t eljárások A tömörítésnt snél l a kódolk doló a hangállom llományt tartalmát t dinamikusan elemzi, és s sávokra s bontja. Az elemzés s módjam és s a sávok s száma a különfk nféle tömörítési eljárásokn soknál l különbk nböz,, ezért a tömörített tett hangállom llományból l származ rmazó hang min ségileg eltér lehet. Le kell azonban szögezni,hogy nagyon kevesen érzékelik ezt a különbsk nbséget. Az ismertetett tömörítési t eljárások: MPEG Audio Dolby Digital AC-3 MPEG2 Advanced Audio Coding (AAC) MPEG Audio Mintavételez telezési frekvencia: 32, 44,1, illetve 48 KHz Kvantálási hossz: 8, 16, vagy 20 bit Egy vagy két k t hangcsatornát t kezel Tömörítés: érzékelésen alapuló részsáv v kódolk dolás Csatornánk nkénti nti bitsebesség: 32 kbit/sec 224 kbit/sec közötti érték, állítható Három réteg r (eljárás): Layer 1: : Egyszer eljárás. Csatornánk nként nt 128 kbit/sec bitsebesség g felett használhat lható Layer 2: : Közepes K bonyolultságú eljárás. Csatornánk nkéntnt 128 kbit/sec bitsebesség g körül k l használhat lható Layer 3: : Bonyolult eljárás. Csatornánk nként nt 64 kbit/sec bitsebesség g körül k l használhat lható (MP3) Példa: Mekkora egy MP3 fájlf tömörítése Mekkora tömörítéssel t rendelkezik egy MP3 fájl, f amit 64 kbit/sec sebességgel játszanak j le. Az eredeti hangállom llomány sztereo hangállom llomány, amit 44,1 KHz mintavételez telezési frekvenciával val és 16 bites kvantálási hosszal rögzr gzítettek. A lejátsz tszás s hossza lényegtelen, l mert a tömörítést 1 sec hossz segíts tségével is meg lehet állapítani. 1 sec hosszú eredeti hangállom llományban a bitek száma: 44.100 Hz 16 bit 2 [csatorna] = 1.411.200 bit = 1.378,1 kbit 7
Példa: Mekkora egy MP3 fájlf tömörítése Mivel a tömörített t tett MP3 hangállom llomány lejátsz tszása sa 64 kbit/sec sebességgel történik, a kódolk doló olyan tömörítést t valósít meg, ami 1 sec hosszú állomány bitjeinek számát t 64 kbit értékre csökkenti. A tömörítés t s 1.378,1 kbit 64 kbit = 21,5 tömörítés Környezeti hangtér A Dolby Laboratories a filmtechnika részr szére dolgozta ki az analóg Dolby Stereo hangrendszert. Ebben négy n csatornában, öt t (baloldali, középsk ps, jobboldali, két k t környezeti) k hangszóróval állítottak el térhatású hangot. Az 5.1 csatornás Dolby Stereo Digital a Dolby Stereo digitális változata, v melyben a két k t környezeti k hangszórót két t független f csatorna vezérli, és s megjelent benne a mélysugárzó (LFE: Low Frequency Effect) ) csatorna is. Az 5.1 csatorna kódolk dolási szempontból l 6 csatorna. A használt mintavételez telezési frekvenciák k 32, 44,1 vagy 48 KHz, a kvantálási hosszak 8, 16 vagy 20 bit. Példa: Dolby Digital hangfájl mérete Mekkora egy 1 perc hosszú,, 5.1 csatornás Dolby Digital hangfájl mérete, m ha a mintavételez telezési frekvencia 48 KHz, a kvantálási hossz 20 bit. 48.000 Hz 20 bit 6 [csatorna] 60 sec 8 = 43.200.000 bájt b = 42.187,5 kbájt = 41,2 Mbájt Vegyük észre, hogy hatalmas a fájlmf jlméret. Emiatt kell a környezeti k hangtér r hangállom llományait tömöríteni. teni. Dolby Digital hangrendszer A Dolby Digital (AC-3) a DVD lemezek számára módosított Dolby Stereo Digital hangrendszer, melyben a hangállom llományt érzékelésen alapuló részsáv v kódolk dolási technika használat latával tömörítik, tik, hogy 1 5.1 hangcsatornán n keresztül kissebesség adatátvitel tvitel váljon v lehet vé. A Dolby Digital rendszerben a hangfelvételhez 6 mikrofont használnak, a 6 bemen jelb l állít t el a Dolby Digital kódoló egyetlen folytonos bitfolyamot. A bitfolyamot a Dolby Digital dekódol doló szétbontja, és s el áll llítja a hangszórók k számára a vezérl rlést. Dolby Digital rendszer vázlatav Dolby Digital csatornák A Dolby Digital rendszerben hat teljesen önálló digitális hangcsatorna van. Három csatornán n jön j n a hang a hangtér r baloldali, középs és s jobboldali hangszóróihoz. A környezeti k hangtér r kialakítását t két k t hátsh tsó különálló hangszóró biztosítja. tja. Ez az öt t csatorna teljesen egyenrangú,, mindegyik 20 Hz és s 20.300 Hz közöttk ± 0,5 db ingadozással viszi át t a hangot. A hatodik csatorna, a 0,1 csatorna el is hagyható.. Csak 20 Hz és s 120 Hz között k viszi át t a hangot. Ez a mélysugm lysugárzó csatorna különbk nböz alacsony frekvenciás s hatások keltésére szolgál. l. 8
Lekeverés s (Downmixing( Downmixing) A Dolby Digital dekókódol doló 5.1 (6), 4, 2 és s 1 hangszóró felé tudja szétosztani a 5.1 csatornás bitfolyamot. Ez nagyon el ny nyös multimédiarendszerek öszszeállításakor. Dolby Digital kódolás A Dolby Digital rendszerben a mintavételezett telezett hangadatokat AC-3 3 kódolk dolási technikával tömörítik. tik. Az AC-3 3 (Audio( Coding number 3) érzékelésen alapuló digitális részsr szsáv v kódolk dolási (zajcsökkent kkentési és s tömörítési) t eljárás. A Dolby Digital kódoló a hallható hangtartományt nyt az emberi hallás s frekvencia érzékenységének nek megfelel en en 32 különbk nböz széless lesség frekvenciasávra vra osztja. Az egyes sávokban s lehet vé válik a zaj er teljes kisz rése. se. Példa: Dolby Digital hangfájl tömörítés Egy 5.1 csatornás s 48 KHz mintavételez telezési frekvenciával val és s 20 bit kvantálási hosszal rögzített hanganyag hossza percenként nt (6 48000 16 60) 8 = 43.200.00 bájt b = 41,2 Mbájt Legyen a Dolby Digital bitfolyamban a bitsebesség g 384 kbit/sec. Ez percenként nt 60 sec 384 kbit/sec : 8 = 2.880 kbájt = 2,81 Mbájt hanganyag tovább bbítást jelent. Az eredeti állomány és s a tömörítettt tett állomány aránya: 41,2 : 2,81 = 14,7 ami 14,7 -es estömörítést jelent. MPEG2 Advanced Audio Coding (AAC) Az MPEG2 AAC kódolk dolás s a környezetik hangteret 5 hangszóróval valósítja meg. Az MP3 kódolk dolás s továbbfejleszt bbfejlesztésének tekinthet. A kódolk dolásnál l a mintavételi teli frekvencia 8 KHz és s 96 KHz között k lehet, a kvantálás hossza 8 és s 24 bit között k van, míg m g a részsávok száma 1 és s 48 között k változhat. v Újítások az MP3-hoz képestk módosított diszkrét t koszinusz transzformáci ciót t használ l a sz r bank, van ideiglenes zaj átalakítás s (TNS: Temporary Noise Shaping), van el rejelz rejelzés, a kvantálási lépcsl pcs fokok kisebbek, csökkentett kkentették k a kódolk dolási redundanciát. Sz r bank Az AAC kódolk doló a sz réshez shez módosm dosított diszkrét t koszinusz transzformáci ciót használ. A módosm dosított eljárás s az MP3 eljárásn snál jobb zajsz rést, st, ezáltal nagyobb tömörítéstt biztosít 9
Ideiglenes zaj alakítás Temporaly Noise Shaping: Újítás s az id frekvencia kódolk dolás s területen. A kódolk doló a kvantálási zaj elosztását t az id függv ggvényében a frekvencia tartomány el rejelz rejelzés s szerint alakítja ki. Ezzel különösen k a beszéd d válikv érthet bbé. MPEG2 AAC El rejelz rejelzés: A beszéd d felismerés s céljc ljára kidolgozott módszer. m Arra épít, hogy bizonyos hanganyagok esetében az el rejelz rejelzés s egyszer. Kvantálás: A nagyobb kvantálási hossz miatt a bitsebesség hatékonyabban használhat lható fel. Bitfolyam formátum tum: A kibocsátott digitális informáci ció a minimális kódolási redundancia biztosítása sa érdekében entrópia kódolk doláson megy keresztül. MPEG2 AAC kódolk dolás legjelent sebb alkalmazói i a filmipar és s a digitális TV. Az eljárás s meglep en en jój kódolási hatékonys konysága miatt valósz szín leg elterjed az Interneten is, mert kis sávszs vszélességet igényel. Az MPEG2 AAC eljárás s kidolgozása után, megjelentek használat latát t lehet vé tev alkalmazási szoftverek és s hardver megoldások. Elterjedését t segíti, hogy bármelyb bitsebességhez a nagyon jój hangmin séget get biztosít. t. MIDI (Musical Instrument Digital Interface) digitális hangszercsatoló interfész lehet vé teszi, hogy elektronikus hangszerek és a számítógép p egymás s között k adatokat cseréljenek. A MIDI szabvány nem ismeri a beszédet. A MIDI állományok a zeneeszközökre kre (General( MIDI), a hangok jellemz ire és s lejátsz tszására és s a szintetizátor tor m ködésére m vonatkozó utasításokat sokat tartalmaznak. A MIDI állományok emiatt kisebbek kb. század zad akkorák mint a WAV fájlok. f General MIDI a MIDI szabvány továbbfejleszt bbfejlesztése, se, Egységes gesíti a szintetizátorok torok által használt hullámt mtáblázatokban a zeneeszközök kiosztását, t, és s kib víti a MIDI szabványt néhányny új j utasítással ssal General MIDI Az eredeti MIDI szabvány nem definiálta a hullámt mtáblázatban a hangszerek helyét, ezeket a MIDI szerz k k határozt rozták k meg. Ezért minden lejátsz tszásra sra kerül MIDI állomány esetében illeszteni kellett a lejátsz tszásra sra kerül MIDI állomány hangszer kiosztását t a saját rendszer (szintetizátor) tor) hangszer kiosztásához. Ha ez nem törtt rtént meg, a MIDI állomány lejátsz tszásakor sakor megszólal laló zeneeszközök k fajtája ja véletlenszer en en alakult ki. 10
General MIDI A General MIDI szabvány 128 hangszer helyét t rögzr gzíti a táblázatban, ezért ezzel a szabvánnyal kompatibilis MIDI állományok minden MIDI rendszerben azonnal lejátszhat tszhatók. A MIDI utasítások sok két k t vagy három h bájtbb jtból állnak. A két k t bájtos b utasítások sok a szintetizátor tor m ködésétm befolyásolj solják. A szintetizátorra torra vonatkozó parancsokkal meg lehet változtatni a szintetizátor tor m ködését m t (péld ldául le lehet állítani az összes csatornában futó programot), tovább bbá definiálni lehet egy-egy szintetizátor tor csatornában megszólal laló hangszert. General MIDI A három h bájtos b utasítások sok a hangokra vonatkoznak. Els bájtjuk egy állapotbájt, melynek négy n bitje definiál egy szintetizátor tor csatornát, t, négy n bitje pedig egy parancsot. Egy MIDI állományban tehát t 16 szintetizátor tor csatorna parancsai lehetnek. A MIDI utasítás s második m bájtja b a hangjegyet, míg m g a harmadik bájt b a lejátsz tszás s dinamikáját t határozza meg. A General MIDI állomány tartalmazza a lejátsz tszásrasra kerül zeneszám m lejátsz tszásához szüks kséges összes informáci ciót, ezért játszhatj tszható le azonnal. Szintetizátorok torok A MIDI állományban lev utasításokat sokat a hangkárty rtyán n lev szintetizátor tor vagy külsk ls szintetizátor tor értelmezi és s szólaltatja meg. A külsk ls szintetizátort tort hangkártya MIDI csatlakozójába bedugaszolt MIDI kábellel k kell a számítógéphez csatlakoztatni. A szintetizátorok torok bemeneti csatornáikon fogadnak utasításokat, sokat, mindegyik csatorna egy hangszert kezel. Az OPL3 (MPC 3 el írás) szintetizátornak tornak 16 csatornája van, tehát t 16 hangszer hangját t képesk megszólaltatni. MIDI állományok készk szítésese A MIDI állományok készk szítéséhez MIDI sorrendvezérl rl programot kell használni. Ez a program teszi lehet vé a MIDI utasítások sok rögzítését, t, szerkesztését és s visszajátsz tszását. t. MIDI klaviatúra segíts tségével, a zeneszám lejátsz tszásával állítható el a MIDI állomány. A lejátszott zeneszámot a sorrendvezérl rl feljegyzi és s megjeleníti. A megjelenítés s törtt rténhet kottában vagy egyszer sített megjelenítési módban. m Sorrendvezérl rl szolgáltat ltatások Csatornák k megjelenítése Hangjegyek megjelenítése Hangjegyek átrendezése Lejátsz tszási si tempó beáll llítása Hangnem megváltoztat ltoztatása Hangszerek módosm dosításasa A fény, f a színek, a fényerf nyer sség A fény f 380 nm és s 780 nm hullámhossz mhosszúság közötti elektromágneses sugárz rzás, amit a szem érzékel. A szem a fény f hullámhossz szerinti összetételét színérzet formájában érzékeli. Az elektromágneses sugárz rzás s intenzitását t a szem fényerf nyer sség g formájában érzékeli. A fényerf nyer sség g növekedn vekedésekor a szem pupillája összehúzódik, emiatt a szem rendkívüli dinamikával rendelkezik. A szem mintegy 10 4 fényer sség g változv ltozást tud érzékelni. 11
Az emberi látásl Az emberi látásnak l számos korlátja van, erre alapozva valósul meg a képfk pfájlok veszteséges tömörítése. Ezek közül k l néhány n ny az alábbi: 1. Az emberi látás l s a fényerf nyer változásokra érzékenyebb, mint a színv nváltozásokra. 2. A színfelbont nfelbontás s a színárnyalatok elkülönítési képességét t adja meg. A színfelbont nfelbontás s szín és fényer sség g függf gg. 3. A színérz rzékelés s nem függ f az intenzitást stól. Az emberi látásl Az emberi látás l s id beli felbontása azt fejezi ki, hogy mennyi ideig kell egy látvl tványnak tartani, hogy azt az ember különállk lló látványnak érzékelje. Az 1/15 másodpercnm sodpercnél l rövidebb r ideig tartó képeket nem lehet egymást stól l elkülönítve érzékelni. Villogásmentes élmény viszont csak akkor keletkezik, ha a képvk pváltások száma meghaladja a szem fúziós frekvenciáját,, ami kb. 50 Hz Az ember számára kellemes képek k oldal arányai 4:3. Az oldal méretekrem érvényes, hogy a rövidebbik r oldal legyen 20 0 alatt láthatl tható Az emberi látásl A fentiek alapján n határozt rozták k meg a TV rendszereknél l 600 sor körül k l a sorszámot, sugároznak TV rendszerek legalább 50 félképet,, van a SVGA monitoroknál 800 600 képpontos k felbontás, és s a monitoroknál l legalább 60 Hz képvk pváltási frekvencia érték. Színl nlátás Az ember a 380 és s 780 nm közötti hullámhossz mhosszúságú fényeket a hullámhossz mhosszúság függvényében különbk nböz szín nek nek látja. l A 380 nm körüli hullámhossz mhosszúságú fény ibolyaszín,, míg m g a 780 nm körüli vörös v s szín. A láthatl tható fénytartományon nyon belül l az emberi látásl nem egyenletes érzékenység. Az azonos fényerejf nyerej,, de eltér szín fényeket az ember különbk nböz fényerej neknek érzékeli. Az emberi szem a zöld z színek tartomány nyában a legérz rzékenyebb. Metamer szín fények Az emberi szem két k t fényt f nemcsak akkor lát t azonos szín nek, nek, ha a két k t fényf spektrális összetev i i megegyeznek, hanem bizonyos feltételek telek mellett eltér spektrális összetev j fényeket is. Az azonos szín nek nek látott, l de különbk nböz spektrális összetev j fények a metamer szín fények Metamer szín fények Az emberi szem fogyatékoss kossága miatt majdnem az egész színtartom ntartományt nyt be lehet mutatni háromh egyfrekvenciás s (egyszín ) ) fényforrf nyforrás s segíts tségével a fényforrások színének nek keverésével vel és s intenzitásának nak változtatásával. Ezért használnak a mai megjelenít rendszerek (számítógép p monitorok, TV képernyk perny k, stb.) színes képek el áll llítására három h egyfrekvenciás s fényforrf nyforrást, nevezetes egy vörös v s (R: Red), egy zöld z (Green( Green) és s egy kék k (B: Blue) ) fényforrf nyforrást. A színes képeknk peknél l nem a valóságh gh (színhelyes) visszaadásra sra van szüks kség, hanem a valóságnak fehér fénnyel megvilágított képét k t kell bemutatni. 12
RGB szín-koordin koordinátarendszer A m szakim életben leggyakrabban használt szín- koordinátarendszer, mert a színeknek a képerny n n törtt rtén megvalósításával kapcsolatos. A képernyk perny n n minden színt az RGB alapszínek additív v keverésével vel állítanak el. A képernyk perny n n a három h alapszín úgy van értelmezve, hogy R + G + B = 1 ; fehér r szín R + G + B = 0 ; fekete szín YUV szín-koordin koordinátarendszer Az emberi látáshoz l illesztett szín- koordinátarendszer, ahol Y a világoss gosságkód (luminancia), U és s V a színk nkód d (krominancia( krominancia). A PAL, SECAM TV rendszerekben, és s a képtömörítésben használj lják. Az Y, U és s V értéket az RGB értékekb l l az alábbi egyenletekkel lehet meghatározni: Y = 0,3R + 0,59G + 0,11B U = (B-Y) 0,493 V = (R-Y) 0,877 Szín-koordin koordinátarendszerek További szín-koordin koordinátarendszerek: YIQ: Y a világoss gosságkód, I, Q a színk nkód CIE (XYZ): X a világoss gosságkód, Y, Z a színk nkód HSB: H a színezetts nezettség, S a telítetts tettség, B a fénys r ség Az egyes szín-koordin koordinátarendszerek egymásba transzformálhat lhatók. Atranszformáci ció minden esetben kerekítési veszteséget okoz. Példa: RGB YUV transzformáci ció Transzformáljuk az RGB (128, 128, 128) érték színkoordin nkoordinátát t YUV szín-koordin koordinátarendszerbe. Az eredmények egészsz szszámok lehetnek. Y = 0,3 R + 0,59 G + 0,11 B = 38,4 + 75,52 + 14,08 = 142,08 = 142 U = (B Y) 0,493 = (128 142) 0,493 = - 6,9 = - 7 V = (R Y) 0,877 = (128 142) 0,877 = - 12,3 = - 12 A törtrt rtrészek eltüntet ntetése a kerekítési veszteség. Grafikusfájlok a multimédi diában A multimédiarendszerekben használt grafikusfájlok Állóképeket (grafikákat), kat), vagy Mozgóképeket tartalmazhatnak. A grafikusfájlok a képernyk perny n n bittérk rképes formában jelennek meg. Ebben a formában a színes kép k p minden képpontját t 4 32 bit színinform ninformáció írja le, ezért a képállomk llományok nagyméret ret ek. ek. A képállomk llományokat a hátth ttértárakon rakon tárolhatjukt vektorgrafikus formában, vagy bittérk rképes formában. Vektorgrafikus formátum rajzoló (vektor) utasítások sok halmaza. A rajzoló utasítások sok leírj rják k a geometriai alakzatok milyenségét t (pont, vonal, ív, szöveg, stb.), helyét, méretm retét, t, irány nyítását, t, színét, stb. Megjelenítéskor a program értelmezi a rajzoló utasításokat, sokat, kialakítja a bittérk rképes ábrát, és s felrajzolja azt a képerny re. re. 13
A vektorgrafika jellemz i kisméret ret grafikusfájlok, vonalas ábrák, egyszer m veletvégzés s (nagyítás, kicsinyítés), s), torzításmentes nagyítás, kicsinyítés CAD, CAM, CNC a f f alkalmazási terület. a megjelenítés s id tartama tartalomfügg gg. Bittérk rképes grafika a képpontok k megjelenítésével kapcsolatos színinform ninformációkat tartalmazó állomány. Megjelenítéskor a képernyk perny mindegyik pontja a pontról l tárolt t színinform ninformációk szerint veszi fel színét és s fényessf nyességét. A bittérk rképes grafika jellemz i nagyméret ret grafikusfájlok, foltszer ábrák, nehéz z az ábrán n a m veletvm veletvégzés, kicsinyítéskor, skor, nagyításkor van torzítás, multimédia a f f alkalmazási terület. Méret színm nmélység A képek k jellemz i Kép p a képernyk perny n A képernyk perny n n megjelen kép p méretm retét t kétk paraméter határozza meg: a kép k p vízszintesv és s függf gg leges méretem képpontban, a képernyk perny felbontása. Ha a képmk pméret és s a képernyk perny felbontása nem azonos, akkor a kép k p a képernyk perny nek nek csak egy részr szében jelenik meg, vagy a kép k p egy része r levágásra kerül. 320 240 képpontos k kép k p a képerny n 14
1024 768 képpontos k kép k p a képerny n Egy kép k p színm nmélysége Az emberi szem érzékel képességét, és a jelenlegi monitorok megjelenít képességét t figyelembe véve, v ve, 16 bit színinform ninformáció minden igényt kielégít. A képállomk llomány-méretének becslése se Képállomány egy BMP fájlban f helyezkedik el. A fájlban f vezérl rlési informáci ciók és s adatok találhat lhatók. A vezérl rlési informáci ciók k mérete m a fájl f méretm retének kevesebb, mint 0,1%-a. A képállomk llomány becsült mérete m az adatokból számíthat tható ki: A grafikus fájl f becsült mérete m bájtban: b Vízszintes képpontk Függ leges képpontk Színinform ninformáció [bit] 8 = Fájl méretekm Kiszámítand tandó egy 320 240 képpontbk ppontból álló képállomány becsült mérete m a színinform ninformáció függvényében: Színinform ninformáció 8 bit 320 240 8 8 = 76.800 bájt b = 75 kbájt Színinform ninformáció 16 bit 320 240 16 8 = 153.600 bájt b = 150 kbájt Színinform ninformáció 24bit 320 240 24 8 = 230.400 bájt b = 225 kbájt Képek digitalizálása Ha egy papírk rképet kívánunk k beépíteni egy multimédiaalkalmaz diaalkalmazásba a képet k lapolvasóval val kell beolvasni a számítógépbe. A beolvasáskor skor az analóg g képbk pb l l létrejl trejön n a digitális kép, k ezzel a kép k p egy multimédiaalkalmaz diaalkalmazásba beépíthet thet vé válik. A beolvasáskor skor a lapolvasó digitalizálja lja a képet, k BMP típust pusú képfájlt állít t el. A lapolvasóban beáll llítható a fényerf nyer sség és s kontraszt, a beolvasásra sra kerül képméret, a felbontás, a használt színm nmélység, stb. 15
Felbontás A kép k p mintavételez telezésekor kapcsolódnak össze az analóg g kép k p képelemei k a digitális kép k p képpontjaival. k A kép k p vízszintesv és s függf gg leges méretm retét l, valamint a lapolvasó felbontásától l függ f a képállomk llományba kerül képpontok száma. A képernyk perny n n megjelen kép p képpontjainak k száma az alábbiak szerint állítandó be: Vízszintes képpontszk ppontszám m = KépszK pszélesség g [inch] Lapolvasó felbontása [dpi[ dpi] Függ leges képpontszk ppontszám m = KépmagassK pmagasság g [inch] Lapolvasó felbontása [dpi[ dpi] Ne felejtsük k el 1 inch = 25,4 mm Felbontás Beolvasandó egy 13 9 cm-es (5 3,5 ) fénykép, amit 200 dpi felbontással digitalizálnak. lnak. A digitalizált lt kép k p 5 200 = 1000 és s 3,5 200 = 700 képpontbk ppontból l fog állni. Ennyi képpont k csak egy 1024 768 képpont felbontású monitoron helyezhet el. Felbontás Ha csökkenteni kívánjuk k a beolvasásra sra kerül képpontok számát, csökkenteni kell a lapolvasó felbontását. t. Ha a lapolvasó felbontását t 100 dpi értékre csökkentj kkentjük, k, a fenti fénykf nykép p beolvasásakor sakor egy 5 100 = 500 és s 3,5 100 = 350 képpontbk ppontból állókép p lesz a képernyk perny n, n, ami egy 640 480 480 képpont felbontású monitorra is elhelyezhet. Fényképek beolvasásához 80-120 dpi közötti lapolvasó felbontást használnak, mert ilyen felbontás s mellett a kép k p még m g jój min ség lesz. Kvantálás A lapolvasóban a fényerf nyer sség és s a színm nmélység g beáll llításával lehet megadni mintavételezett telezett képelemek k színk nkódjainak értékét. t. A színm nmélység g definiálja a kvantálási hosszt, ezzel a képfk pfájlban a színinform ninformációt, azaz a képfk pfájl méretm retét. t. Kvantálás A képet k célszerc lszer a lehet legnagyobb színm nmélységgel rögzr gzíteni (beolvasni), azaz 24 32 bites színinform ninformációt t használni. Az alkalmazás s igényeihez igazodva lehet kés bb csökkenteni a színm nmélységet. Ekkor csökken a képfk pfájl mérete, m és s felgyorsul a kép p megjelenítése a képernyk perny n. n. A képdigitalizk pdigitalizálásnál l a kvantálás s lényegl nyegében integrálás. Példa: képdigitalizk pdigitalizálás Egy 4 4 4 képet akarunk 240 240 képponton megjeleníteni. Mekkora felbontással olvassuk be a képet? k 240 képponton k kell 4 -t4 megjeleníteni. Egy inch hosszra 240 4 = 60 képpont k esik. A lapolvasón n a beolvasásn snál l 60 dpi értéket kell beáll llítani. 64 kszín színm nmélység g beáll llítás s esetén n a BMP képfájl becsült mérete: m 240 240 [képpont] ppont] 16 [bit] 8 = 115.200 bájt b = 92,9 kbájt 16
Képállományok tömörítéset A képfk pfájlok nagyméret ret állományok, tárolásukhoz sok hely, mozgatásukhoz sok id szüks kséges. Célszer csökkenteni a képállomk llományok méretét, t, különösen, k ha kis sávszs vszélesség csatornákon (pl. az Interneten) kell tovább bbítani azokat. A leggyakrabban használt képtömörítési eljárások GIF (Graphic( Interchange Format): veszteségmentes tömörítési t eljárás s vonalas illetve kevés s színt használó képek számára JPEG (Joint( Photographic Expert Group) veszteséges tömörítési t eljárás s színes fényképek, és s fénykf nyképhez hasonlító képek számára. A JPEG eljárás s a többi t tömörítési t eljárás alapeljárása. GIF A képpontok k színk nkódjai gyakran ismétl tl d adatsorozatok. Az adatsorozatokat beírj rják k egy mintatábl blázatba, az állományban viszont az adatsorozatokat egy pointer helyettesít. t. Az adatsorozatok általában több t bájtb hosszúak, a pointer mérete m viszont legfeljebb 1 bájt, b a helyettesítés s tehát jelent s s hely megtakarítást eredményez. GIF GIF fájlokban f elérhet rhet méretcsökkenés s az ismétl tl d minták k számától l függ. f Nagy, azonos szín mez ket tartalmazó képek esetében a tömörítés t s 10 is lehet, vonalas ábráknál általában 5 5 tömörítés érhet el. Vigyázat! A GIF eljárást licence díjd megfizetése nélkn lkül csak 16 bit színinform ninformációig ig lehet használni! Példa: GIF tömörítést Legyen egy 92,9 kbájt méret BMP képfájlunk, melynek mérete m a GIF eljárás szerinti tömörítés t s után n 10,56 kbájtra csökken. Mekkora tömörítést t lehetett a GIF eljárás használat latával elérni? 92,9 kbájt 10,56 kbájt = 8,8 -os tömörítés JPEG: tömörítést A JPEG tömörít t program tömörítéskor t elhagy a képb l l bizonyos adatokat. Mivel a tömörítést érzékelésre támaszkodik, t ezért az elhagyásra kerül adatok az emberi szem érzékelési tulajdonságainak figyelembe vételével kerülnek kiválaszt lasztásra. sra. A JPEG tömörít t program hatékonyan tömöríti t ti a színes és s szürke skálás s képeket, k fekete fehér képek tömörítésére t re viszont nem érdemes használni. 17
JPEG: tömörítést A tömörítéshez t a tömörít t programban egy paramétert lehet beáll llítani. A tömörít t program vagy kis fájlmf jlméretet készk szít, melyben a képmink pmin ség g rossz, vagy nagy méretm ret fájlt állít t el jó min ség képpel. A beáll llítás s tehát t kompromisszum a tömörített t tett fájlf mérete és s a kibontott kép k p min sége között. k A kibontott színes képeknk peknél l nincs min ségroml gromlás, ha olyan paraméter kerülnek beáll llításra, melynél l a tömörítés t s 10 körüli érték. Szürke skálás s képeknk peknél l a kép k p min ségroml gromlása már r 5 5 tömörítésnél észrevehet. JPEG: transzformáci ció A program el sz ször r YUV szín- koordinátarendszerbe transzformálja a képfk pfájlok RGB színinform ninformációit, it, majd elválasztja lasztja egymást stól l a világoss gosság- és s a színk nkódokat. Ezzel alkalmazkodik az emberi látásl jellemz ihez. Az ember ugyanis a képben k bekövetkez vetkez kis mérték világoss gosság g változv ltozásokat inkább észreveszi, mint a színekben bekövetkez vetkez nagy mérték változásokat. A program ezért els sorban sorban a színk nkódok mennyiségét t csökkenti. JPEG: transzformáci ció A következk vetkez lépésben az eljárás s csökkenti színk nkód-mennyiségét. Ez a JPEG nyelvezetben a 4:2:2 vízszintesen megfelezett színinform ninformáció -, míg g a 4:1:1 - vízszintesen és függ legesen megfelezett színinform ninformáció beáll llítás. JPEG: színk nkód összenyomás Az eredeti képfk pfájlban egy képpont k egy világoss gosság- és s a két k t színk nkódját t azonos számú bit alkotja. A 4:2:2 beáll llításnál l két k t képpont k színk nkódjai közülk az eljárás s az egyiket elhagyja, vagyis a kétk egymás s utáni képpontnak k azonos színk nkódot állít be. Ezzel megváltozik ugyan a kép k p látvl tványa, de ez alig vehet észre. A legtöbb képnk pnél l ugyanis két k t egymás s melletti képpont színe nem vagy alig különbk nbözik egymást stól. JPEG: színk nkód összenyomás A 4:1:1 beáll llításnál l az eljárás s két k t sor színk nkódjait közösen k kezeli. Egy képpont k színk nkódja az utána következk vetkez képpont, az alatta lév l képpont, és s az alatta lév l képpont mellett találhat lható képpont színk nkódjává válik, vagyis négyn képpontnak azonos lesz a színk nkódja. A színk nkód összenyomás s méretcsm retcsökkenést eredményez. JPEG: adatok Ha példp ldául a világoss gosságkód és s a két k t színk nkód d 4-44 4 bit hosszú,, akkor 4:2:2 beáll llítás s esetén n az összenyomott fájlban két k t képpontot k 24 (12 + 12) ) bit helyett 16 (12 + 4) bit definiál, vagyis egy képpont k színinform ninformációja 12 bitr l 8 bitre csökken. Emiatt az új j képfk pfájl mérete m az eredetinek kétharmada. k 4:1:1 beáll llítás s esetén n a transzformált fájlban f négyn képpontot 48 (12 + 12 + 12 + 12) ) bit helyett 24 (12 + 4 + 4 + 4) bit definiál, vagyis a színinform ninformáció 12 bitr l l 6 bitre csökken. Emiatt a képfk pfájl mérete m az eredetinek a fele lesz. 18
JPEG: adatok A csökken kkenés s adatveszteséggel jár, j de az ember általában nem érez min ségroml gromlást a szem tökéletlen t színérz rzékelése miatt. Szürkesk rkeskálás s képeknk peknél l nincs színk nkód, ezért nem lehet ily módon m fájlmf jlméretet csökkenteni, ezért kisebb a tömörítést ezeknél l a képeknk peknél. JPEG: tömörítési t eljárás A program a következk vetkez fázisban a képfk pfájlban találhat lható képpontokat 8 8 tagból álló makro- blokkokra bontja, majd diszkrét t koszinusz transzformáci cióval kiszámítja blokkokat alkotó frekvencia komponensek amplitúdóját. t. Ezután n a program elhagyja azokat a frekvencia komponenseket, melyeknek amplitúdója kisebb a paraméterez terezés s alkalmával beáll llított értéknél. Mennél l nagyobb ez az érték, annál l több t a tömörítésnél l elmaradó adatmennyiség, azaz kisebb a tömörített t tett képfk pfájl méretem JPEG: tömörítési t eljárás Ezután n a program a megmaradó frekvenciakomponensekb l l készk szít t egy pont- raszteres képet. k Mivel a világoss gosságkódok frekvenciakomponenseinek amplitúdója általában nagyobb a színk nkód frekvenciakomponensek amplitúdójánál, l, ezért az el bbiek kevésb sbé módosulnak a tömörítést alkalmával. A megmaradt adatokat a program Huffmannkódolással tömöríti. ti. A tömörített t tett fájl f tartalmazza kibontásához szüks kséges összes informáci ciót. A JPEG tömörítési t eljárás m veletei Tömörítés s JPEG eljárással Legyen egy 320 240 képpontbk ppontból álló fájl, melyben a színm nmélység g 16 Mszín (színinform ninformáció 24 bit, True Color). Az eredeti képfk pfájl mérete: m 320 240 24 8 = 230.400 bájt A fájl f mérete m színk nkód összenyomás s után: 4:2:2 beáll llítás: 320 240 16 8 = 153.600 bájtb 4:1:1 beáll llítás: 320 240 12 8 = 115.200 bájtb 12 tömörítés s esetén n a fájl f mérete m 19.200 bájtrab csökken. Az emberi szem tömörített t tett kép k p kibontása után min ségroml gromlást nem fog érzékelni. Kibontás A tömörített t tett fájl f kibontása ellenkez irány nyú folyamat. A kibontó program el sz ször r létrehoz l a Huffmann tömörítés s kibontásával egy átmeneti képfk pfájlt, majd kiszámítja az egyes blokkokat alkotó képpontok világoss gosságkódját és s színk nkódjait. Ekkor kialakul egy olyan képfk pfájl, melyben minden képpontnak k van egy világoss gosságkódja és két t színk nkódja. Ezt követk vet en en a program a képpontokk világoss gosságkódjából és s két k t színk nkódjából l RGB színk nkódot állít t el. Ez a képfk pfájl a képernyk perny n n megjeleníthet thet. 19
Kibontás Mivel az egyes blokkok külön-különk kerülnek tömörítésre, t a blokkok határán lehet a kódértk rtékek között k eltérés. A kibontó programok általában összehangolják k a blokkok köztik átmenetet. Ezáltal a képernyk perny n n szebb kép k p jelenik meg. Példa: JPEG tömörítést Egy képfk pfájlban 320 240 képpont k van 15 bites színm nmélységgel. A képfk pfájlt 4:2:2 színk nkód összenyomást st használó JPEG eljárással tömörítjük. A tömörítés t s végén v n a tömörített t tett képfk pfájl mérete m 15 Kbájt jt. Mekkora a tömörítés, t és s hogyan alakul ki ez a tömörítés t s a m veletm közben? Eredeti képfk pfájl mérete: m 320 240 [képpont] 15 [bit] 8 = 144.000 bájt b = 140,625 kbájt Fájl méret m 4 : 2 : 2 színk nkód összenyomás s után: 320 240 [képpont] 10 [bit] 8 = 96.000 bájt b = 93,75 kbájt Teljes tömörítést 140,625 kbájt 15 kbájt = 9,375 -os tömörítés (Tömörítés: 1,5 és s 6,25 ) Animáci ció állókép-sorozatok segíts tségével el áll llított mozgás s szimuláci ció. Az animáci ció önálló állóképekb l l indul el, ezek összerakásával kelti a mozgás érzetét. t. A videofilm folyamatos mozgásr sról l készk szített pillanatfelvételek telek sorozata. A pillanatfelvétel tel mindig folyamatos mozgás s egy adott pillanatát t rögzr gzít állókép Animáci ció látványosabb, több t informáci ció közölhet vele, mint állókép p megjelenítéssel, de nagyobb számítógép p teljesítm tmény szüks kséges hozzá,, mint állókép megjelenítéshez. Animáci ciók k olyan kisebb teljesítm tmény számítógépeken is lejátszhat tszhatók, melyek nem képesekk videoanyagok megjelenítésére. Animáci ció létrehozása Animáci ció szerkeszt program segíts tségével: az animáci ciós s képsorok k különk állományban kapnak helyet. Az állomány a multimédia alkalmazásban, vagy különk is lejátszhat tszható. Objektum animáci ció segíts tségével: az animáci ció egy vagy több t elem mozgatása a képerny n. n. Az animáci ciós s képsorokat k a multimédia alkalmazás tartalmazza, azt csak az alkalmazásban lehet használni Animáci ció típusok Állandó el térrel készk szül animáci ció Állandó háttérrel készk szül animáci ció Objektum animáci ció 20
Állandó el térrel készk szül animáci ció Az animáci ciós állományban az egyes képekk háttere képrk pr l-képre pre keveset változik, v miközben az el tér r változatlan v marad. Ma számítógép p segíti az animáci ció elkész szítését. t. Számítógéppel a hátth ttér r változv ltozó részeit képenként nt külön k külön kell megszerkeszteni. Az egyes képkockk pkockákon kon az el térben lév l változatlan képek k másolm solással ssal vihet k át t a következ képkockára, tehát t ezeket csak egyszer kell megrajzolni. Állandó háttérrel készk szül animáci ció Az animáci ciós állományban az egyes képekk háttere állandó. Az állandó hátteret minden egyes képkockak tartalmazza, erre kell képkockk pkockánként nt rárajzolni r rajzolni a változó el teret. Mivel állandó háttér r teszi ki a képek k nagy részr szét, ezért az így készk szül animáci ció könnyen és gyorsan létrehozhatl trehozható. Az el térben találhat lható tárgyakat apró részekre kell bontani, és s rár kell rajzolni az állandó háttérre. A számítógép p használata egyszer síti a rajzolást. Állandó háttérrel készk szül animáci ció Az el térben a mozgást ábrázoló képek részleteit a számítógép p hozza létre, l a tervez nek csak az animáci ciós s mozgás kezd és s végsv gs állapotát t kell megadni. A számítógép p kiszámítja, és s megrajzolja a közbens állapotot ábrázoló képeket. Objektum animáci ció A legegyszer bb animáci ciós s módszer. m Nem animáci ciós állományt, hanem egy grafikus objektumot hoznak létre, l melyet egy program mozgat a képerny n n egy el re megadott útvonalon. A hatás s fokozása érdekében a grafikus objektummal bizonyos m veletek m végezhetv gezhet k k (nagyítás, kicsinyítés, s, elforgatás, stb.), de az objektumnak mindvégig ugyanannak kell lenni. Az objektum mozgatás s közben k változtathatja v alakját (péld ldául körbk rb l l négyszn gyszög g lehet vagy fordítva), azonban ezekhez az alakváltoz ltozásokhoz szüks kséges objektumokat el re el kell készk szíteni. Eszközök k az animáci ciós s képekk megrajzolására Objektum mozgatás s el re definiált pályap mentén Fázisrajzolás s (tweening( tweening) Képúsztatás Animáci ció hangosítás Fázisrajzolás Meg kell rajzolni a képsor k kulcsrajzait, és s a program elkész szíti a közbensk zbens rajzokat. Két t kulcsrajz között k a mozgás s kötelezk telez enen folytonos. A fázisrajzolf zisrajzolás s angol neve tweening. 21
Képúsztatás Képúsztatáskor skor egy kép k p néhány n ny képvk pváltás alatt egy másik m képbe k alakul át. Meg kell rajzolni az átalakulás s els és utolsó képét, össze kell párosp rosítani egymással a két k t kép k p jelent s s pontjait, majd meg kell adni, hogy az átalakulás hány kép k p alatt játszj tszódjon le. Ennek alapján n a program elkész szíti a többit képet. Lejátsz tszó program A lejátsz tszó program egy kész k animáci ció állományt jelenít t meg. A megjelenítés s során n szüks kség g lehet er forr forrásokra, melyeket a lejátsz tszó programnak el kell érni. Célszer,, ha az animáci ció készít programban és s a lejátsz tszó programban azonosak az elérési útvonalak. Ezt biztosítja, tja, ha mindkét t programot a programok által javasolt könyvtk nyvtárszerkezetbe telepítj tjük. Színes TV adás A digitális videotechnika a színes televízi zióval van szoros kapcsolatban. A videotechnika alapját t a televízi zió technika alkotja. A világon a színes TV m sorszm sorszórás s valamelyik színes TV rendszer szerint törtt rténik. Jelenleg három h különbk nböz színes TV rendszer terjedt el a világon, napjainkra egyik TV rendszernek sincs már m r számottev mottev m szaki el nye vagy hátrh tránya a másik m kett höz z képest. k Színes TV adás A színes TV m sorszm sorszórásnál l az adó egyetlen jelet sugároz, ez tartalmazza a színes képjeletk és s a hangot. Az egyidej leg sugárzott kép-k és s hangjelet különböz viv frekvencia választja v szét. A színes képjel k a világoss gosságkód és s a színk nkódok egy csatornás s kombináci ciója. Színes TV vételv A sugárzott videojelet a TV készk szülékek szétbontj tbontják képjelre és s hangjelre, majd a képjelet k dekódolj dolják, kialakítj tják k bel le le a világoss gosságkódot és s a színk nkódokat. A fekete-feh fehér r TV készk szülék k a világoss gosságkódból állítja el a képet, k emiatt lehet fekete-feh fehér r TV készk szüléken venni a színes TV m sorokat. m A színes TV készk szülék k a színes képet k a világoss gosságkódból és s a két k t színk nkódból állítja el. A különbk nböz TV rendszerekben különbk nböz módon történik a világoss gosságkód és s a két k t színk nkód d létrehozl trehozása, emellett különbk nböznek egymást stól l a viv frekvenci frekvenciák és s a sávszélességek is. Színes TV rendszerek, és s m szakim adataik NTSC (National( Television Standard Committee) képváltási frekvencia: 29,97 képkocka/mk pkocka/másodperc képerny felbontás: 525 sor/kép sávszélesség g 5,5 MHz. SECAM (SEquentiel( Couleur Avec Mémoire) képváltási frekvencia: 25 képkocka/mk pkocka/másodperc képerny felbontás: 625 (819) sor/kép sávszélesség g 6 MHz. PAL (Phase( Alternation Line) képváltási frekvencia: 25 képkocka/mk pkocka/másodperc képerny felbontás: 625 sor/kép sávszélesség: 6 MHz. 22