Multimédia ismeretek 10. évfolyam informatika orientáció Összeállította: Nagy Zsolt
2
Tematika 1. Multimédia fogalma 1.1. Médium 1.2. Média 2. A multimédia alkalmazások alkotóelemei 2.1. Szöveges alkalmazások 2.2. Hangállományok 2.3. Grafikus objektumok 2.4. Videoállományok 3. Multimédia alkalmazások jellemzői 3.1. Idődimenzió 3.2. Adatfolyam 3.3. Valós idejű működés 4. Egy multimédia számítógép hardvere 4.1. CPU 4.2. Memória 4.3. Belső sínrendszer 4.4. Sínrendszerek 4.5. Monitor 4.6. Grafikus kártya 4.7. Lapolvasók 4.8. Hangkártya, hangszóró, mikrofon 4.9. Videokártya 4.10. CD technika 4.11. DVD technika 5. Szöveges alkalmazások 5.1. Szöveg elkészítésének menete 5.2. Szövegbevitel képolvasóval 5.3. Az OCR programok működése 5.4. Objektumok csatolása és beágyazása 3
6. Világháló 6.1. Hypertext 6.2. Hypermédia 6.3. Kép, hang és videoállományok az Interneten 7. Digitális hangtechnika 7.1. A hang fizikai jellemzői 7.2. A hang érzékelése 7.3. Akusztikai alapfogalmak 7.4. A hang rögzítése 7.5. A hang digitális rögzítése és lejátszása 7.6. Digitális hangállomány mérete 7.7. Hangfelvétel készítése 7.8. Hangállomány tömörítése 7.9. Környezeti hangtér 8. Grafikus alkalmazások, animáció 8.1. Az emberi látás informatikai vonatkozásai 8.2. Színlátás 8.3. Szín koordinátarendszerek 8.4. Számítógépes grafika 8.5. Képek jellemzői 8.6. Képek digitalizálása 8.7. Képállományok tömörítése 8.8. Animáció 9. Digitális videotechnika 9.1. Színes TV rendszerek 9.2. Videojelek digitalizálása 9.3. Digitalizált videoállomány jellemzői 9.4. Videoállományok tömörítése 9.5. Videoállomány tömörítési eljárások 4
1. Multimédia 1.1. Médium fogalma: Az információk terjesztésére és bemutatására szolgáló eszközök. Pl.: nyomtatott szöveg, kép, grafika, beszéd, zene, videó. A művelés, közvetítés, kifejezés eszköze. A tömegtájékoztatás gyűjtőneve. 1.2. Média: A médium többes száma. Több médiumot jelent. Multimédia: Sok-sok médium. A multimédiát független információelemek számítógép-vezérelt, integrált előállítása, célorientált feldolgozása, bemutatása, tárolása és továbbítása jellemzi. A multimédia szó tágabb értelmezésben egy kreatív alkotó közeg, olyan rendszert definiál, amely biztosítja az egyén vagy csoportok számára a különböző struktúrában (kép, grafika, mozgókép, hang, írott szöveg, adatállományok, stb.) rögzített, nem szükségszerűen egy adatbázisban lévő digitális információ interaktív elérhetőségét, annak a felhasználás helyén történő rögzítését, átstrukturálását, bővítését. A cél tehát az ember információval történő magas színvonalú kiszolgálása, a hatékonyság érdekében lehetőleg minden érzékszervre egyidejűleg gyakorolt ingerekkel. A médiumok besorolhatók időfüggetlen (pl. szöveg, ábra) és időfüggő (hang, mozgókép) kategóriákba. 5
2. A Multimédia alkalmazások alkotóelemei 2.1. Szöveges alkalmazások: A közlendő információ szövegesen jelenik meg. Létrehozás: Legyen: Hagyományos (begépelés) Beolvasás (lapolvasó) Előbb kép, majd OCR (Optical Character Recognition) karakterfelismerés. Tömör, lényegre törő, átlátható. Kiemelések, hyperlinkek alkalmazása. 2.2. Hangállományok: A hatás javítása érdekében a multimédia alkalmazás keretein belül, hangállományt is el lehet helyezni. Digitális, lehetőleg tömörített állapotban. Feltétel, hogy a számítógépben legyen hangkártya és hangszóró. Jellemzi: Tömörítés Hangcsatornák száma o Mono 1 csatorna o Sztereo 2 csatorna o Dolby 4.1, 5.1 csatorna o Theatre 7.1 csatorna Analóg hang Hangkártya Digitális hang 2.3. Grafikus objektumok: Általában a szöveges részeket egészítik ki járulékos információkkal. Létrehozásuk: Lapolvasóval beolvasás Fényképezőgép Rajzoló, képszerkesztő programok A legelterjedtebb grafikus formátumok: BMP, TIF, GIF, JPG, PNG A formátumokat a képpontszám, a színkezelés és a tömörítés jellemzi. Grafikus kártya Monitor viszonya!? 6
2.4. Videoállományok: (videó, mozgókép) Videoállományokat elhelyezhetünk szöveges állomány kiegészítésére, pl. bemutató készítésénél figyelemfelkeltés. A videót szinkronban működő hang és mozgókép jellemzi. Videoállományok jellemzői: Videokártya: Digitalizálás: Képméret (szélesség * magasság) Képkocka / másodperc Színkezelés Tömörítés Hangcsatornák száma D A átalakítás (CRT) D (TFT) A D átalakítás 7
3. Multimédia alkalmazások jellemzői: 3.1. Idődimenzió: A szolgáltatott információ időbeli jellege szerint megkülönböztetünk: Időfüggetlen médiumokat (szöveg, állókép) időben állandó érték. Időfüggő médiumokat (hang, videó) időben változó érték. 3.2. Adatfolyam: Adatok, csomagok sorozata. Így a pillanatnyi (időponthoz kötött adatérték) változik (pl.: hang, videó, animáció, fényreklám, stb.). Van-e az adatfolyam átvitelének időbeli megkötése? Nincs aszinkron átvitel: Az adatcsomagok a vevőhöz időbeli megkötés nélkül jutnak el. Van szinkron átvitel: A csomagok a végpontok közötti maximális késleltetés mellett jutnak el a vevőhöz. 3.3. Valós idejű működés: Minden multimédia rendszer valósidejű, ha a folyamatos adatfolyamok valós időben történő feldolgozása lényeges szempont. A valós idejű rendszernek minden eseményt fogadni kell, időben fel kell dolgozni és időben vissza kell küldeni az adatokat. Kritikus időtartamok: T(eseményre reagálás) + T(feldolgozás) + T(válasz) A feldolgozás eredményének egy szigorúan szabályozott időtartamon belül (kritikus idő) az igénylő rendelkezésére kell állnia. Pl. Hangállományoknál a természetes beszéd dinamikájának (időben változó érték) megfelelően kell a hang adatfolyamot szolgáltatni a hangkártyának a hangszóróhoz. Fontos: Az átvitel és a feldolgozás sebessége. Megfelelő feldolgozási kapacitás. Tömörítés alkalmazása (kódolás dekódolás) 8
4. Egy multimédia számítógép hardvere Egy multimédia rendszerben legyen nagy számítási teljesítmény, legyen a busznak nagy átviteli sebessége és tartalmazza a multimédia-alkalmazások használatához szükséges perifériákat. Ma általában egy hagyományos munkaállomás nagyfelbontású színes képernyővel, 3D grafikus kártyával, hangszóróval és mikrofonnal, CD-ROM-mal, audió- kártyával. (+ digitalizálókkal, stb.) 4.1. CPU jellemzői: Típusok Sebesség [MHz, GHz] Címsín [32 64 bit] Adatsín [32 128 bit] Memória processzor sebesség Kevesebb célhardver, nagyobb processzor teljesítményt igényel! 4.2. Operatív memória jellemzői: Típusok (RAM EDO, SDRAM DDR-SDRAM, DDR II, RAMBUS, stb.) Sebesség [MHz] 100, 133, 266, 333, 400, 533, 600, stb. Méret [MB, GB] 512-4.3. Belső sínrendszer: Nagymennyiségű adat gyors továbbítását kell lehetővé tenni a számítógép egyik részegységétől, perifériától a másik részegységig, perifériáig. A számítógép az adatokat a belső sínrendszerén továbbítja, amely párhuzamosan futó vezetékek együttese. Részei: Adatsín Címsín Vezérlő sín A belső sínen az adatátviteli sebességet meghatározza: A sín sebessége [Hz, bit / secundum] A sín szélessége: egyszerre mennyi adatot tud továbbítani. 9
4.4. Sínrendszerek: PCI: o 32 bit széles címsín o 32 bit adatsín o átviteli sebesség 33 MHz AGP (Accelerated Graphics Port Gyorsított Grafikus Port): Az AGP nagysebességű interfész a központi memória és a videoprocesszor között. Mivel csak két eszközt kapcsol össze, igazából nem tekinthető busznak. A processzor és a grafikus kártya közötti adatátviteli sebesség növelése miatt hozták létre. Részei: Videoprocesszor (sebesség) Videomemória (méret, sebesség) Az AGP elválasztja a grafikus kártyát a többi perifériától Szorzó sebesség sávszélesség szélesség 2* 66 MHz 254,3 MB/s 32 bit 4* 133 MHz 8* 266 MHz USB 1-2: o A perifériák felfűzhetők o Plug and play o USB 1.1: 1,5 MB/s; 12 MB/s o USB 2: 480 MB/s FireWire 1-2: o Főleg videorekorderek csatlakoztatása. o 1-es: 400 MB/s o 2-es: 800 MB/s 10
4.5. Monitor Grafikus kártya Monitor. A megjelenített kép minősége függ a monitortól. A monitor lelke a katódsugárcső, amelyben elektronágyúk találhatók. A monokróm monitorban egy, a színesben három. Minden elektronágyú elektronsugarat bocsát ki, mellyel bombázza a monitor belső falát borító foszfor réteget. Az így gerjesztett foszfor fényt bocsát ki. Három különböző foszforanyagot használnak. Egyet-egyet a piros zöld kék szín számára. Minél nagyobb az elektronsugárba csapódó elektronsugár intenzitása, annál erősebben villan fel a foszfor és annál erősebb fényt bocsát ki. Az egységnyi elrendezésben lévő három különböző típusú foszfor által kibocsátott színek keveréke adja az adott területen megjelenő színt. Azonos erősségű R, G, B fényerőnél, különböző intenzitásnál szürkeárnyalatos színeket kapunk. Különböző színeket az R, G, B elektronágyúk különböző intenzitásainál kapunk. Az elektronsugár képpontonként (3 szubpixel) halad, balról jobbra és fentről lefele. Egy eltérítő-egység változtatja az elektronsugarak hajlásszögét. A bal felső sarokból a jobb alsó sarokig haladva kirajzol egy képet. Interlaced (váltósoros) letapogatás Non interlaced (sorfolytonos) letapogatás Miután a pásztázó elektronsugár elhagyta a foszforpontot, a foszfor rövid ideig még világít, ez az utánvilágítás. Miért zavaró ez a játékoknál? A teljes képet kirajzolása után, az elektronika újra kezdi a rajzolást a képfrissítési frekvenciának megfelelően. Képfrissítési frekvencia: [kép / sec] A pixel (picture element képpont) a képernyő legkisebb megvilágítható része. Színes technikában egy pixel 3 alpixelből áll az R, G, B színeknek megfelelően. A képernyő felbontását a képpont mérete és a képernyő nagysága határozza meg. Minél kisebb a képpont, annál több fér el egy adott nagyságú képernyőn, és annál finomabb felbontású képet kapunk. CRT: 0,31; 0,28; 0,21 11
4.6. Grafikus kártya: A számítógépből érkező digitális jeleket a grafikus kártya fogadja. A kártya az átvett analóg jelekből a digitál analóg átalakító (DAC Digital Analóg Converter) segítségével analóg jeleket alakít ki. A színes grafikus kártya három DAC-ot tartalmaz (R, G, B). A digitális analóg áramkörök az egyes színekhez tartozó digitális jelekből a színnek megfelelő analóg jeleket állít elő, és ezek vezérlik a monitorok elektronsugarainak intenzitását. A grafikus kártyák alapvető jellemzői: Felbontás: Felbontás Megjeleníthető színek száma A képernyőn függőleges és vízszintes irányban megjeleníthető képpontok számát határozza meg. Adott képpont-méretnél, minél több a képpontok száma, annál nagyobb a kép. Színmélység: Felbontás pixelek száma 640*480 307200 800*600 480000 1024*768 786432 1280*1024 1310720 1600*1200 1920000 1.9 Mpixel A képpontokhoz tartozó színinformáció mennyisége határozza meg a képen megjeleníthető színek számát. A színek száma a színmélység, ami nagyban függ a grafikus kártyától. A grafikus kártya a videomemóriájában tárolja a képpontok színinformációit. Minél nagyobb a videomemória, annál több színinformációt lehet tárolni. Egy képpont színinformációja 1,2,4,8,16,24,32 hosszú lehet. A videomemória mérete korlátozhatja a választott felbontáshoz tartozó színmélységet. 1600*1200, 24 bit 6 MB memória szükséges. Grafikus kártya szabványok: A szabványban meghatározzák a monitor felbontását és színmélységét. Pl.: EGA, VGA, SVGA, XGA, SXGA, WXGA, stb. 12
4.7. Lapolvasók: A lapolvasó papír- vagy diahordozón található szöveget vagy ábrát bittérképes, digitális formában olvas be a számítógép memóriájába. Digitalizáláskor a lapolvasó a hordozón található információt, sűrű beosztású rácsozattal kis területekre, képelemekre bontja. Majd a képelemekhez hozzárendel egy, a képelem színétől és a lapolvasó színmélységétől függő értéket. Ez az érték a lapolvasó működésétől függően 1-24 bit lehet. A lapolvasók nem különböztetik meg a szöveget és az ábrát, mindkét fajta információt bittérképes formában olvassák be. A beolvasott szöveget nem lehet szövegszerkesztővel közvetlenül szerkeszteni, azt előbb egy optikai karakter felismerő programmal karakteres formára kell alakítani. A lapolvasók legfontosabb műszaki paraméterei: Felbontás: A felbontás megadja, hogy a lapolvasó egységnyi hosszon hány képelemet különböztet meg. Általában [dot/inch, dpi] mértékben adják meg, ami az egy inch hosszon (2,54 cm) megkülönböztetett képelemek száma. Értékei: 72 2400 dpi Színmélység: Egy képelem színkódját meghatározó bitek száma. Feketefehér lapolvasók két színt különböztetnek meg, 1 bit. Színes lapolvasóknál ez az érték 24 bit is lehet. Működés: Kézi Asztali 4.8. Hangkártya, hangszóró, mikrofon: Hangkártya: A multimédia számítógép hangkártyájának két fő rendeltetése van. Az első a külső akusztikus analóg jelek digitalizálása, hogy azok hangállományként a számítógép memóriájában vagy a lemezén tárolhatók legyenek. A második a hangállományoknak hangszórón, fejhallgatón vagy MIDI készüléken való lejátszásának biztosítása. 13
A hardver két részre osztható: Az egyik feladata a hangok vétele, digitalizálása, lejátszása. A másik rész zene előállítására szolgál. Az első a hangkártya hangosító hardvere, a másik a szintetizátor része. A hangosító hardvert egy analóg-digitális és egy digitális-analóg átalakító körül alakítják ki. A hangrögzítés legfontosabb adata a mintavételi frekvencia (pl. 44,1 KHz) A mintavételi frekvencia megadja, hogy hangfelvétel készítésekor milyen gyakorisággal vesznek az analóg hangjelből mintákat. Minél nagyobb a mintavételi frekvencia, annál élethűbben lehet az hangot rögzíteni. Viszont ekkor arányosan növekszik a digitalizált hangot tartalmazó hangállomány mérete is. Másik fontos adat a hangminták amplitúdó értékeinek tárolásához használt bitek száma, a kvantálási hossz. Minél több biten (nagyobb felosztású skálán) tároljuk az amplitúdó értékeit, annál pontosabban követi a digitális hangállomány az analóg hang alakját. A 16 bites kvantálási hossz CD minőséget eredményez. A szintetizátor hardverrel jó minőségű hangot lehet előállítani. A hangkártyák több bemenettel illetve kimenettel rendelkeznek: Mikrofon bemenet CD-ROM audio bemenet Hangszóró kimenet MIDI csatlakozó Hangszórók: A hangkártya a hangokat a hangszórón keresztül szólaltatja meg. Hangkártyán van egy kis teljesítményű erősítő, mely fejhallgató megszólaltatására alkalmas. Ha nagyobb teljesítmény szükséges, akkor aktív hangszórókat csatlakoztatnak. Erősítővel ellátott hangszórók. Mikrofon: A hangkártyához csatlakoztatott mikrofonnal lehet beszédet, zenét vagy hangeffektusokat a multimédia rendszerbe beolvasni. 14
4.9. Videokártyák: Feladata a nagy bitsebességű videoállományok digitalizálása és megjelenítése a monitoron. TV technika képmegjelenítési rendszerének és a monitorok képmegjelenítési rendszerének összekapcsolását kell megoldani. A bemeneti oldal analóg (TV, kamera) a kimeneti oldal digitalizált jelsorozat. A videodigitalizáló mintavételi frekvenciája több mint 10 MHz és bitszáma 16-24 bit. Képernyőképenként mintegy 30 MB adatot állít elő (10MHz * 3 MB ~ 30 MB), a videoállomány hossza a másodpercenkénti képváltástól függően (25 Pal, 30 NTSC) 750 MB, 900 MB lehet. Ezt az adatmennyiséget csak tömörítés után lehet megjeleníteni a számítógépen. 4.10. CD technika: CD-ROM: Az információ a lemezen spirálvonalban, az úgynevezett információs sávon szekvenciálisan szektorokba szervezve kerül rögzítésre és a spirálvonalon belülről kifelé haladva helyezkedik el. Az információkat a spirálvonalban lévő lyukak (pit-ek) síkok (land-ek) átmenetei tartalmazzák. A CD lemez keresztmetszeti képe: CD meghajtó: Feladata a lemez írása olvasása. Ehhez: Az író olvasó fejet stabilan a sáv felett kell tartani. A lemez egyenetlenségeit korrigálni kell. Megvalósítás: három sugárnyalábos technikával. 15
A CD technika optikai és elektronikus hibajavítást használ az olvasási hibák elhárítására. A letapogatott információ azért javítható, mert a kódolásnál az információt bőven ellátták hibajavító kóddal. Ez viszont redundanciát okoz. Minden CD-nél a hibakezelést és javítást a CIRC (Cross Interleaved Reed-Solomon Code) eljárás valósítja meg. A CD-ROM meghajtó 3500 bitre kiterjedő csoportos hibát (2,5 mm hosszú karcolás) képes kijavítani. Adatátviteli sebesség: Az információ letapogatása állandó átviteli sebességgel történik (CLV Constant Linear Velocity). 1 * audio CD: 150 Kbit/s A lemezek külső részein a spirálvonal hosszabb, tehát ott több információ található, mint a belső részeken. Ezért folyamatosan csökkenteni kell a lemez fordulatszámát, ahogy az olvasófej az információ letapogatása közben kifelé halad. A lemezt egy szervómotor forgatja, melynek fordulatszámát egy vezérlő elektronika szabályozza. A nagysebességű meghajtók állandó fordulatszámmal is képesek működni CAV (Constant Angular Velocity). Így változik az átviteli sebesség. 24 *-es 5400 ford/perc A puffer és az adatátvitel módja: 2-8 MB A nagyobb puffer kedvező, ha az adatátvitel a DMA-n keresztül valósul meg. A DMA tehermentesíti a CPU-t. CD-DA (audio CD) 120 mm 76-79 perc hosszú 44,1 KHz mintavételezési frekvenciával és 16 bit kvantálási hosszal felvett hangállományt képes tárolni. Lejátszáshoz 172,3 KB/s értékű állandó kerületi sebesség (CLV) szükséges. Hibakezelés CD-DA (digital audio) hibakezelése 1 szektorban 1/75 sec alatti adatátvitel 3234 információ byte 8*3234 = 25852 byte. 16
Ezt 17*3234 = 54978 csatornabit rögzíti a lemezen. Tehát szektoronként 8*2352 = 18816 bit hangadatot 54978 csatornabit tárol 34% felhasználói adat. CD-ROM Mode 1 1 szektorban 3236 byte (54978 csatornabit rögzít), ebből 2048 byte (8*2048 = 16384 bit) hasznos. A lemez 30%-a hasznos adat. CD-ROM Mode 2 Tömörített audio, video, kép. 1 szektorban 3234 byte, ebből 2336 byte hasznos. Kisebb biztonság. 4.11. DVD- technika: DVD lemezek: A DVD egy 2*0,6 mm vastag összeragasztott polikarbonát lemez. Mindkét hordozó tárolhat mindkét oldalán információt. DVD 5 egy oldal egy réteg 4,7 GB DVD 9 egy két 8,5 GB DVD 10 két egy 9,4 GB DVD 17 két két 17,0 GB A CD lemezeknél az információt a lemezek felső részén tárolják, míg a DVD lemezeken az információs réteg a lemez közepén található, mert biztosítani kell a kétoldalas tárolási lehetőséget. Az egyszeres sebességű DVD meghajtó 1250 Kbit/sec átviteli sebességet ad. 17
5. Szöveges alkalmazások A megjelenítendő szöveg formájának megalkotása során felmerülő kérdések: Mekkora szövegmennyiség fér egy képernyőoldalra anélkül, hogy zsúfolttá, nehezen olvashatóvá válna a képernyő? Hogyan célszerű a megjelenítendő információkat csoportosítani? Hogyan kell a szöveget kialakítani, hogy az a képernyőn szépen nézzen ki és a szöveg egyhangúságából, kiemelkedjenek azok az információk, amelyeket ki szeretnénk emelni? 5.1. A szöveg elkészítésének menete: A szöveg megfogalmazása és beírása a számítógépbe valamilyen szövegszerkesztő segítségével. A szöveg formázása, ami a szövegnek képernyő oldalakra bontásával kezdődik, majd kiemelések elvégzése. Az elkészült szöveg beépítése a multimédia alkalmazás megfelelő helyére. 5.2. Szövegbevitel lapolvasóval: Nyomtatott szöveg [digitalizálás] bittérkép, képfájl [OCR karakterfelismerés] szerkeszthető szövegfájl. A formázás többé-kevésbé megegyezik az eredetivel. A beolvasott fájl mérete: A lapolvasó felbontása és a színkezelés mértéke határozza meg a beolvasott adat mennyiségét. A lapolvasó vízszintes irányban minden sorban a felbontás által meghatározott számú képelemet olvas be, míg függőleges irányban az egységnyi hosszon beolvasott sorok száma megfelel a felbontás által meghatározott értéknek. A4-es (210 mm * 297 mm) papírlap beolvasásánál a képelemek száma: 210*297* (lappolvasó felbontása * lapolvasó felbontása) /25,4*25,4 300 dpi-nél 8700632 képelem 1 bites színmélységnél 8700632:8 = 1087579 byte 18
5.3. Az OCR programok működése: Az OCR programok a memóriában található képelemeket vizsgálva próbálják eldönteni, hogy egy-egy képelem milyen karakternek felel meg. Ez a művelet a felismerés. A két leggyakrabban használt felismerési eljárás: Összehasonlítás: Az OCR program a képelemet a karaktereknek a háttértárban tárolt mintaábrájával hasonlítja össze, hogy felismerje azt a mintaábrát, ami leginkább hasonlít a képelemhez. A mintaábra karakterkódja a felismert karakternek a kódja. A módszer hátránya a betűtípus és betűméret függőség, ami jelentősen befolyásolja a felismerés pontosságát. Körvonalelemzés: Az OCR program a képelemek körvonalelemei méretének, illetve arányainak elemzésével határozza meg a képelemekhez rendelhető karakterek kódját. Ez a módszer a betűtípustól és a betűmérettől független felismerést biztosít. 5.4. Szöveg a képernyőn: Esztétikus és ergonómikus elrendezés! 1. Betűtípusok, betűméret: Legyen a szöveg elég nagy méretű. Ne legyen kettőnél több betűtípus egy képernyőoldalon. Ne legyen túl sok szöveg egy képernyőoldalon. 2. Szövegstílusok: Javítani lehet a kinézetet. Ritkán szabad csupa nagybetűből álló szöveget készíteni. A képernyőn félkövér betűkkel emeljünk ki, ezek feltűnőek és jól olvashatóak. Az árnyékolt szöveg, változatos jól olvasható. A keretezés javítja a szöveg olvashatóságát. Használhatunk karakterek közötti változó távolságot. 3. Háttér: Igazodjon a tartalomhoz és a stílushoz. Ne rontsa az olvashatóságot. 19
4. Színek: Kontrasztdús színkombinációkat célszerű használni az előtérben illetve a háttérben lévő elemeknél. Ne legyen túl sok szín egy képernyőoldalon. Ne csak színekkel különböztessünk meg képelemeket. A színek hangulatot, benyomást közvetítenek. Kerüljük a telített színeket, vakítanak! Figyelembe kell venni a színvakokat, színtévesztőket. 5.5. Objektumok csatolása és beágyazása: Objektumként be lehet ágyazni egy dokumentumba egy másik program által készített eredményt. Ezt az OLE (Object Linking and Embeding) technika teszi lehetővé. Forrásdokumentum: ahonnan a beágyazandó objektum származik Céldokumentum: ahová az objektum beszúrásra kerül. Win95 óta a céldokumentumban lehet az OLE objektumot szerkeszteni. Ha kétszer kattintunk a beszúrt objektumon, akkor a céldokumentumon belül aktiválódik az OLE-szerver, vagyis az a program, amellyel az objektum készült. Ekkor az objektum elkészítésekor használt jelhasználói felületen keresztül szerkeszthetjük. Objektumcsatolás: Olyan eljárás, melyben az objektum a forrásdokumentumban marad. A céldokumentumba egy, a forrásdokumentumra vonatkozó referencia kerül beszúrásra. Így nem nő a fájlméret a csatolt objektummal, de a hordozhatóság korlátozott lesz. A céldokumentum nem helyezhető át másik számítógépbe. Az objektum csak a forrásdokumentumban módosítható, megjelenése a forrás- és a céldokumentumban azonos. Objektum beágyazás: Egy céldokumentumot, melybe beágyaztak egy objektumot, problémamentesen lehet egy másik számítógépre áthelyezni, mert a céldokumentum tartalmazza a teljes objektumot. Így nő a céldokumentum mérete. Az objektum a forrásdokumentumban és a céldokumentumban egymástól függetlenül módosítható. 20
6. Világháló (Internet, WWW): Az Internet vagy rövidebb nevén Web az a médium, ami lehetővé teszi az információnak az egész világon való terjesztését. Internet őse USA ARPANET csomagkapcsolt. Katonai intézmény egyetemek, kutatóközpontok, könyvtárak. Internet CERN 1989 kutatásokat segítő globális információs rendszer. Az Internet helyi hálózatok összessége. A helyi hálózatok eltérő felépítése, operációs rendszere és egyéb sajátosságai miatt ki kellett dolgozni a kommunikáció szabványait, amit az RFC (Request For Comments) dokumentumok tartalmaznak és a különböző hálózati protokollok valósítanak meg. Az adatforgalmat a helyi hálózatokban lévő átjárók (gateway s) bonyolítják le. A gateway az adatforgalmat a Web felé TCP/IP protokoll szerint valósítja meg. Mivel az Internet központi számítógép nélkül működő, önszervező rendszer, nincs lehetőség arra, hogy a rajta folyó tevékenységet lehetetlenné tegyék, korlátozzák vagy cenzúrázzák. Az Internet a kliens-szerver modell alapján működik. Egyik eleme a Web-szerver, egy számítógép, ami háttértárjában információkat: szöveget, adatokat, képeket, hangokat stb. tárol. A Web-szerver funkciót egy program valósítja meg, ami azon a számítógépen fut, ahonnan információkat kell a kliens számára továbbítani. Az Internet kliens egy olyan számítógépes program, ami kapcsolatot tart a Webszerverrel. Egyik funkciója alapján böngészőnek is nevezik. A Web alkalmazások HTTP (Hypertext Transmission Protokol) alapján kommunikálnak egymással. Ezért minden Web-szervernek és kliensnek ismernie kell ezt a protokollt. 6.1. Internet szolgáltatások: Az Internetnek mint csomagkapcsolt hálózatnak a szolgáltatásait a Webszerverek különböző protokollokkal valósítják meg. A leglényegesebb protokollok: e- mail, www, ftp, gopher, telnet. 21
6.2. HTML: Az Internet szabványos nyelve a HTML (Hypertext Markup Language), amellyel hypermédia dokumentumokat lehet előállítani. A HTML felhasználásával létrehozott dokumentumok egyszerű alfanumerikus szövegfájlok, amelyekben formátumvezérlő utasítások vannak. A HTML horgokat használ a hypermédia kapcsolatok leírására. A horgok használatával nyílik lehetőség arra, hogy egy hypermédia dokumentumban egy másik hypermédia dokumentumra hivatkozzunk, és elérjük azt. 6.3. Hypertext: Egy dokumentumot olvashatunk az elejétől a végéig is, de olvashatjuk részleteiben is. A dokumentációk gyakran viszonylag független egységekből állnak, melyekben sok kereszthivatkozás van. A kereszthivatkozásnál a hivatkozott helyet a dokumentumban meg kell keresni. Ilyen esetekben az információknak elektronikus úton történő összekapcsolása nagyon hasznos lehet. A kereszthivatkozások gyors elérésének biztosítására a dokumentumokba olyan lehetőségeket építenek be, melyekkel az alkalmazó elérheti a hivatkozott szövegrészt. Ezek a lehetőségek biztosítják, hogy az alkalmazó az általa kívánt sorrendben olvassa végig a dokumentumot. A hypertext dokumentum lényegében egy olyan szöveg, melyben kereszthivatkozások lehetnek. A hivatkozások kiindulópontjai csomópontok, melyekhez más információegységek vannak csatolva. Az egyetlen különbség egy normál és egy hypertext szöveg között az, hogy az utóbbi szöveg olvasója a képernyőn rámutathat egy csomópontként viselkedő információegységre, és ennek hatására a képernyőn megjelenik egy, a csomóponthoz tartozó önálló tartalmú információegység. A hypertext dokumentumban ezek a szövegrészek a készítő által meghatározott korláton belül, bármilyen sorrendben elérhetők. 6.4. Hypermédia A hypermédia dokumentum általánosított hypertext dokumentum, ami a szöveg mellett tartalmazhat képeket, audió és videó klippeket, animációkat. áll: A hypermédia dokumentum struktúrája egy gráf, mely csomópontokból és élekből A csomópontok a tulajdonképpeni információegységek. Lehetnek: szöveg, kép, hang, videó, stb. 22
Az élek létesítenek kapcsolatot a különféle információegységek között. Ezeket linkeknek vagy hivatkozásoknak szokás nevezni. A link legtöbbször egy irányított él. A hivatkozások kiindulópontja a horog (URL: Uniform Resource Locator). A horoggal lehet egy hypermédia dokumentumban egy másik hypermédia dokumentumra hivatkozni, illetve elérni azt. 6.5. Kép, hang és videoállományok az Interneten Az Interneten az átviteli sebesség figyelembe vétele mellett kell az állományok méretét meghatározni. 1 perc CD minőségű sztereó hang: 10584000 byte, 64 Kbites letöltés esetén 2,75 perc. A hang, kép és videoállományok viszonylag nagy mérete és a korlátozott letöltési sebesség miatt, tömörítést alkalmaznak. Tömörítés: Képfájlok: Veszteséges Veszteségmentes GIF fájl: Veszteségmentesen tömörített, maximum 8 bit színinformáció. Elsősorban vonalas rajzoknál, kevés színt, nagy egy nagy egyszínű foltokat tartalmazó képeknél célszerű alkalmazni. JPG fájl: Veszteséges tömörítés, maximum 24 bit színinformáció. Jó Videoállományok: minőségű színes képeknél alkalmazzák. Nagy méretűek. Az állományok méretét alapvetően befolyásolja a használt képméret, képváltási frekvencia. Az Interneten általában MPEG4 eljárással tömörített videoállományokat használnak. 23
7. Digitális hangtechnika A hang a multimédia alkalmazások elválaszthatatlan integrált részét alkotja. 7.1. A hang fizikai jellemzői: A hang mechanikai rezgés, ami valamilyen anyagi közegben terjed. A mindennapi életben hallott hang a levegő molekuláinak a hangforrástól kiinduló, egyre csillapodva terjedő mechanikai rezgése. A hang nemcsak levegőben, hanem egyéb rezgésre hajlamos rugalmas közegben is létrejöhet. A hangforrás közelében a rezgést továbbító levegő részecskéinek elmozdulása miatt nyomásingadozás keletkezik, ami átterjed a szomszédos részecskékre és így a levegőben tovaterjedő hanghullámok jönnek létre. A hang terjedési sebessége normál páratartalmú 15 C-os levegőben 340 m/s, szilárd anyagokban és folyadékokban ennél is nagyobb. 7.2. A hang érzékelése: A hang érzékelése, vagyis a hallás, az embert körülvevő közegben (levegőben) fellépő nyomásingadozások érzékelése. Az emberi hallószerv által érzékelhető hangok frekvenciája általában 16 Hz és 20 KHz közé esik. A kisebb rezgésszámú hangokat mélyebb, a nagyobb rezgésszámú hangokat pedig magasabb hangként érzékeli. Az érzékelt hangmagasság a hang frekvenciájától függ, bár kis mértékben befolyásolja a hangerősség is. 16 Hz alatti hang infrahang 20 KHz feletti hang ultrahang Az emberekben ezek nem keltenek hangérzetet. 7.3. Akusztikai alapfogalmak: Az emberi hallás jellemzőivel foglalkozik. Érzeti tulajdonságot fejez ki, hogy hangosan beszélsz (hangerő), mély a hangod (hangmagasság), vagy fakó a hangod (hangszín). Hangerő (hangintenzitás) a hangrezgés amplitúdója. Egyenesen arányos a hangnyomással, fordítva arányos a közvetítő közeg sűrűségével és az adott közegben a hang terjedési sebességével. Mértékegysége az egy négyzetméterre eső wattban mért hangteljesítmény. A hangerő és a hangnyomás leírására használják az akusztikus decibel 24
(db) fogalmat. Az akusztikus decibel értéke alkalmazkodik az emberi hangérzékeléshez. A hangerő nagyság tízes alapú logaritmusának húszszorosával egyenes arányban növekszik. A hallásküszöb 0 db a fájdalomküszöb 120 db. Hangmagasság a hang frekvenciájától függ. Ha a hangforrás csak egyetlen frekvenciájú hangot sugároz, akkor ezt a hangot tiszta hangnak nevezzük. Magányos szinusz rezgések a természetben nincsenek, a valóságban előforduló természetes hang fizikai szempontból több, különböző frekvenciájú és amplitúdójú szinusz rezgések összessége. A magányos szinusz rezgéseket részhangnak hívják. A folytonosan változó természetes hang különböző frekvenciákon rezgő részhangokból áll. Egy természetes hang részhangjainak összessége a hang frekvencia spektruma. A mélyebb részhang határozza meg a természetes hang alapfrekvenciáját. A további részhangok frekvenciái általában az alaphang frekvenciájával kapcsolatban álnak, legtöbbször annak egészszámú többszörösei. A természetes hangok további összetevői a felhangok. Ezeknek összetétele, amplitúdója és fázisa határozza meg a természetes hang hangszínét. Ha a felhang frekvenciája az alaphang frekvenciájának valamilyen egész számú többszöröse, akkor felharmonikusnak is szokták hívni. Az alaphang és a felhangok eredője határozza meg a természetes hangjel frekvenciatartományi viselkedését, amit az eredő hangjel burkológörgéje szemléltet. Tehát a hangszín az adott hangjel frekvenciatartományi viselkedése: sávszélessége, burkoló görbéje, a különböző frekvenciájú hangok amplitúdó és fázis viszonyai. 7.4. A hang rögzítése: Nem más, mint a levegőben keletkező nyomásingadozások tárolása az újbóli előállítás céljából. A nyomásingadozásoknak, vagyis a hangjeleknek valamilyen információhordozóra történő rögzítése. 25
Rögzítés: Lejátszás: A hangjel átalakítása rögzíthető elektromos jelformára, melyben a jel frekvenciái és intenzitásai megfelelnek az eredeti hangjelnek. Az elektromos jel rögzítése. A rögzített jelek érzékelése, elektromos jellé alakítása. Az elektromos jel felerősítése és visszaadása az eredeti hangjelhez hasonló alakban. A rögzítés történhet: Analóg Digitális formában. 7.5. A hangok digitális rögzítése és lejátszása: Eredeti formájukban a hangok analóg, időben és értékben folytonos jelek. A hangok digitális rögzítésekor az eredeti analóg hangjelekből mintákat vesznek, emiatt a mintavételezett hangjel időben és értékben nem folytonos, hanem egymástól elkülönülő impulzusok sokaságából áll. A mintavételezett impulzusok amplitúdó értékét bináris formában megadva, megkapjuk az analóg hanganyag digitális megfelelőjét, ami elkülönülő (diszkrét) minták sorozatából áll. Mintavételezés: Mintavételezéskor időben és értékben folytonos analóg hangjelekből impulzussorozatot állítunk elő. Ebben az impulzussorozatban minden egyes impulzus amplitúdója azonos az analóg jelnek az adott ponton felvett értékeivel. Shanon tétele: A mintavételezett jelből akkor lehet az eredeti jelet információveszteség nélkül visszaállítani, ha a mintavételezési frekvencia értéke legalább kétszerese az eredeti analóg jelben előforduló legnagyobb frekvenciának. A gyakorlatban ezt nem használják. telefontechnika MPEG audio 32 8 KHz CD-DA 44,1 DAT, Dolby Digital 48 26
Kvantálás: A mintavételezett impulzussorozat impulzusai végtelen sok értéket vehetnek fel, ezért ez a jelsorozat analóg impulzussorozatnak tekinthető. Az amplitúdók digitális jellé történő átalakítását, az analóg-digitális átalakító (A/D konverter) végzi. Az A/D konverter bemenetére vezetet impulzusok bináris adatokká átalakítva jelennek meg a konverter kimenetén. Az A/D konverter meghatározott számú bitet használ a kimenő jel amplitúdójának megadására. Az analóg bemenőjel amplitúdó értékének digitális ábrázolásához létrejövő szóhossz a szóban található bitek számától függ. Ezt a bitszámot nevezzük kvantálási hossznak. Minél finomabb felbontású a kvantálás (minél több lépcsője van), tehát minél hosszabbak (minél több bitből állnak) a kódszavak, annál pontosabb képét adja az eredeti analóg jel amplitúdójának. Általában 8 illetve 16 bites kvantálási hosszat alkalmaznak. 8 bittel 256 féle adatszó 48 db átfogható hangerő tartomány 16 bittel 65536 adatszó 96 db 7.6. Minőség Digitalizált hangállomány minőségén azt értjük, hogy milyen hibával lehet a mintavételezett és kvantált jelsorozatból visszaállítani az eredeti analóg hangot. 7.7. Digitalizált hangállomány mérete: A méretet a következő három paraméter befolyásolja: Mintavételezési frekvencia értéke. A kvantálási hossz. A rögzített hangcsatornák száma. A mintavételezési frekvencia értéke és a kvantálási hossz meghatározza az analóg hanganyagról a digitalizált hangállományba rögzített információ mennyiségét. Minél több információt rögzítünk, annál pontosabban írja le a digitalizált hangállomány az eredeti hangállományt, azonban annál nagyobb lesz az állomány mérete. A rögzített csatornák száma határozza meg, hogy milyen felvétel készül. Méret: mintavételezési frekvencia [Hz] * kvantálási hossz [bit] * csatornaszám * idő [sec] :8 = [byte] 27
Pl.: 44,1 KHz 16 bit sztereó 1 sec hangállomány hossza: 44100*16*2*1:8 = 176400 byte 7.8. Hangfelvétel készítése: Hangfelvétel készíthető a hangkártya mikrofon bemenetére csatlakoztatott mikrofonról, a line in bemenetére csatlakoztatott erősítőről, esetleg a számítógép CD- ROM meghajtóról. Mikrofon típusai: Irányított Gömbkarakterisztikájú 7.9. Hangállomány tömörítése: Digitális hangállományokat digitalizálással állítunk elő analóg hanganyagokból. Egy digitális hangállomány hossza a mintavételi frekvenciától, a kvantálási hossztól és a csatornaszámtól függ. A CD lemezeken használt 44,1 KHz, 16 bites hangállomány hossza csatornánként és percenként 5,048 Mbyte. Ezt nehéz gazdaságosan tárolni és továbbítani. Tömörítés szükséges. A digitális hangállományok méretét az ISO egyik albizottsága az MPEG (Motion Picture Expert Group) által kidolgozott új digitális kódolási eljárással lehet csökkenteni. MPEG audio: Veszteséges tömörítési eljárás, ami kihasználja az emberi fülnek az érzékelési tulajdonságait. Még 1:12 tömörítési arány mellett is CD hangminőséget biztosít. Az MPEG audio eljárás két részre osztható. A kódolás alkalmával a wav fájlban található hangállományból tömörített bitfolyam, kódolt hangállomány készül. Ezt a hangállományt a hangkártyák dekódolás után képesek megszólaltatni. A dekódolás során a tömörített bitfolyamból wav fájl készül. A kódoló algoritmus az ember hallószervének működése alapján elemzi a hangadatokat és törli a lényegtelen és redundáns részeket. Kódoláskor az eljárás egy pszichoakusztikus modell szerinti szűrőbank számítással elemzi a hangadatok spektrális alkotóelemeit és meghatározza az érzékelhető zajszintet. A kódoló nem épít be a kódolt bitfolyamba redundáns, lényegtelen, csak zajnak tekinthető hangelemeket. 28
A tömörítési és a bitsebesség között szoros kapcsolat van. A tömörítést a bitsebességnél nehezebben lehet mérni, ezért az MPEG audio eljárással kapcsolatos információkban a bitsebesség szerepel. Az MPEG audio eljárás három réteg (layer) szerinti tömörítés közötti választást tesz lehetővé. Az egyes rétegekben különböző tömörítési arány és bitsebesség érhető el. Layer 1: A legegyszerűbb eljárás. 128 Kbit/s bitsebesség esetén használható. Layer 2: Közepes bonyolultságú eljárás. 128 Kbit/s bitsebesség körül használható. Layer 3: A legbonyolultabb eljárás. A legjobb hangminőséget 64 Kbit/s bitsebességnél biztosít csatornánként. Ez az MP3 eljárás. MPEG audio Layer 3 (MP3): A család leghatékonyabb tagja. Megadott hangminőség esetén a legkisebb bitsebesség érhető el vele, azaz egy adott bitsebességhez vele érhető el a legjobb hangminőség. 7.10. Környezeti hangtér: Cél az életszerű térbeli hanghatás elérése. A Dolby Laboratories cég: 1970-es évek vége: Dolby Stereo, Dolby Sorround 4 csatorna, 5 hangszóró: bal, közép, jobb, és két közös hangcsatornás környezeti (Sorround) hangszóró. 1992 Dolby Stereo Digital: (D.S.D.) 29
Dolby Digital (AC-3) 5.1: (D.D) RS, R, C, C, LS egyenrangú csatornák, 20 Hz 20 KHz közötti frekvenciatartományban. LFE opcionális (Low Frekvency Effects) alacsony frekvenciás hatások 20 Hz 120 Hz A D.D rendszer lebontás jellegzetessége lehetővé teszi, hogy D.D dekódoló után a csatornaszámtól függően hangszóróval lehet megszólaltatni az 5.1 csatornás D.D. bitfolyamot. A dekódoló valósidőben állítja elő a D.D., D.S.D. keverék, sztereó vagy mono hang kimenőjelét. 30
8. Grafikus alkalmazások, animáció 8.1. Az emberi látás informatikai vonatkozásai: Két előrenéző szem miatt térlátás. Az ember nem képes egymással 2 szögpercnél kisebb szöget bezáró pontszerű fényforrásokat megkülönböztetni. Eltérő színű fényforrások színeit már 10 szögperc alatt sem tudjuk megkülönböztetni. Az ember által kellemesnek tartott képek oldalarányai 4 : 3. Folyamatos mozgás érzékeléséhez 20 30 képváltás elégséges másodpercenként, de csak akkor lesz villogásmentes az élmény, ha a képfrissítési frekvencia 50 Hz-nél nagyobb. 8.2. Színlátás: 400 nm 700 nm közötti hullámhosszúság 400 nm körüli fények ibolya színűek 700 nm körül vörös < 400 nm ultraibolya > 700 nm infravörös. Az emberi szem két fényt nemcsak akkor lát azonos színűnek, ha a fények spektrális összetevői megegyeznek, hanem bizonyos feltételek mellett eltérő frekvencia spektrumú színeket is. Az azonos színűnek látott, de eltérő frekvencia spektrumú fényeket metamer színeknek nevezzük. Az emberi szem fogyatékossága miatt majdnem az egész színtartományt be lehet mutatni három, egyfrekvenciás (egyszínű) fényforrások színeinek keverésével. A mai megjelenítők (TV, monitor) a színes kép előállítására, három egyfrekvenciás fényforrást használnak: R, G, B 8.3. Szín-koordinátarendszerek: A képpont színét a képernyő vörös, zöld, kék színű képpontjaiból kilépő színes fények eredő fényereje határozza meg. A kilépő fények fényerejét és ezzel a képpont színét a képpont kódok határozzák meg. A szín koordinátarendszer a színekre vonatkozó információkat szolgáltató háromdimenziós koordinátarendszer. 31
RGB szín-koordinátarendszer: Az egyes tengelyek R, G, B színűek. A vörös, a zöld és a kék alapszín jeleit külön-külön tartalmazza. Minden más szín ezen három alapszín additív (összeadó) keverésével állítható elő. fehér: R+G+B = 1 fekete: R+G+B = 0 Azonos intenzitás esetén szürkeárnyalat. YUV szín-koordinátarendszer: Számítás: Y = 0,3 R + 0,59 G + 0,11 B U = (B Y)*0,493 V = (R Y)*0,877 A PAL és SECAM TV rendszerek mellett a kép- és videoállományok tömörítésében (jpeg, mpeg) használják. Y a világosságkód (luminancia). U, V a színkódok (kominancia) 8.4. A számítógépes grafika: Illusztrálható velük szöveg, felhasználhatók az egyes szövegek magyarázataként, de készíthető velük multimédiaalkalmazások számára animáció. Állóképek létrehozhatók: Rajzolóprogrammal, Digitális fényképezőgépből beolvasással, Lapolvasóval fényképről, Digitalizálással, konverzióval egyéb médiumból (video). Bármilyen módon hoztuk létre az állóképet, az a képernyőn mindig bittérképes formában jelenik meg. A bittérképes formában megjelenő színes ábra minden egyes képpontját 4 24 bit ír le, ezért nagy méretűek. A bittérképes formában megjelenített képeket a háttértárakban vektorgrafikus, vagy bittérképes formában lehet tárolni. Vektorgrafika: Ha egy rajzolóprogrammal vektorgrafikus képet hozunk létre, akkor a rajzolóprogram egy láthatatlan hálóra rajzolja ki a grafikát. Ezt a grafikát aztán utasítások halmazaként tárolja el a rajzolóprogram egy grafikus állományba. Az utasítások pontosan leírják az összes rajzelem (pont, vonal, kör sokszög, stb.) helyét, irányát, méretét, színét, alakját és egyéb a megjelenítéssel kapcsolatos 32
tulajdonságait. Kirajzoláskor a program végrehajtja az állományban lévő utasításokat, és összeállítja a bittérképes ábrát. A vektorgrafikával készült rajz grafikus állománya nem a képet alkotó pontokat tárolja, hanem a képben található megjelenítéséhez szükséges információkat, melyeket a megjelenítő program értelmez és végrehajt. Előnyei: Mivel a rajzelemek azonosítható formában külön-külön vannak tárolva, így egyszerűbben lehet a grafikus kép egyes részeivel műveletet végezni (nagyítás, forgatás, eltolás, tükrözés, stb.). Másik nagy előnye, hogy általában kisebb méretű az állomány, mint a bittérképes grafikánál. Hátrányként említhető, hogy minél összetettebb a kép annál tovább tart a kirajzolása. Felhasználása: műszaki vonalas ábrák (CAD/CAM). Bittérképes grafika: A kép vízszintes és függőleges irányban képpontokra van felosztva, és minden egyes pontról tárolásra kerül a színinformáció. Megjelenítéskor a képernyő képpontjaiban megjelennek az adott pontról tárolt színinformációk. Színinformáció mennyiség képpontonként. Megjeleníthető színek száma. 4 bit 16 8 bit 256 16 bit 65536 24 bit 16777216 Minél több színinformációt szeretnénk egy-egy képpontról tárolni, annál nagyobb helyet foglal a létrejövő grafikus állomány. Előnye a jó minőségű kép! Hátránya, hogy nehéz a torzításmentes műveletvégzés! 33
8.5. A kép jellemzői: A kép mérete a képernyőn: Vízszintes és függőleges kiterjedés. Ha egy kép 320 pont széles és 240 pont magasságú, akkor 320*240 = 76800 képpontból áll: A kép megjelenítését a képernyő felbontása is befolyásolja. 320*240-es képet egy 640*480-as monitoron jelenítjük meg, akkor a kép a képernyő ¼-ét foglalja el. Fordított a helyzet, ha a megjelenítendő kép több pontból áll, mint a képernyő felbontása. A színek száma: A megjeleníteni kívánt kép minden egyes pontján megjeleníthető színek száma a kép színmélysége. A színmélységet a színinformáció határozza meg, ami 1 bittől 24 bitig terjedhet (32 bit). Befolyásolja a képállomány méretét, színhűségét. A képállomány mérete: A képek mérete meghatározza az eltárolt információ mennyiségét, és a betöltés sebességét is. Méret = kép vízszintes felbontása képpontban * a kép függőleges felbontása képpontban * színinformáció bitben / 8 [byte] 34
8.6. Képek digitalizálása: Lapolvasó felhasználásával. Az analóg képből létrejön a kép digitális képe, ami lehetővé teszi használatát a multimédia alkalmazásokban. Mintavételezés (felbontás): A kép mintavételezésének célja összekapcsolni az analóg kép egyes képelemeit a digitális kép képpontjaival, hogy a kép valósághűen megjeleníthető legyen a képernyőn. Ez azt jelenti, hogy mintavételezéskor egy képzeletbeli rácshálót helyezünk a képre, és a rácselemeket egy egységként kezelve állapítjuk meg az eredő színinformációit (~ átlag). Ez az információ még analóg a teljes, mintavételezéssel átfogható színtartományban. Mintavételezéskor kell meghatározni a beolvasásra kerülő kép szélességét és magasságát, majd ezt rá kell helyezni a digitális képet megjelenítő képernyőre, melyet a képernyő felbontása jellemez. Mintavételezést a lapolvasó felbontásának változtatásával lehet szabályozni. A lapolvasó felbontásával lehet beállítani a digitális képállományba kerülő képpontok számát. A mintavételezés lényegében egy integrálás, mert a kapott érték a képelemet alkotó részelemek színének és fényességének összegétől függő érték (eredője). A felbontás mértékegysége: [dpi] A kvantálás: A kvantálás során történik meg az egyes analóg képelemek szín- és fényesség információinak diszkrét képpont-értékekhez való rendelése. Ezt az információt döntően befolyásolja a használt színmélység. Gondolatban végezzük el a mintavételezést úgy, hogy a képre egy milliméter rácsozatot helyezünk, és a rácsozat határozza meg a képelem méretét. A rácselemekben található képelemek színinformációinak eredője lesz a mintavételezett analóg képjel. A kép minősége: alacsony magas Színmélység kicsi nagy Méret kicsi nagy 35
8.7. A képállományok tömörítése: Cél a digitalizáláskor keletkező képállomány méretének csökkentése. GIF (Graphic Interchange Format): Veszteségmentes képtömörítési eljárás. A tömörítés alapja egy helyettesítési eljárás, melyben adatsorozatokat egy mintatáblázat sorszámával helyettesítenek. A képpontok színkódjai ismétlődő adatsorozatok. Ha ezeket az adatsorozatokat beírják egy mintatáblázatba, akkor a képpontokból alkotott adatsorozat helyettesíthető, a mintatáblázat megfelelő sorára mutató pointerrel. Pl. a fájlban: 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 A mintatáblában: 1 2 3 4 5 6 Helyettesítés után: 1 1 1 tömörített fájl A GIF fájlokkal elérhető maximális méretcsökkenés a képállományban előforduló ismétlődő minták számától függ. Nagy azonos mezőket tartalmazó képek esetén 10*- es méretcsökkenés is elérhető. 16 bit színinformáció fölött licenszdíj fizetése kötelező. JPEG (Joint Fotographic Expert Group): Veszteséges képtömörítési eljárás. A jpeg eljárás elhagy a képből bizonyos adatokat. Érzékelésen alapuló tömörítési eljárás, mert az elhagyásra kerülő adatokat, az emberi szem érzékelési tulajdonságainak figyelembe vételével választja ki. Leghatékonyabban színes vagy szürkeárnyalatos képeket tömörít. Fekete-fehér képek tömörítésére nem érdemes használni. Nem tömöríti hatékonyan azokat a képeket sem, amiben sok a színváltozás. Tömörítés: Az eljárás először YUV szín-koordinátarendszerbe transzformálja a képfájlok RGB szín-koordinátarendszerben magadott színinformációit, majd elválasztja egymástól a világosság- és a színkódokat. Ezzel alkalmazkodik az emberi látás jellemzőihez. Az emberek ugyanis a képben bekövetkező kis mértékű világosság változásokat inkább észreveszik, mint a színekben bekövetkező nagymértékű változásokat. Emiatt a JPEG elsősorban a színinformáció mennyiségét csökkenti. A második lépésben az eljárás csökkenti a színkódok bitszámát. Ez a 4:1:1 (vízszintesen és 36
függőlegesen megfelezett színinformáció), vagy 4:2:2 (csak vízszintesen megfelezett színinformáció) beállítás. Az eredeti képfájlban egy képpont világosság- és két színkódját elvileg azonos számú bit alkotja. A 4:2:2 beállításnál két képpont színkódjai közül az egyik elmarad, vagyis a két képpont azonos színkódokkal rendelkezik. Emiatt a kép változik, de alig észrevehetően. A legtöbb képnél ugyanis két egymás melletti képpont színe alig különbözik egymástól. A 4:1:1 beállításnál az eljárás két sor színkódját közösen kezeli Harmadik lépésben, a képfájlban található képpontokat 8*8 tagból álló makroblokkokra bontja, majd diszkrét koszinusz-transzformációval kiszámítja a blokkokat alkotó frekvencia komponensek amplitúdóját. Majd Huffmann-kódolással tömöríti tovább és előáll a tömörített képállomány. M-JPEG (Motion JPEG): Ha 16 képkocka/sec sebességgel jelenítünk meg képeket, akkor mozgóképet kapunk. Az M-JPEG a JPEG eljárást használja. Minden egyes képet külön-külön tömörít össze, anélkül, hogy a szomszédos képek közötti összefüggéseket vizsgálná. A képállomány egyes képei nagy pontossággal azonnal elérhetők, ezért alkalmas videoállomány szerkesztéshez, vágáshoz. 8.8. Animáció Az animáció mozgás szimuláció, melyet állókép-sorozatok megjelenítésével állítunk elő. Az animáció és a videó között alapvető különbség az, hogy az animáció önálló képekből indul el és ezek összerakásával kelti a mozgás érzetét. A videó folyamatos mozgásnál készített pillanatfelvételek sorozata. Az animáció két fontos része az előtér és a háttér. A háttér az animáció alapja, az animációban mindig a háttér előtt történik az esemény. Minden animáció elkészítésénél létre kell hozni a hátteret és az előtert. 37
9. Digitális videotechnika 9.1. Színes TV rendszerek: Színes TV műsorszórásnál az adó egyetlen jelet sugároz, ez tartalmazza a színes képjelet és a hangot. Az egyidejűleg sugárzott kép- és hangjelet a különböző vivőfrekvencia választja szét. A színes képjel a kép összes színösszetevőjének egycsatornás kombinációja. A kombinált jelet az adó a világosságkódból és a két színkódból állítja elő. A sugárzott videojelet a TV készülékek először szétbontják kép és hangjelre, majd a képjelet dekódolják, kialakítják belőle a világosságkódot és a színkódokat. A fekete-fehér TV készülékek a világosságkódból állítják elő a képeket. Különböző TV rendszerek működnek: NTSC videojel 1949 USA képváltás: 29,97 kép/sec = 59,94 félkép/sec sorok száma: 525 sor / váltósoros képarány (aspect ratio): 4:3 SECAM videojel 1957 Francia képváltás: 25 kép/sec = 50 félkép/sec sorok száma: 625 sor / váltósoros képarány: 4:3 PAL videojel 1961 Német képváltás: 25 kép/sec = 50 félkép/sec sorok száma: 625 sor képarány: 4:3 1996-ban az MTV is áttért a PAL rendszerre. A különböző videojel rendszerekben készített TV készülékek képernyőinek felbontását a képarány ismeretében lehet megbecsülni az alábbi formulából: Vízszintes felbontás = sorok száma * képarány [képpont/sor] Függőleges felbontás = sorok száma 38
9.2. Videojelek digitalizálása A számítógépnek a videojeleket először hang- és képjelekre kell bontani. Leképezés: A hangjel a hangkártyára kerül, amelyből mintavételezés és kvantálás után lesz digitális hangállomány. Az analóg képjelet is csak digitalizálás után lehet használni, amelyet egy digitalizáló hardver végez (videokártya, digitalizálókártya). A képjelek digitalizálása több lépésben történik, ezek: leképezés, mintavételezés, kvantálás. A képjelek digitalizálásakor az analóg jelből indulnak ki, melyben analóg formában rögzített képkockák vannak. A digitalizálás eredménye a digitális képállomány, a képkockák képpontjainak digitális adataival. Az a művelet, melynek során az analóg képjelből kétdimenziós képfüggvény jön létre. A képfüggvény tartalmazza a képjelek képkockáit. A leképezés során kialakuló képfüggvényből történik a mintavételezés és a kvantálás. Mintavételezés: A mintavételezés az állóképek mintavételezéséhez hasonlóan történik. Ekkor jön létre a kapcsolat az analóg képjelek képelemei és a digitális képkockák képpontjai között. A képsíkot kis területekre (képelemekre) bontjuk. A létrejövő digitális képkocka minőségét alapvetően befolyásoló tényező a képelem mérete és a képelemet reprezentáló elektromos jel értéke. Minél kisebb a képelem mérete, annál finomabb felbontású a kép. A felbontás azonban nem tetszőleges nagyságú. A képelemek vízszintes irányú számának meg kell egyeznie a digitális kép egyes soraiban található pixelek számával. A képelemek függőleges száma azonos a digitális képet alkotó sorok számával. Tehát az analóg képet annyi képelemre kell bontani, ahány pixelből áll majd a digitális képkocka. A mintavételezési frekvencia: 10 MHz. 39