Hang, hangmagasság. Hangelfedés A hallásküszöb függ az egy időben hallott hangoktól. Ez a hangelfedés jelensége.



Hasonló dokumentumok
ELŐADÁS VÁZLATOK. Multimédia eszközök és szoftver II. Vezetőtanár: Csánky Lajos Dr. Nádasi András

A digitális jelek időben és értékben elkülönülő, diszkrét mintákból állnak. Ezek a jelek diszkrét értékűek és idejűek.

16. Tétel. Hangkártya szabványok. Hangállományok tömörítése, szabványok, kódolási módszerek Az MPEG Audio. Egyéb állományformátumok (PCM, WMA, OGG).

1. A hang, mint akusztikus jel

Analóg digitális átalakítók ELEKTRONIKA_2

A PC vagyis a személyi számítógép

AKUSZTIKAI ALAPOK. HANG. ELEKTROAKUSZ- TIKAI ÁTALAKITÓK.

Mechanikai hullámok. Hullámhegyek és hullámvölgyek alakulnak ki.

2. Az emberi hallásról

Hullámok, hanghullámok

Beszédinformációs rendszerek 5. gyakorlat Mintavételezés, kvantálás, beszédkódolás. Csapó Tamás Gábor

2. gyakorlat Mintavételezés, kvantálás

A digitális földfelszíni mûsorszórás forráskódolási és csatornakódolási eljárásai

2. Elméleti összefoglaló

Zaj- és rezgés. Törvényszerűségek

Villamos jelek mintavételezése, feldolgozása. LabVIEW 7.1

Informatika Rendszerek Alapjai

Értékelés Összesen: 100 pont 100% = 100 pont A VIZSGAFELADAT MEGOLDÁSÁRA JAVASOLT %-OS EREDMÉNY: EBBEN A VIZSGARÉSZBEN A VIZSGAFELADAT ARÁNYA 15%.

MUNKAANYAG. Mátyás János. A számítógép hardverelemei - Hangkártyák működése, beállítása, tesztelése. A követelménymodul megnevezése:

Értékelés Összesen: 100 pont 100% = 100 pont A VIZSGAFELADAT MEGOLDÁSÁRA JAVASOLT %-OS EREDMÉNY: EBBEN A VIZSGARÉSZBEN A VIZSGAFELADAT ARÁNYA 35%.

Jel, adat, információ

GPGPU. Hangfeldolgozás és hangszintézis

Tömörítés. I. Fogalma: A tömörítés egy olyan eljárás, amelynek segítségével egy fájlból egy kisebb fájl állítható elő.

Iványi László ARM programozás. Szabó Béla 6. Óra ADC és DAC elmélete és használata

π π A vivőhullám jelalakja (2. ábra) A vivőhullám periódusideje T amplitudója A az impulzus szélessége szögfokban 2p. 2p [ ]

A hangtömörítés és az audiokodekek

Villamos jelek mintavételezése, feldolgozása. LabVIEW előadás

Mintavételezés és AD átalakítók

Választható önálló LabView feladatok A zárójelben szereplő számok azt jelentik, hogy hány főnek lett kiírva a feladat

11. Egy Y alakú gumikötél egyik ága 20 cm, másik ága 50 cm. A két ág végeit azonos, f = 4 Hz

Hallás időállandói. Következmények: 20Hz alatti hang nem hallható 12Hz kattanás felismerhető

X. ANALÓG JELEK ILLESZTÉSE DIGITÁLIS ESZKÖZÖKHÖZ

Tömörítés, csomagolás, kicsomagolás. Letöltve: lenartpeter.uw.hu

Elektronika Előadás. Digitális-analóg és analóg-digitális átalakítók

Hullámok tesztek. 3. Melyik állítás nem igaz a mechanikai hullámok körében?

Választható önálló LabView feladatok 2013 A zárójelben szereplő számok azt jelentik, hogy hány főnek lett kiírva a feladat

Audiofrekvenciás jel továbbítása optikai úton

Kétcsatornás tömörített és tömörítetlen digitális hangjelek minőségi vizsgálata

Kommunikációs hálózatok 2 Analóg és digitális beszédátvitel

JELÁTALAKÍTÁS ÉS KÓDOLÁS I.

SC Surround Sound Card (714DX 7.1 SOUND EXPERT)... A 7.1 hangszórók bekötése. 2

Hangtechnika. Médiatechnológus asszisztens

Informatikai eszközök fizikai alapjai Lovász Béla

Audacity. Nyissunk meg egy.wav hangállományt a Fájl / Megnyitás menüponttal.

Az összetett munkához szükséges eszközkészlet kiválasztása és a digitalizáló eszközök megismerése

A Brüel & Kjaer zajdiagnosztikai módszereinek elméleti alapjai és ipari alkalmazása

Választható önálló LabView feladatok 2017

A hang mint mechanikai hullám

Az Informatika Elméleti Alapjai

Digitális mérőműszerek. Kaltenecker Zsolt Hiradástechnikai Villamosmérnök Szinusz Hullám Bt.

Számítógépes Grafika SZIE YMÉK

Easton420. Automata Telefon hangrögzítő. V 6.0 Telepítése Windows XP rendszerre

Audiometria 1. ábra 1. ábra 1. ábra 1. ábra 1. ábra

Wavelet transzformáció

Analóg-digitális átalakítás. Rencz Márta/ Ress S. Elektronikus Eszközök Tanszék

Információ / kommunikáció

Rezgés, Hullámok. Rezgés, oszcilláció. Harmonikus rezgő mozgás jellemzői

Híradástechikai jelfeldolgozás

Kommunikációs hálózatok 2 Analóg és digitális beszédátvitel

Analóg elektronika - laboratóriumi gyakorlatok

Orvosi Fizika és Statisztika

ANTAL Margit. Sapientia - Erdélyi Magyar Tudományegyetem. Jelfeldolgozás. ANTAL Margit. Adminisztratív. Bevezetés. Matematikai alapismeretek.

Informatika Rendszerek Alapjai

* (Nokia, ZTE (OMTP) kivételével) Főbb jellemzők

U42S Felhasználási példák Gitárjáték rögzítése

KANDÓ KÁLMÁN VILLAMOSMÉRNÖKI FŐISKOLAI KAR. Mikroelektronikai és Technológiai Intézet. Aktív Szűrők. Analóg és Hírközlési Áramkörök

Az MP3 lejátszó használata

3.18. DIGITÁLIS JELFELDOLGOZÁS

Programozó- készülék Kezelőkozol RT óra (pl. PC) Digitális bemenetek ROM memória Digitális kimenetek RAM memória Analóg bemenet Analóg kimenet

Digitális mérőműszerek

Elektronika Előadás. Modulátorok, demodulátorok, lock-in erősítők

Értékelés Összesen: 100 pont 100% = 100 pont A VIZSGAFELADAT MEGOLDÁSÁRA JAVASOLT %-OS EREDMÉNY: EBBEN A VIZSGARÉSZBEN A VIZSGAFELADAT ARÁNYA 15%.

A multimédia alapjai II.

Hang és fény (Akusztika, fénytechnika)

Mobil kommunikáció /A mobil hálózat/ /elektronikus oktatási segédlet/ v3.0

Akusztikus MEMS szenzor vizsgálata. Sós Bence JB2BP7

A mintavételezéses mérések alapjai

Hangintenzitás, hangnyomás

Mérés és adatgyűjtés

A/D és D/A átalakítók gyakorlat

Qosmio: A hallható különbség

Anyagvizsgálati módszerek

Többcsatornás zenei lemezformátumok

Hang és ultrahang. Sugárzások. A hang/ultrahang mint hullám. A hang mechanikai hullám. Terjedéséhez közegre van szükség vákuumban nem terjed

1. ábra. Repülő eszköz matematikai modellje ( fekete doboz )

ADATHORDOZÓ LEMEZ. Különböző ADATHORDOZÓK. MO lemez. hajlékonylemez CDROM, DVDROM. lemez. merevlemez CDRAM, DVDRAM. lemez

2.3 SZEIZMIKUS MÓDSZER- MÜSZERKUTATÁS Magnetofonos szeizmikus berendezés továbbfejlesztése. Bádonyi Géza

DTMF Frekvenciák Mérése Mérési Útmutató

5.1 hangszórós konfiguráció: - Váltás a középső hangszóró és a mélyhang sugárzó között

Állványra/polcra helyezhető hangsugárzó

Objektív beszédminősítés

HASZNÁLATI UTASÍTÁS. Modell: WHOOPEE

Zaj (bevezetés) A zaj hatása Zaj Környezeti zaj Zajimisszió Zajemisszió Zaj szabályozás Zaj környezeti és gazdasági szerepe:

TELEPÍTÉSI ÚTMUTATÓ V1.0

Jel, adat, információ

Szent István Egyetem Fizika és folyamatirányítási Tanszék FIZIKA. rezgések egydimenziós hullám hangok fizikája. Dr. Seres István

Brüel & Kjaer 2238 Mediátor zajszintmérő

Távközlő hálózatok és szolgáltatások IP hálózatok elérése távközlő és kábel-tv hálózatokon

Multimédia Videó fájlformátumok

Tervezte és készítette Géczy László

Átírás:

Hang, hangmagasság A hang anyagi közegben terjedő mechanikai rezgés. A hangrezgésnek van frekvenciája, hangszíne, burkológörbéje, hangereje, terjedési sebessége. Az ember a különböző frekvenciájú hangokat különböző hangmagasságú hangoknak érzékeli. A hangok megoszlása a frekvenciák szerint: Frekvencia - 16 Hz 16 20.000 Hz 20.000 Hz - Elnevezés Infrahang Hallható hang Ultrahang Hangszín, burkológörbe Ha a hangforrás egyetlen frekvenciájú hangot sugároz, akkor ezt a hangot tiszta hangnak nevezzük. Ez a magányos hang vagy a részhang. A természetes hangok több, különböző frekvenciájú és amplitúdójú részhangból állnak. A természetes hang részhangjainak összessége a frekvencia spektrum. A legmélyebb részhang a természetes hang alapfrekvenciája. A további részhangok frekvenciái általában kapcsolatban állnak az alaphang frekvenciájával, legtöbbször annak egészszámú többszörösei, ezek a felhangok. Összetételük, amplitúdóik és fázisuk határozza meg a természetes hang hangszínét. Az alaphang és a felhangok frekvencia tartományon belüli viselkedését az eredő hangjel burkológörbéje szemlélteti. Hangérzékelés A hallás a hangforrás által a levegőben keltett nyomásingadozások érzékelése. Az emberi hallás a frekvencia és hangnyomás függvényében korlátozott. Sok emberen végzett kísérletekkel meghatározták, hogy az ember a frekvencia függvényében milyen hangnyomás szintet képes még éppen meghallani. Ez a hallásküszöb. A hallásküszöb nyomás értéke frekvencia függő. Az ember hallásküszöbe függ az egy időben hallott hangoktól is. Egy zavaró hang megemeli a többi hang hallásküszöbét. Emiatt kell zajos környezetben megemelni a hangerőt, ha azt akarjuk, hogy partnereink megértsék mondanivalónkat. Hangelfedés A hallásküszöb függ az egy időben hallott hangoktól. Ez a hangelfedés jelensége. A hangelfedést megvizsgálták tiszta szinuszos hangokra, keskeny- és szélessávú zajokra, és azt találták, hogy a hallható hangok tartományában különböző frekvenciákon a hangelfedés mértéke a magasabb frekvenciákon erősebben jelentkezik. A hangelfedés jelenségét hasznosítják a digitális hangállományok tömörítésénél.

Hangerő A hangerő a hangrezgés amplitúdója, amit a hangnyomás fejez ki. Értékét akusztikus decibelben mérik. Az akusztikus decibel érték az ember hangérzékeléséhez alkalmazkodó, a hangerő nagyságának tízes alapú logaritmusának húszszorosával arányban lévő szám. A hallásküszöbnek a 0 decibel felel meg, a fájdalomküszöb értéke 120 decibel. Vegyük észre, hogy az emberi fül milliószoros (10 6 ) hangerő különbséget képes érzékelni. A hallásküszöb és a fájdalomküszöb hangnyomásának értéke frekvenciafüggő (Fletcher görbék). Fletcher görbék

Hangok analóg rögzítése, lejátszása Hangrögzítés: (1) A hangjel hangnyomásának átalakítása elektromos jellé, melyben az elektromos jel frekvenciái és amplitúdói megfelelnek az eredeti hangjelnek. (2) A elektromos jel analóg rögzítése. Lejátszás: (1) A rögzített jelek érzékelése, elektromos jellé alakítása. (2) Az elektromos jelek felerősítése, és hangszóróval hangnyomássá történő átalakítása. Digitális hangrögzítés A digitális hangrögzítés a hangok analóg rögzítéséhez hasonlóan történik, az egyetlen különbség a rögzítés módjában van. (1) A hangjel hangnyomásának átalakítása analóg elektromos jellé, melyben az elektromos jel frekvenciái és amplitúdói megfelelnek az eredeti hangjelnek. (2) Az analóg elektromos jel átalakítása digitális jelsorozattá mintavételezéssel és kvantálással. (3) A digitális jelsorozat rögzítése. Mintavételezés Mintavételezéskor az időben és értékben folytonos analóg elektromos jeleket a mintavételezési frekvencia által megszabott ütemben diszkrét impulzusok sorozatává alakítják át. Az egyes impulzusok amplitúdója azonos az analógjelnek az adott pillanat szerinti értékével. Ez az impulzus sorozat a mintavételezett impulzussorozat. A mintavételezett impulzussorozat információtartalma bizonyos feltételek teljesülése esetén megegyezik az eredeti analóg jel információtartalmával. A mintavételezett impulzussorozatból az eredeti analóg jelet akkor lehet torzítás nélkül visszaállítani, ha a mintavételezési frekvencia legalább kétszerese az eredeti analóg jelben előforduló legnagyobb frekvenciának (Shannon tétel). Kvantálás Kvantálás: a mintavételezett impulzussorozat amplitúdó értékeinek bináris számokká történő átalakítása. Az amplitúdó értékek megadására meghatározott számú bit áll rendelkezésre. A rendelkezésre álló bitek száma a kvantálási hossz. A kvantálási hossz határozza meg, hogy a megkülönböztethető amplitúdó értékek számát. 8, 16, 20 vagy 24 bit kvantálási hosszal 256, 65.536, 1.048.576 vagy 16.777.216 amplitúdó értéket lehet megkülönböztetni. Minél több amplitúdó értéket lehet megkülönböztetni, annál pontosabban lehet visszajátszáskor visszaállítani a digitális jelsorozatból az eredeti analóg jelet.

A digitalizálás minősége A hanganyagok digitalizálását különböző mintavételezési frekvenciával és kvantálási hosszal lehet elvégezni. A digitalizált hangállományból az eredeti hangállományt mindig csak bizonyos hibával lehet visszaállítani. A hiba mértéke jellemzi a digitalizálás minőségét. A mintavételezési frekvencia értéke határozza meg, hogy a digitalizált hangállomány milyen frekvenciájú részhangokat tartalmaz az eredeti analóg hanganyagból. Ha a mintavételezési frekvencia értéke legalább kétszerese az eredeti hangjelben előforduló legnagyobb frekvenciának, akkor a visszaállított hanganyag hangfrekvenciák szempontjából hibamentes lesz. Kvantálási hiba A kvantálás mindig okoz hibát, mert korlátozva van a digitális hangállományban a lehetséges amplitúdó értékek száma. Az analóg hangjel amplitúdója általában nem állítható vissza hibamentesen, mert mindig van különbség az eredeti amplitúdó érték és a rögzített amplitúdó érték között. A hiba abszolút értéke kisebb mint két kvantálási lépcső közötti érték. A kvantálási hiba a kvantálás hosszával csökken. A kvantálási hiba különösen kis amplitúdó értékek esetén jelentős nagyságú. 8, 16, 20 illetve 24 bit kvantálási hossznál az átfogható hangerő tartomány 1:256, 1:65.536, 1:1.048.576 illetve 1:16.777.216 értékű, ami megfelel 48.1, 96.3, 120.4 illetve 144.5 decibelnek. A digitalizált hangállomány mérete Egy digitalizált hangállomány minden mintavételezési helyen a kvantálási hossz szerinti bitet tartalmazza. Ha 44,1 KHz mintavételezési frekvenciával és 16 bit (2 bájt) kvantálási hosszal digitalizálnak egy mono hangállományt, akkor a digitális hangfájl hossza másodpercenként 44.100 Hz 2 bájt = 88.200 bájt = 86,1 Kbájt Több csatornás üzemmódban csatornánként történik a mintavételezés és a kvantálás. Sztereó üzemmódban a digitális hangállomány mérete a mono hangállomány méretének a duplája: Méret [bájt] = Mintavételezési frekvencia [Hz] Kvantálási hossz [bit] Játszási idő [sec] Csatornaszám / 8 Hangkártya szabványok Az IBM nem foglalkozott a PC-k hangtechnikai szolgáltatásaival. Mivel nem volt IBM által elfogadott hangkártya, a szoftvercégek olyan hangkártyákat részesítettek előnyben, melyek bizonyos mértékig el voltak terjedve. Mivel ezen hangkártyák szoftvere gyorsan bővült, a hangkártya vásárlók a sok szoftverrel támogatott hangkártyákat szerezték be. Így jöttek létre de facto hangkártya szabványok: - AdLib szabvány: Bevezette az FM szintézist. A mono üzemmódban működő MIDI rendszerek szabványa volt.

- SoundBlaster szabvány: Bevezette a mintavételezést és kvantálást a hangrögzítésben, kidolgozta a hullámtáblázat használatát. - Roland MT-32 szabvány: Bevezette a hangkártyán a hullámtáblázatot tartalmazó ROM tárat. FM szintézis Az FM (Frequency Modulation) szintézis módszer speciális hangszínnel rendelkező zenei hangok előállítására. Először előállítanak egy tiszta szinuszos hangrezgést (vivőfrekvenciát), majd ezt egy vagy több lépcsőben modulálják. A vivőfrekvencia és a moduláció megfelelő beállításával különböző burkológörbéjű szintetikus hangok állíthatók elő. Ezek a hangok hasonlíthatnak a hangszerhangokhoz. Az FM szintetizátorokban több operátor található. Az egyik operátor egy másik operátor kimenőjelét modulálja. A frekvenciagenerátor kimenőjele több módosítás után fog a tervezett hangszer burkológörbéjéhez hasonlítani. SoundBlaster kártyák A SoundBlaster szabvány a digitális hangtechnikát a CD technikából vette át, amivel lehetővé vált a PC-kben a hangok digitális felvétele, tárolása, szerkesztése és kezelése. A kártyákon 11.025, 22.05 és 44.1 khz-es mintavételezési frekvenciával és 8 vagy 16 bites kvantálási hosszal dolgozó ADC (analog to digital converter) található. Van még a SoundBlaster kártyákon Yamaha OPL3 szintetizátor, ami a szintetikus hangokat állít elő, ezeken a kártyákon hullámtáblázat segítségével. Hullámtáblázat szintézis A szintetizátorok a szintetikus hangokat hullámtáblázatban tárolt hangmintákból készítik el. A hangminták valódi hangszerekből származó hangok digitális mintái. A hullámtáblázatot használó hangkártyáknál a szintetikus hangok minősége függ a hangminták minőségétől, a mintavételezési frekvenciától, a kvantálási hossztól, az egy hangszerhez tartozó minták számától, esetleg tömörítésüktől. Hullámtáblázat A hullámtáblázatban hangszerenként egy vagy több hangminta található. Több hangminta esetén a hullámtáblázat a hangszer különböző frekvenciájú hangmintáit tartalmazza. A különböző frekvenciájú szintetikus hangszerhangokat hullámtáblázatból kiolvasott a hang frekvenciájának módosításával állítják elő. Azért van egy hullámtáblázatban a hangszerekből több, különböző magasságú hang, hogy a szintetikus hang valósághű legyen. Egy tipikus hullámtáblázat 4 Mbájt méretű és 700 hangminta van benne. A SoundBlaster kártyával átadott Audio PCI 128 program - Wave Studio - Creative CD - Creative Midi - Creative Wave - Creative Remote - Creative Mixer - Soundo'LE

Hangállomány tömörítés indokai A digitális hangállományok hosszú állományok. Tárolásukhoz sok hely, mozgatásukhoz és kezelésükhöz sok idő szükséges. Egy 16 bit kvantálási hosszal és 44,1 KHz mintavételezési frekvenciával felvett hangállomány hossza csatornánként és percenként: 44.100 Hz 16 bit 60 sec / 8 = 5.292.000 bájt = 5.168 Kbájt = 5,05 Mbájt Ha a környezeti hangtér megvalósításához 6 csatornát használnak, egy percnyi műsort tartalmazó hangállomány hossza 6 5,05 Mbájt = 30,3 Mbájt. A digitális hangállományok méretét tömörítéssel lehet csökkenteni. A tömörítési eljárások a hangelfedés jelenségét hasznosítják, a pszichoakusztikus redundanciát csökkentik kódoláskor. Pszichoakusztikus kódolás 1 A kódoló a hangjelek frekvencia elosztását elemzi, majd a hangelfedés jelenségét figyelembe véve törli az ember által nem hallott részeket a hangállományból. A kódolás ezért érzékelésen alapuló zajszűrés vagy érzékelésen alapuló részsáv-kódolás, a kódolás eredménye hangadat tömörítés. A kódoló egy szűrőbank segítségével sávokra bontja a hangadatok alkotóelemeit, és a sávokba eső alkotóelemeket elemzi. Ha egy sávban nincs hang, a kódoló a sávot nem kódolja. Ha a sávban van hang, és a hang elnyomja a zajt, a kódoló kódolja a sávot. Mivel kevesebb hangadat kerül kódolásra, csökken a kimenő állományban lévő adatmennyiség. Mivel a nem kódolt adatok többsége zaj, ezért csökken a kimenő állományban a zaj. Pszichoakusztikus kódolás 2 Az adatcsökkentés a kódolási és kvantálási fázisban valósul meg, amikor a kódoló szétosztja a rendelkezésre álló adatbiteket a szűrőbank kimenetén megjelenő hangsávok között. Kódolásnál a kódoló a bitfolyam bitjeit a sávokban található hanganyag dinamikus jellege szerint osztja szét a sávok között. Nagyobb hangerővel szóló hangok a sávokban több bitet kapnak, mint a kisebb intenzitással szólók. Mivel az elosztásra kerülő bitek száma a állandó, ezért ha egy sávban nagy intenzitású a hang, akkor ez a sáv sok bitet kap, míg a csendesebb sávok kevesebbet. Így a nagy intenzitású hang nemcsak az adott sávban fedi el a zajt, hanem az egész hallható hullámsávban csökkenti azt. Pszichoakusztikus kódolás 3 A pszichoakusztikus kódolású hangállomány a sávok számával megegyező számú hangcsatornát tartalmaz. Elvileg minden csatornában másodpercenként azonos számú bit található. Valójában a tömörített hangállományból sok sáv (csatorna) bitjei hiányoznak, ezért csökken a hangállomány mérete. Mivel a kódoló a másodpercenként meghatározott számú bitet oszt szét a sávok között, ezért a tömörítés és a másodpercenként továbbított bitek között szoros kapcsolat áll fenn. Mennél nagyobb a tömörítés annál kevesebb az egy másodperc alatt továbbított bitek száma (fordított arány). Mivel a bitsebesség egyszerűen mérhető paraméter, ezért a hangállományok tömörítésénél nem a tömörítést, hanem a bitsebességet használják.

Pszichoakusztikus dekódolás A dekódolás egyszerű művelet. A soksávos (sokcsatornás) kódolt bitfolyamból digitális analóg átalakítóval visszaállíthatók a hangszóróban megszólaló hangok. Az eredeti és a dekódolt hangadatok formája ugyan különbözik egymástól, de a különbséget az ember nem vagy alig hallja, mert többnyire a hiányzó hangelemek a hangadatok lényegtelen, ember által nem hallható alkotóelemek. Kísérleti úton igazolták, hogy 12-szeres tömörítés esetén is CD minőségű hangnak tekinthető a dekódolt hangadat. Hangállomány tömörítési eljárások A tömörítésnél a kódoló a hangállományt tartalmát dinamikusan elemzi, és sávokra bontja. Az elemzés módja és a sávok száma a különféle tömörítési eljárásoknál különböző, ezért a tömörített hangállományból származó hang minőségileg eltérő lehet. Le kell azonban szögezni, hogy nagyon kevesen érzékelik ezt a különbséget. Az ismertetett tömörítési eljárások: - MPEG Audio - Dolby Digital AC-3 - MPEG2 Advanced Audio Coding (AAC) MPEG Audio - Mintavételezési frekvencia: 32, 44,1, illetve 48 KHz - Kvantálási hossz: 8, 16, vagy 20 bit - Egy vagy két hangcsatornát kezel - Tömörítés: érzékelésen alapuló részsáv kódolás - Csatornánkénti bitsebesség: 32 kbit/sec 224 kbit/sec közötti érték, állítható - Három réteg (eljárás): - Layer 1: Egyszerű eljárás. Csatornánként 128 kbit/sec bitsebesség felett használható - Layer 2: Közepes bonyolultságú eljárás. Csatornánként 128 kbit/sec bitsebesség körül használható - Layer 3: Bonyolult eljárás. Csatornánként 64 kbit/sec bitsebesség körül használható (mp3)

Példa: Mekkora egy MP3 fájl tömörítése Mekkora tömörítéssel rendelkezik egy mp3 fájl, amit 64 kbit/sec sebességgel játszanak le? Az eredeti hangállomány sztereo hangállomány volt, amit 44,1 KHz mintavételezési frekvenciával és 16 bites kvantálási hosszal rögzítettek. A lejátszás hossza lényegtelen, mert a tömörítést az 1 sec hossz segítségével lehet megállapítani. 1 sec hosszú eredeti hangállományban a bitek száma: 44.100 Hz 16 bit 2 [csatorna] = 1.411.200 bit = 1.378,1 kbit Mivel a tömörített mp3 hangállomány lejátszása 64 kbit/sec sebességgel történik, a kódoló olyan tömörítést valósít meg, ami 1 sec hosszú állomány bitjeinek számát 64 kbit értékre csökkenti. A tömörítés 1.378,1 kbit / 64 kbit = 21,5 tömörítés Környezeti hangtér A Dolby Laboratories a filmtechnika részére dolgozta ki az analóg Dolby Stereo hangrendszert, melyben négy csatornában, öt (baloldali, középső, jobboldali, két környezeti) hangszóróval állítottak térhatású hangot. Az 5.1 csatornás Dolby Stereo Digital a Dolby Stereo digitális változata, melyben a két környezeti hangszórót két független csatorna vezérli, és megjelent benne a mélysugárzó (LFE: Low Frequency Effect) csatorna is. Az 5.1 csatorna kódolási szempontból 6 csatorna. A használt mintavételezési frekvenciák 32, 44.1 vagy 48 KHz, a kvantálási hossz 8, 16 vagy 20 bit. Példa Mekkora egy 1 perc hosszú, 5.1 csatornás Dolby Digital hangfájl mérete, ha a mintavételezési frekvencia 48 KHz, a kvantálási hossz 20 bit? 48.000 Hz 20 bit 6 [csatorna] 60 sec / 8 = 43.200.000 bájt = 42.187,5 kbájt = = 41,2 Mbájt Vegyük észre, hogy hatalmas a fájlméret. Emiatt kell a környezeti hangtér hangállományait tömöríteni. Dolby Digital hangrendszer A Dolby Digital (AC-3) a DVD lemezek számára módosított Dolby Stereo Digital hangrendszer, melyben a hangállományt érzékelésen alapuló részsáv kódolási technika használatával tömörítik, hogy 1 5.1 hangcsatornán keresztül kissebességű adatátvitel váljon lehetővé. A Dolby Digital rendszerben a hangfelvételhez 6 mikrofont használnak, a 6 bemenő jelből állít elő a Dolby Digital kódoló egyetlen folytonos bitfolyamot. A bitfolyamot a Dolby Digital dekódoló szétbontja, és előállítja a hangszórók számára a vezérlést.

Dolby Digital rendszer vázlata Dolby Digital csatornák A Dolby Digital rendszerben hat teljesen önálló digitális hangcsatorna van. Három csatornán jön a hang a hangtér baloldali, középső és jobboldali hangszóróihoz. A környezeti hangtér kialakítását két hátsó különálló hangszóró biztosítja. Ez az öt csatorna teljesen egyenrangú, mindegyik 20 Hz és 20.300 Hz között ± 0,5 db ingadozással viszi át a hangot. A hatodik csatorna, a 0.1 csatorna el is hagyható. Csak 20 Hz és 120 Hz között viszi át a hangot. Ez a mélysugárzó csatorna különböző alacsony frekvenciás hatások keltésére szolgál. Lekeverés (Downmixing) A Dolby Digital dekó-kódoló 5.1 (6), 4, 2 és 1 hangszóró felé tudja szétosztani a 5.1 csatornás bitfolyamot. Ez nagyon előnyös multi-médiarendszerek ösz-szeállításakor. Dolby Digital kódolás (1) A Dolby Digital rendszerben a mintavételezett hangadatokat AC-3 kódolási technikával tömörítik. Az AC-3 (Audio Coding number 3) érzékelésen alapuló digitális részsáv kódolási (zajcsökkentési és tömörítési) eljárás. A Dolby Digital kódoló a hallható hangtartományt az emberi hallás frekvencia érzékenységének megfelelően 32 különböző szélességű frekvenciasávra osztja. Az egyes sávokban lehetővé válik a zaj erőteljes kiszűrése. Példa: Dolby Digital tömörítés Egy 5.1 csatornás 48 KHz mintavételezési frekvenciával és 20 bit kvantálási hosszal rögzített hanganyag hossza percenként (6 48000 16 60) 8 = 43.200.00 bájt = 41,2 Mbájt Legyen a Dolby Digital bitfolyamban a bitsebesség 384 kbit/sec. Ez percenként 60 sec 384 kbit/sec : 8 = 2.880 kbájt = 2,81 Mbájt hanganyag továbbítást jelent. Az eredeti állomány és a tömörített állomány aránya: 41,2 : 2,81 = 14,7 ami 14,7 -es tömörítést jelent.

MPEG2 Advanced Audio Coding (AAC) Az MPEG2 AAC kódolás a környezeti hangteret 5 hangszóróval valósítja meg. Az MP3 kódolás továbbfejlesztésének tekinthető. A kódolásnál a mintavételi frekvencia 8 KHz és 96 KHz között lehet, a kvantálás hossza 8 és 24 bit között van, míg a részsávok száma 1 és 48 között változhat. Az újítások az MP3-hoz képest: - módosított diszkrét koszinusz transzformációt használ a szűrőbank, - van ideiglenes zaj átalakítás (TNS: Temporary Noise Shaping), - van előrejelzés, - a kvantálási lépcsőfokok kisebbek, - csökkentették a kódolási redundanciát. MPEG2 AAC (1) Szűrőbank: Az AAC kódoló a szűréshez módosított diszkrét koszinusz transzformációt használ. A módosított eljárás az MP3 eljárásnál jobb zajszűrést, ezáltal nagyobb tömörítést biztosít. Ideiglenes zaj alakítás (Temporaly Noise Shaping): Újítás az idő-frekvencia kódolás területen. A kódoló a kvantálási zaj elosztását az időfüggvényében a frekvencia tartomány előrejelzés szerint alakítja ki. Ezzel különösen a beszéd válik érthetőbbé. Előrejelzés: A beszéd felismerés céljára kidolgozott módszer. Arra épít, hogy bizonyos hanganyagok esetében az előrejelzés egyszerű. Kvantálás: A nagyobb kvantálási hossz miatt a bitsebesség hatékonyabban használható fel. MPEG2 AAC (2) Bitfolyam formátum: A kibocsátott digitális információ a minimális kódolási redundancia biztosítása érdekében entrópia kódoláson megy keresztül. Az MPEG2 AAC kódolás legjelentősebb alkalmazói a filmipar és a digitális TV. Az eljárás meglepően jó kódolási hatékonysága miatt valószínűleg elterjed az Interneten is, mert kis sávszélességet igényel. Az MPEG2 AAC eljárás kidolgozása után, megjelentek használatát lehetővé tevő alkalmazási szoftverek és hardver megoldások. Elterjedését segíti, hogy bármely bitsebességhez a nagyon jó hangminőséget biztosít. MIDI (Musical Instrument Digital Interface) A MIDI digitális hangszercsatoló interfész, ami lehetővé teszi, hogy elektronikus hangszerek és a számítógép egymás között adatokat cseréljenek. A MIDI szabvány nem ismeri a beszédet. A MIDI állományok a zeneeszközökre (General MIDI), a hangok jellemzőire és lejátszására és a szintetizátor működésére vonatkozó utasításokat tartalmaznak. A MIDI állományok emiatt kisebbek kb. század akkorák mint a WAV fájlok.

General MIDI (1) A General MIDI szabvány a MIDI szabvány továbbfejlesztése, egységesíti a szintetizátorok által használt hullámtáblázatokban a zeneeszközök kiosztását, és kibővíti a MIDI szabványt néhány új utasítással. Az eredeti MIDI szabvány nem definiálta a hullámtáblázatban a hangszerek helyét, ezeket a MIDI szerzők határozták meg. Ezért minden lejátszásra kerülő MIDI állomány esetében illeszteni kellett a lejátszásra kerülő MIDI állomány hangszer kiosztását a saját rendszer (szintetizátor) hangszer kiosztásához. Ha ez nem történt meg, a MIDI állomány lejátszásakor megszólaló zeneeszközök fajtája véletlenszerűen alakult ki. General MIDI (2) A General MIDI szabvány 128 hangszer helyét rögzíti a táblázatban, ezért ezzel a szabvánnyal kompatibilis MIDI állományok minden MIDI rendszerben azonnal lejátszhatók. A MIDI utasítások két vagy három bájtból állnak. A két bájtos utasítások a szintetizátor működését befolyásolják. A szintetizátorra vonatkozó parancsokkal meg lehet változtatni a szintetizátor működését (például le lehet állítani az összes csatornában futó programot), továbbá definiálni lehet egy-egy szintetizátor csatornában megszólaló hangszert. General MIDI (3) A három bájtos utasítások a hangokra vonatkoznak. Első bájtjuk egy állapotbájt, melynek négy bitje definiál egy szintetizátor csatornát, négy bitje pedig egy parancsot. Egy MIDI állományban tehát 16 szintetizátor csatorna parancsai lehetnek. A MIDI utasítás második bájtja a hangjegyet, míg a harmadik bájt a lejátszás dinamikáját határozza meg. A General MIDI állomány tartalmazza a lejátszásra kerülő zeneszám lejátszásához szükséges összes információt, ezért játszható le azonnal. Szintetizátorok A MIDI állományban levő utasításokat a hangkártyán levő szintetizátor vagy külső szintetizátor értelmezi és szólaltatja meg. A külső szintetizátort hangkártya MIDI csatlakozójába bedugaszolt MIDI kábellel kell a számítógéphez csatlakoztatni. A szintetizátorok bemeneti csatornáikon fogadnak utasításokat, mindegyik csatorna egy hangszert kezel. Az OPL3 (MPC 3 előírás) szintetizátornak 16 csatornája van, tehát 16 hangszer hangját képes megszólaltatni.

MIDI állományok készítése A MIDI állományok készítéséhez MIDI sorrendvezérlő programot kell használni. Ez a program teszi lehetővé a MIDI utasítások rögzítését, szerkesztését és visszajátszását. MIDI klaviatúra segítségével, a zeneszám lejátszásával állítható elő a MIDI állományt. A lejátszott zeneszámot a sorrendvezérlő feljegyzi és megjeleníti. A megjelenítés történhet kottában vagy egyszerűsített megjelenítési módban. Mivel a sorrendvezérlők számítógépes alkalmazások számos szolgáltatásuk van. Sorrendvezérlő szolgáltatások 1. Csatornák megjelenítése: Mindegyik sorrendvezérlő képes megjeleníteni az egyes csatornák tartalmát. 2. Hangjegyek megjelenítése: Minden egyes csatorna hangjait meg lehet kotta formájában jeleníteni, így látható és szerkeszthető magasságuk, időtartamuk és egyéb paraméterük. 3. Hangjegyek átrendezése: Kottához értő felhasználók módosíthatják az egyes hangjegyeket a kotta alapján. A létrehozott módosítások azonnal meghallgathatók. 4. Lejátszási tempó beállítása: A sorrendvezérlőknél általában lehetőség nyílik a lejátszási sebesség központi módosítására. 5. Hangnem megváltoztatása: Meg lehet változtatni az egész MIDI állomány vagy egy részletének a hangnemét. 6. Hangszerek módosítása: módosíthatók a megszólaló hangszerek.

Közeg A hang sebessége különböző közegekben Longitudinális hullámok sebessége (m/s) Levegő (20 C) 343 (*) - Hélium 981 - Hidrogén 1280 - Oxigén 316 - Víz 1484 Víz (0 C) 1407 Jég (-4 C) 3250 Olaj(SAE 1740 20/30) Üveg 5300 PVC (lágy) 800 PVC (kemény) 2250 1060 Beton 3100 Bükkfa 3300 Alumínium 6300 3080 Berillium 12900 8880 Ólom 2160 700 Arany 3240 1280 Réz 4660 2260 Magnézium 4400 810 Higany 1450 Acél 5920 3255 Titán 6100 3050 Wolfram 5460 5460 Vas 5170 Bór 16200 Gyémánt 18000 Transzverzális hullámok sebessége (m/s)