Akusztikai mérések SztahóDávid sztaho@tmit.bme.hu http://alpha.tmit.bme.hu/speech http://berber.tmit.bme.hu/oktatas/gyak02.ppt
Tartalom Akusztikai produktum Gerjesztés típus Vokális traktus Sugárzási ellenállás Végső produktum Dinamikatartomány Formánsok Szegmentális Szupraszegmentális szerkezet Gyakorlati példák
Bevezetés A hang keltésének mechanizmusa
P( ω) = F( ω) U ( ω) R( ω) Z( ω) forrás rezonátor üreg sugárzási ellenállás zaj
F( ω) Forrás Gerjesztési típusok Zöngés gerjesztés Zörejes gerjesztés zöngés zöngétlen Zárfelpattanás zöngés zöngétlen
F( ω) Zöngés gerjesztés A hangszalagok rezgése hozza létre Háromszög jel
F( ω) Zörejes gerjesztés A levegő áramlásának turbulens leszakadásai hozzák létre Zajszerű frekvenciakép Réshangok Lehet zöngés és zöngétlen is Példa: SSZ (hang mélyül)
F( ω) Zárfelpattanás Zárfelpattanási zörej hozza létre Lehet zöngés és zöngétlen Zöngétlen: csend szakasz Zöngés: néma fázis
U( ω) Rezonátor üreg A gerjesztést módosítja A hangképző üreg módosító hatása Egyes frekvenciahelyeket kiemel Gyakorlatilag a szájüreg alakjának módosításával befolyásolható A hangszereken jól lehet látni, attól jó minőségű egy hangszer, ha a testének alakja jó
R( ω) Sugárzási ellenállás A szájüreg magas frekvenciatartományban jobban sugározza a hangokat A mély hangokat elnyomja, a magasakat kiemeli 6 db/oktáv
Z( ω) Környezeti hatás A végső produktumot módosítja, hozzáadódik A környezeti hatás mindig jelen van Pl. zaj, visszhang A hozzáadott zaj igen fontos tényező például beszédfelismerésnél Ha a zaj olyan frekvenciájú, mint a beszéd, akkor ennek eltávolítása nehéz feladat Koktél-party effektus Egyszerre több beszélőt az agy képes elkülöníteni Ugyanez géppel még nagyon nehézkes
Előálló hang F( ω) U( ω) R( ω)
Nagy dinamikatartomány A beszédjel energiája alacsony frekvenciákon koncentrálódik 800-1000 Hz alatt az energia fele DE: ez süketszobai állapot Zajok módosítják
Formánsok A formánsok a vokális traktus (rezonátorüreg) által felerősített felhangnyalábok FONTOS: NEM az alaphang és annak felharmonikusai a formánsok, hanem a rezonátorüreg erősítési helyei!
Szegmentális és szupraszegmentális szerkezet Szegmentális A beszédjel vizsgálati szintje: beszédhangonként vagy beszédhang részletenként Szupraszegmentális A beszédjel vizsgálati szintje: több beszédhang egyszerre (frázis, mondat, szöveg, ) Vizsgált jellemzők dallam, hangsúly, tempo-szünet-ritmus, hangerő Időbeli mennyiséget mérünk
Formáns szintetizátor Hangképző csatorna üregének alakját változtatjuk Megkeresendő magánhangzók: i, u, á Ezek esnek legmesszebb, mivel a hangképző szervek szélsőséges állásban vannak Minden nyelvben megtalálhatóak Formánsok lejegyzése Magas-mély jelleg: F2 Nagyon változó beszédhang készlet Svéd 22 magánhangzó
Spektrogram Hangátmenetek Folyamatos Tranziensek és kvázi-stacioner állapotok Stacioner állapot hadaró embereknél alig van, ezért lehet sokkal kevésbé érteni őket A jellemző jegyek csak statisztikusan érvényesek Beszélők között és egy beszélőn belül is változik a kiejtés F0 eltérés: férfi-női Hangszalagok hossza eltér A formánsok is változnak
Suttogott beszéd A gerjesztés megváltozik Nincs zönge, helyette fehérzaj jellegű gerjesztő jel lép be A formánsstruktúra megmarad, de jelentősen szétkent lesz A beszéd energiájának nagy része elveszik
Hangidőtartamok - CoolEdit Bemondott szó: szár Súrlódási zörej időtartama szerint hallott hangok t > 100 msréshang ( sz ) 50 < t < 100 msaffrikáta ( c ) t < 50 mszárhang ( t ) DE: a képzési hely ugyanaz, tehát a színkép is
Magasabb formánsok szintetizálása Egyenként hozzáadni a formánsokat F1 és F2 kell a megértéshez A magasabb formánsok emberi jelleget adnak hozzá, érzelmeket
Szupraszegmentális szerkezet Milyen jellemzőhöz milyen fizikai tartalom tartozik? Dallam F0 Hangsúly F0, energia, szünet Tempo artikulációs sebesség A magyar kötött hangsúlyú nyelv