A beszéd. Segédlet a Kommunikáció-akusztika tanulásához

Hasonló dokumentumok
Akusztikai mérések SztahóDávid

Beszédinformációs rendszerek

A mássalhangzók. Konszonánsok (consonans) jelölése: C Mássalhangzók vs. magánhangzók? Mi jellemző a mássalhangzókra?

Teremakusztikai méréstechnika

Felvételi előkészítő. magyar nyelvből. 1. foglalkozás

Bevezetés a nyelvtudományba Fonetika

ű ű ű Ú Ú Á ű Ö ű ű Ú Ő É

ű Ö ű Ú ű ű ű Á ű

Á Ó ű ű Á É ű ű ű ű Ú Ú

Á Á ő ő Ö ő ő ö É ö ő ö ő ő ö ő ő ö ő ő ü ö

ű Ú ű ű É Ú ű ű

Á Ö Ö Ö Ö ú ú Ö Ö Ó Ó ú ú Ü ú Ó Ö Ö Ü Ó Ö Ö Á Ó ú ú ú ű Ö Ö Ö Ö Á Ó Ö Ó ú ú Ö

Á ű ó ó

Ó Ó ö ú ö ö ö ö ü ú ú ö ö ö ú ú ö ö ö ú ú ú ű ö ö ú ö ü ö ö ö ö ü ú Á ö ü Á ö ö ö ö ö ö

ó ő ő ó ő ö ő ő ó ó ó ö ő ó ó ó ö ő ó ő ő ö Ö ő ö ó ő ö ő ő ú ö ö ü ö ó ö ö ö ő ö ö Ö ú ü ó ü ő ő ő ő ó ő ü ó ü ö ő ö ó ő ö ő ö ü ö ü ő ö ö ó ö ő ő ö

Á Ü É Ü Ú Ü É

ö ö Á Á Ó Á ö ö ö ö ö ú ű ö ö Á Á ű ű ö ö ö ö ű

Ó é é Ó Ó ő ű Ó Ö ü Ó é Ó ő Ó Á Ö é Ö Ó Ó é Ó Ó Ó Ó ú Ó Ó Ó Ó ű Ö Ó Ó Ó é Ó Ó ö Ö Ó Ö Ö Ó Ó Ó é ö Ö é é Ü Ó Ö Ó é Ó é ö Ó Ú Ó ő Ö Ó é é Ö ú Ó Ö ö ű ő

ü ü Ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü É ü ü

Ú ű É ű ű Ü Ü ű ű Ú É ű ű Ü ű ű ű ű ű ű ű Ú ű ű

Á ó ó ó Ü Ü ó ó Ü ó ó ú ú ó ó Ü ó ó ó Ü ó ó

ú Ó ú ú ú ú ú ú ú É Á

ű ő ő ő

ú ö ö ö ö ö ö Á ö ö ö á á á ű Ü ű ö ö Á á Á

É É Ö

ü ú ú ü ú ú ú ú

Ó Ó ó ö ó

ó Ó ú ó ó ó Á ó ó ó Á ó ó ó ó Á ó ú ó ó ó

É Á Á Ö Á

ö ő ü ö ő ő ü ü ő ő ő ü ö ü ü ő ú ő ő ő ü ő ő ő ő ő ú ő ő ü ő ő ő ü ö ü ú ő ő ő ő ü ü ő ő ú

é ü ó ö é Ö é ü é é ó ö é ü ü é é ó ó ó é Á é é ü ó é ó ó é ö ö ö é é ü é ü é é ö ü ü é ó é é é é é é ö é é é é é é ö é ó ö ü é é é ü é é ó é ü ó ö é

Az énekelt magánhangzók észlelése réshangkörnyezetben

É ú É ö ö ű ö ö ö ú ú ú ű ű ú ö ű ö ű ű ü ö ö ü ű ö ü ö ö ö ö ú ü ö ö ö ú ö ö ú ö ö ú ü ú ú ú ű ü ö ö ű ú ű ű ü ö ű ö ö ö ű ú ö ö ü ú ü ö ö ö ü ú ö ű

É Ö Á Í Á Ó Ö ü

ű ú Í Ó Á ú Ű ű Ő Ö Á ú Ű Ü ú ú Á ú ű

ú ú ö ö ü ü ü ü ű ü ü

ú ű ú ú ű ú ű ű ú ű ú ű Á ű ű Á ű ű ú ú ú ú ú ú ű ú ú ú ú ú ú ú ú

Ö Ö ű ű ű Ú Ú ű ű ű Ú ű

ő ő ő ő ú É ü ú ú ű ú ű ő ő ő ő Á Á ü ő É É É É É É Á Ú Á Á ő ő ő ő ő É Á Á Á ő ő ő Á ü ő ő ü

Á Á Ö Ö Ü É Ö É É Á Ú É É É É Á Á Ö Ö Ő

Ö Ö Ú Ó Ö ű Ő Ő ű ű Ü Ő Ó Ő

Ó ű ű Á ú ű ű ú ú ú ű ű É ú É Á Á ú ű Ü Á Ü Á ű Ö Ú É Ó É Á Á Á Ű Á úá Á Ö É Ö É Ü

é ú é é é é é é é é é é é é ú é ö é é é ö Ő é é é ú é é é é é é é é ö é é é ö é Ö é é ö é ö é é é ű é ö ö é ö é é ö ö é é ö ö é ö é Ö é ú é é é é é é

ő ö ő ú ő ö ö ő ó ő ö ü ú ö ö ó ő ö ü ó ó ó ó ő ő ő ó ó ú ő ü ő ö ö ó ü ö ö ő ű ö ö ő ú ú ó ö ő ű ö ó

ú ú ü ü Á ú ú ü ű ű ú ü ü ü ü

É ö Ű ő ű ő ő ű ű

ó ú ú ü ú ő ó ő ő ó ó ó ö ó ü ő ó ő ö ü ü ó ö ő É ó ö ö ö ó ó ö ü ü ö ü ó ó ő ó ü ó ü ü ö ö É ú ó ó ö ú ö ü ü ó ó ó ü Á ö ö ü ó ö ó ö ö ö ö ó ó ö ó ó

ú Ü Í ú ú ú ú ú ú

ö ö ö ö ö ö ö ü ö ü ö ű ö ú ü ű ö ü Í ö ú ü ü ű ö ú ü Á ü

ü ö ú ö ú ü ö ü Á Ó ö ö ö ö ú ü ú ü ü ú ú ö ö ü ü ú ü ü ö ö ű ö ü ü ü ü ö ö

Ö ő ü Ö Ö Ő ü ő Ö Ö ü ű Á Í Ö ű ü ő ő ő Ö ü ü ő ő ő Ü ü ő ő ő ü ő ő ü ü

É ő ő ű ú Á ő Á ő ű ő ő ő ő ő ő ő ő ű ú ű ű ő ő ő ű

ő ő Ű ü ú ú Ú ü ű ő ő ő ő Á Á Í ü É ő ő ő ő ő É ő ú ú ú ő Á Ö ő

Ü ü Ü Ö Ó ö ü ö Ó Ú Ó ü Ó ö ö Á ö ö ö ö ü

ö ö ó ú ö ö ú ü ó ö ö Í ö ö ö ü ó ö ö ú ú ö ü ó ü ó ü ö ú ü ó ü ö ó Á Á ö ü ú ó ö ü ü ö ó ü ü Á ü ö ü ö ü ö ö ö ü ö ú ö ö ö ü ú ö ú ö ű ú ú ü ö ó ö ö

Í Ú É ő ő ú ö Ö ú ú ú ö ö ú ö ö ű ö ő ö ö ú ö ő ő ö ö ö ő ő ú ő ú ö ö ö ú ö ö ú ő ö ú ö ű ö ő Ó ő Á ö ő ö ö

É Í ü ú É ü ő ő ő ő ú ő ú ü ü ő ü ú ü ű ú ú ü ü Í ü ű ő ő É ő

é ö é Ö é é ő í ó í é ő ö ú é ó é ő ü ü é ó ö é é ó é é ö é ő í é é ő é é ö é ű ö é í ó é é í ö í ó í ó é é ö ó í ó ó í ó é é ö ő í ó ó í ó ü é í ü

ő ő ő ő ő ő ú ő ü Á ü ü ő ő ő ő ő ő ő ő ő ő Ö Ó ő ő ő Ö ő ő ő


í ó ő í é ö ő é í ó é é ó é í é é í é í íí é é é í é ö é ő é ó ő ő é ö é Ö ü é ó ö ü ö ö é é é ő í ő í ő ö é ő ú é ö é é é í é é í é é ü é é ö é ó í é

Ö Ö ö Ó Ó Ó Ó Ü ú ü Ű Ö Ö Ö ö Ü ö Í ü ű

Ü ű ö Á Ü ü ö ö

ű ű ű ű Ü ű ű ű Ó ű Á ű Á Ö É É É Á É É É É Ü Á Á Á ű

ú ü ü ú Ö ú ü ü ü ü ü ú ü ú ü ű Í ü ü ű ü ű Ó ü Ü ű ú ú Á ü ű ű ü ü Ö ü ű ü Í ü ü

ű í ú ü ü ü ü ü Ó í ü í í í É Á

ö ö Ö ó ó ö ó ó ó ü ö í ü ú ó ó í ö ö ö ó ö ü ú ó ü ö ü ö ö Ö ü ö ö Ö ó

Í Í Ó ű Ü Ó Ó Ü ü Ö Í Ü Í Í ú Ö Ó Í ú ú Ö Ó É Í ű ú

ő ö ő ű ó ö ó ű Í Ö Ö Á Í Ó Ö Ü É Ö Ö Ö Á Á Ö É Á Ö

Í Í Í Ü Ó Ó Ö Á Ü Ü Ó Ü Ü Ó Ö Í É Ö

ű ú ú Ö ó Ö ó ó ó Ö ű ó ű ű ü Á ó ó ó ó ü ó ü Ö ó ó ó Ö ű ű ü Ö ű Á ú ú ú ó ű í í Ő ú Á É Ö í ó ü ű í ó ű ó Ö ú Ő ú ó í ú ó

í Ó ó ó í ó ó ó ő í ó ó ó ó

ö ü ü ú ó í ó ü ú ö ó ű ö ó ö í ó ö í ö ű ö ó Ú ú ö ü É ó í ö Ó Á í ó í í Ú ö ú ö ű ü ó

ö Ó ű ö ó í ó ü ö Ó ó í ö ö ó Ö ó ö í ó í ó Á í ó Á Á Ő ú ü ó Í ü ú ü

Ö Ö ú

Í ö ö ű ú ö ö Í ö ü ö ü

Ü

É Í Á Á É Ü Ó É É É É Í Ó Ó Ő Á Á É Á É É É É Á É É Á Á É É Á É Í


ó É ó í ó ó í í ö í ó í ö ö ö ü ö ó ó ó ü ú ö ü ó ó ö ö ü ü ü ö ö ó ö í ó ű Ü ó í ú í ö í ö í Í ó ó í í ö ü ö ö í ö í ö ö ö ü ó í ö ö ó í ú ü ó ö

í ó í ó ó ó í í ü ú í ú ó ó ü ü í ó ü ú ó ü í í ü ü ü ó í ü í ü ü í ü ü í ó ó ó í ó í ü ó í Á

Ö Ö Ö Ö Ö Á Ű É Ö Ö Ö

í í É í ó ó É ö í ó í ó í ó ó í ó í í ó ó ó í ö ö ö ö í í í ó ó ö ó

ú ű ű É ü ű ü ű ű í ü í ő í Ü ő ő ü ú Í ő ő í ú ü ü ő ü

ű ú ü ü ü Í ü ö ü ö ü ö ü Ó ü ö ü ö ö ü ű ű ú ü ö ö ü Ó ö ű ü ö ú ö ö ü ü ű ü ü ö ö ü ü ú ö ö ü ü ú ü

ó ö í í ü Ű Ö ó ó ű ö ü Í í í ö Ö Ó ö Ű Ö ú ó ó í í ű ö ö ö ö í ó ö ö í ö ű ö ű ö ö ö ö ö í ó Ö Ö ü ú ö ó ü ö Ö ű ö Ö ü ó ö ö ó ö ö Ó í ű ö ű ö ö ű í

ö ő ő ü ü Ó ü ö ű Á ő ő ö ő Á Ó ű ö ü ő ő ű

ű ö ú ö ö ö ö í ű ö ö ö ű ö ö ö í ü ú í ű í ö í ú ű í ü ö ö ú ö í ö ű ú ü ö ö í ö ü ö ú ű ö ö ö í Á í ü í ö ü ö í ü ö Ő ü ö í ű ü ö í í í í í

ü ö ö ő ü ó ó ú ó

ö ö ö Ö ö ú Ö í Ö ű ö í Ö í ö ü ö í ú Ö Ö ö í ű ö ö í ö ö Ő ö í ü ö ö í Ö ö ö í ö í Ő í ű ű í Ö Ó í ö ö ö ö Ö Ö ö í ü ö ö Ö í ü Ö ö í ö ö ö ö ö Ö ö í

í ü í ü ő ő ü Í ő ő ő ú í ő ő ö ö ö ű ü í ő ő í ú ö ö ú ő ő ú í ő í ő ö ö í ő ü ü í ő ö ü ü ú í í ü ő í ü Í í í í ö ő ö ü ő í ő ő ü ű ő ő í ő í í ő ő

ű ú ó ó ü í Á Á ú ó ó ó ó ó ó ó ó ó ó ó ó ó ó í ó ü É ű ü ó í ü í í í í í ó í ü í í ó ó Á

ű Á ü ő ö í ö ö ő ő ő ő ö

ü É ö É É ö ö ö ü ö ö Á ű ö ű ű ű Á Í ö ö Ó ö

í í í í ó í ó ö ö í ű ü ó ó ü ú Á Á ó ó ó ó ó ó í ó ö ö ü Ó ö ü í ö ó ö í í ö í ó ó í ö í ú ó ú í ö ú ö ö ö í ó ó ó ú ó ü ó ö í ó ó í í í Á í ó ó ó

ü ő ő ü ü ő ő ű í í ű ő ő ő ü ő ő í í ő ő ő ő ő ő ü ü í ő Ö ő ü í ő ü í í ő ü ő í ő ő í í ő ü ü í ő ü í ő í ő í ő ü í ő í ü í í ő

Í Ó ü ü í ü ü ü í Í í É í í Í Í ü ü ü í Í ü

í í ü í í í í í Ó ő ő í í í Ú ü Ú í í Ú ő ü Ú ü ő

Ú Ú Ü Ü ű ű ű É Ú É ű

Ó Ó ú ú ú ú ú É ú

Átírás:

A beszéd Segédlet a Kommunikáció-akusztika tanulásához

Bevezetés Nyelv: az emberi társadalom egyedei közötti kommunikáció az egyed gondolkodásának legfőbb eszköze Beszéd: a nyelv elsődleges megnyilvánulása az emberi kommunikáció legelterjedtebb formája a leghatékonyabb emberi kommunikációs mód kronológiai szempontból a legelső: jóval megelőzte az írást Irodalom: Gordos-Takács: Digitális beszédfeldolgozás. Műszaki Könyvkiadó, Budapest, 1983.

A természetes beszédlánc agyi szint szervi szint akusztikai szint szervi szint agyi szint

A beszéd szerkezete Mondat > szó > szótag > beszédhang Beszédhang <> fonémák Fonémakészlet: elemek olyan minimális számosságú halmaza, amelyből minden szó csak egyféleképpen állítható elő

Hangképző szerveink / 1

A gégefő és a hangszalagok Hangképző szerveink / 2

A hangképzés módja Átviteli rendszer rezonátor rendszer (toldalékcső, vokális traktus vocal tract, artikulációs csatorna) Gerjesztések zönge turbulencia lökéshullám

zönge Gerjesztések turbulencia lökéshullám

A beszédhangok osztályozása Magánhangzók i, é, ü, ö, e á, a, o, u Mássalhangzók zárhangok nazálisok m, n, ny, ng felpattanó zárhangok (explozívák) zöngés zöngétlen pergőhang r b. d, g, gy p, t, k, ty oldalréshangok l, j réshangok (frikatívák) zöngés v, z, zs zöngétlen f, s, sz, h zár-réshangok (affrikáták) zöngés dz, dzs zöngétlen c, cs

Magánhangzók jellemzői

A magánhangzók formánsai

Mássalhangzók jellemzői Réshangok turbulens gerjesztés > vokális traktus rezonanciája Felpattanó zárhangok nem tartható hosszan nincs formánsstruktúra lökéshullám > hangszalag holtidő > állandósult magánhangzó

Gépi beszédfelismerés Korszerű beszédtechnológiák izolált szavas felismerők folyamatos beszéd felismerése beszélő személy felismerése (biometrikus adatok).. Beszédtömörítés Gépi beszédkeltés korlátozott szókészlet korlátlan szókészlet gépi felolvasás

Beszédérthetőség

A beszédérthetőséget befolyásoló tényezők 1. a beszélő artikulációs képessége 2. a hallgató hallóképessége 3. a tér, ill. terem tulajdonságai (teremakusztikai paraméterek) 4. a háttérzaj szintje A 3. és 4. paraméter esetében ez konkrétan két arányt jelent: 3. a direkt-zengő tér arányt és 4. a jel-háttérzaj arányt

Szubjektív vizsgálatok A beszédérthetőség mérése Szótagérthetőségi vizsgálat értelmetlen szótagok megfigyeltetése számos kísérleti személy bevonásával a helyesen megértett szótagok aránya az összes szótagokhoz képest (%- ban) Mondatérthetőségi vizsgálat Objektív vizsgálatok artikulációs index (AI): csak a zajt vette figyelembe Speech Intelligibility Index (SSI): a visszhangosságot is figyelembe veszi Speech Transmission Index (STI): objektív mérésekkel közelíti a szubjektív mennyiséget (nemzetközi szabvány) a beszéd sokféle frekvenciájú komponenst tartalmaz, amelyek kisfrekvenciás burkolóval amplitúdó moduláltak az érthetőséghez ennek a modulációnak meg kell maradnia a moduláció alakhű átvitelét a többutas terjedés (zengés) és a háttérzaj egyaránt rontja

Zaj hatása: Artikulációs index (AI) Helyettesítő ökölszabály: legyen a jel-zaj viszony a lehető legnagyobb, min. 5-10 dba

Zengés hatása: visszhanggal torzított felvétel Eredeti hangminta Helyszíni felvétel Mért impulzusválasz Zengetett hangminta

STI számítása modulációs transzfer függvényen keresztül: mérése régebben kisfrekvenciásan modulált sávkorlátozott zajjal, újabban impulzusválasszal ebből látszólagos jel-zaj értéket képezünk: majd több lépés után: w k 0.13 0.14 0.11 0.12 0.19 0.17 0.14

tehát függ a jel-zaj viszonytól a visszhangosságtól a sávszélességtől nemlineáris torzításoktól stb. STI jellemzői Sávszélesség CIS 350-3000 Hz 0,62 350-5700 Hz 0,77 180-3000 Hz (nagyjából ez felel meg a végpont elektroakusztikai elemei sávszélességének) 0,75 180-5700 Hz 0,86 85-11000 Hz 1

STI értékelése STI értéke Beszédérthetőség minősítése 0 0.3 Elfogadhatatlan (érthetetlen) 0.3 0.45 Rossz 0.45 0.6 Elfogadható 0.6 0.75 Jó 0.75 1 Kiváló A sokfajta beszédérthetőségi mérték összehasonlítható a CIS érték (Combined Intelligibility Scale) segítségével: CIS = 1 + lg (STI).

Mérhető jellemzők és a CIS érték kapcsolata % CIS