A magánhangzó-formánsok és a szubglottális rezonanciák összefüggése a spontán beszédben

Hasonló dokumentumok
automatikus osztályozása szubglottális rezonanciák alapján

Mondd meg, mit hallasz, és megmondom, ki vagy

Csapó Tamás Gábor. Önéletrajz TANULMÁNYOK NEMZETKÖZI TANULMÁNYOK JELENLEGI MUNKAHELY KORÁBBI MUNKAHELYEK szept okt.

Az énekelt magánhangzók észlelése réshangkörnyezetben

Beszédkutatás a technológiai fejlődés tükrében. Gráczi Tekla Etelka MTA Nyelvtudományi Intézet, Fonetikai osztály

MAGYAR NYELV 110. ÉVF NYÁR 2. SZÁM. Magánhangzók ejtése fiatalok és idősek spontán beszédében *

Szerkesztők és szerzők:

MAGYAR NYELV 110. ÉVF NYÁR 2. SZÁM. Magánhangzók ejtése fiatalok és idősek spontán beszédében *

Beszédkutatás Nyelvhasználat és alkalmazások. Programfüzet november

Ó Ü Ó Ó Ó Ó Ó Á Ó Ó Ó

ő ó ó ó ő ó ő ó ő ő ő ó ö ó ó ö ő ő ö ő ö ű ó ő ő ű ő ő ö ő ó ó ő ö ó ö ő ő ű ó ö ő ő ű ő ő ő ö ó ü ó ő ő ő ő ű ő ö ő ü ő ő ó ő ö ö ö ő ó ő ő ő ó ü ö

Ö Ö Ö Ö Á ű ű ű ű ű ű ű ű ű ű

ü ű ü ü Ó ü

A magánhangzók fonetikai rendszerezése

Ö ü ú ü ű ü ű ü Á ü ű ű ú ű Á Ű ú ü ü ú ű Á ü Ú ü ű ü ü ű ü ú ú ü ú ü ü ü ü ü ü Ü Ü Ü ü Ö Ü ü ü ü ű ü ü ű ú ü ú

ú ú ű Ó

ó ö ó ő ő ü ú ö ő ö ő ü ő ü ó ó ö ü ó ü ő ú ú ő Ú ú ó ő ő ó ú Ó Ö Ö Ö

Á Á Á ű Á

ü ú ú ú ú ü Á ü ű Ö ú ű ú ü ű ü ű Ö ű

BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA

Mády Katalin február 24.

Mitől hosszú egy mezőségi hosszú magánhangzó? Avagy: a fogadomban sok vendég van

Fonetika és fonológia

A nyelvi változás beszédjelenségeinek vizsgálata

A HANGOK TANÁTÓL A BESZÉDTECHNOLÓGIÁIG. Gósy Mária. MTA Nyelvtudományi Intézet, Kempelen Farkas Beszédkutató Laboratórium

Abari Kálmán publikációs jegyzéke

Beszédészlelés 1: Beszédpercepció. A beszédpercepció helye a beszédmegértési folyamatban

AUSZMANN ANITA TANULMÁNYOK. Eötvös Loránd Tudományegyetem Magánhangzó-minőségek siketek szövegfelolvasásában

AZ ALVEOLÁRIS ZÖNGÉTLEN EXPLOZÍVA VARIABILITÁSA. Neuberger Tilda Gráczi Tekla Etelka

Ó Ó ó ö ó

ä ä

ú ö ö ö ö ö ö Á ö ö ö á á á ű Ü ű ö ö Á á Á

Á ű ó ó

ő ő Ó

ü ú ú ü ú ú ú ú

ö ö Á Á Ó Á ö ö ö ö ö ú ű ö ö Á Á ű ű ö ö ö ö ű

ű ő ő ő

A gépi beszéd-előállítás természetességének növelése rejtett Markov-modell alapú szövegfelolvasó rendszerben

ű ű ű Ú Ú Á ű Ö ű ű Ú Ő É

Á Ö Ö Ö Ö ú ú Ö Ö Ó Ó ú ú Ü ú Ó Ö Ö Ü Ó Ö Ö Á Ó ú ú ú ű Ö Ö Ö Ö Á Ó Ö Ó ú ú Ö

Ó Ó Ó Ü Í Ü Ü Ü Ü Ü Ü Á Ő Ü Ü Ü Ü Ó Ó Á Ü Ö

ű Ö ű Ú ű ű ű Á ű

Á ó ó ó Ü Ü ó ó Ü ó ó ú ú ó ó Ü ó ó ó Ü ó ó

Ó Ó ö ú ö ö ö ö ü ú ú ö ö ö ú ú ö ö ö ú ú ú ű ö ö ú ö ü ö ö ö ö ü ú Á ö ü Á ö ö ö ö ö ö

A deixis megjelenési formái a prozódiában

ó ő ő ó ő ö ő ő ó ó ó ö ő ó ó ó ö ő ó ő ő ö Ö ő ö ó ő ö ő ő ú ö ö ü ö ó ö ö ö ő ö ö Ö ú ü ó ü ő ő ő ő ó ő ü ó ü ö ő ö ó ő ö ő ö ü ö ü ő ö ö ó ö ő ő ö

Á Á ő ő Ö ő ő ö É ö ő ö ő ő ö ő ő ö ő ő ü ö

ű Ú ű ű É Ú ű ű

Á Ó ű ű Á É ű ű ű ű Ú Ú

Í ü ű Ö ö ö ü ö ö ü ü ö ö ű ű ö Í ű Á ö Á ö

Á Ü É Ü Ú Ü É

ó Ó ú ó ó ó Á ó ó ó Á ó ó ó ó Á ó ú ó ó ó

szakmai önéletrajz Bánhalmi András Személyes információk: Végzettségek, képzések: Idegen nyelv: Oktatás:

Ó é é Ó Ó ő ű Ó Ö ü Ó é Ó ő Ó Á Ö é Ö Ó Ó é Ó Ó Ó Ó ú Ó Ó Ó Ó ű Ö Ó Ó Ó é Ó Ó ö Ö Ó Ö Ö Ó Ó Ó é ö Ö é é Ü Ó Ö Ó é Ó é ö Ó Ú Ó ő Ö Ó é é Ö ú Ó Ö ö ű ő

Ö ö Á ü ü ö ű ö ö ü ö Ö

ü ü Ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü É ü ü

ő ü ő ü ü Ö ő ő ü Ö ü Ö ü Ö ő ő

Ú ű É ű ű Ü Ü ű ű Ú É ű ű Ü ű ű ű ű ű ű ű Ú ű ű

Beszédtechnológia az információs esélyegyenlőség szolgálatában

Á ó ű ú ó ö ü ű ű ó ó ö ü ó ö ó Ö ü ó ü ű ó ö ó ó ú ó ú ó ó ó ó ó ó ó Ö ö ó ó ó ó ö ó Ű ö ó ó ü Ó ű Í ó ó ó ó ó ó Ó ü ó ó ó ó ó ó ú ó ö

Ó ú ú

FIATAL KUTATÓI PÁLYÁZAT MTA Nyelvtudományi Intézet. Kutatási terv Neuberger Tilda

ű ő ő ű Ü ő ő ő ű ű ő ú ő ú Á Á ő Á ő ő ő ű ő ű ú

ú Ó ú ú ú ú ú ú ú É Á

á é é á ó á é ö Ű í É Á ó í á ü á ó

Ü ü ü ú Ö ü ü Ö Ö Ö Ö Ő Ó ü Á Á Ö Ö Ö Ő ü Í ú ű Í ú ú

É É Ö

É Á Á Ö Á

ü ó ó ó ó ó ó ü ó í ü ü ó ó ü ó ó ü ó ü ü í í ü ü í í ó ü ü Ö ü Ö ü ü ó

ö ő ü ö ő ő ü ü ő ő ő ü ö ü ü ő ú ő ő ő ü ő ő ő ő ő ú ő ő ü ő ő ő ü ö ü ú ő ő ő ő ü ü ő ő ú

Ü ű Í Ü ű Ő Ó Í Í Í Ö Í Ü Ó Í Í ű ű Í ű ű Í Í Í Í Í ű ű ű Á ű

é ü ó ö é Ö é ü é é ó ö é ü ü é é ó ó ó é Á é é ü ó é ó ó é ö ö ö é é ü é ü é é ö ü ü é ó é é é é é é ö é é é é é é ö é ó ö ü é é é ü é é ó é ü ó ö é

ö ó Á ü ű ö ó ö ö ű ö ű ö ő ő ó ö ű ö ő í ő ó ő ó ö ó í í ó ő í í ő ö ő ő ó ő ö ű í ű í ö í ö í ű ö ö ú ö ú ö ő ó ő ö ő ő í ű ö ó ö í ó í í ő ó ü ő ő

ú ú ő ő ő ú ü ő ő ü ú ő ő

í ü Ó ö í í í ó ó í í ü í ó ü ö ó ó ö ó ó ö í ö ö ó ó í ó í í ö ö ö í ú ö ó í ó ö ó ö ó í í ú ű ú

Ö ó ó ó í ó Ö ü ó ü ü Ö ó í í ú ü ó ó ó ó ó í í ú í Ö ú í ó ó ó í ó

Az énekelt magánhangzók fonetikai elemzése

2. téma. Fonetika/fonológia. Leíró magyar hangtan. Fonéma:

í ú Í í ö ö Á ü ö í í ö ö ö ü í ü í ű í ö ü í ü

ű ű ű ű ú Í

Í ö Ű ö Á Í Ü ü Í ö

A magánhangzók fonológiai rendszere

Szintetizált beszéd természetesebbé tétele

ö ö ö ö Í ö ö ö ö ö ú ö ü ö ö ö ü ű ú ö ú ü ö ű ö ü

(In)variabilitás a mássalhangzóknál. A mássalhangzók akusztikus kulcsai

Akusztikai mérések SztahóDávid

Első sajátfrekvencia meghatározása vasúti fékpaneleknél XIV. ANSYS Konferencia Budaörs,

Érettségi eredmények 2005-től (Békéscsabai Andrássy Gyula Gimnázium és Kollégium)

A GLOTTALIZÁCIÓ SZEREPE A BESZÉLŐ SZEMÉLY FELISMERÉSÉBEN. Bőhm Tamás

ö ö ö ü ö ö ö ö ö ö Ö ü ö ü ü ü ö ü í ü ö ü Ö ö í ű ö ö í í ö ö ü í ö ö ü í ö í ü ö ü í ö ű ö ü

Alaphangjellemzők vizsgálata gyermekek beszédében

Újfajta, automatikus, döntési fa alapú adatbányászati módszer idősorok osztályozására

A semleges magánhangzóról, azaz a sváról

a munkaerőpiac számos szegmensében egyaránt szükségszerű a használata (Szabó

ű ú Í Ó Á ú Ű ű Ő Ö Á ú Ű Ü ú ú Á ú ű

Egy nyolcéves gyermek énekelt és beszélt magánhangzóinak akusztikai jellemzői. Esettanulmány

Gyermekek magánhangzói 7 és 13 éves kor között

ú Ü Í ú ú ú ú ú ú

ü ő ü ü ő ő Á ü Ö ő ő ő ő ő ü ő ú ő ü ü ő ü ő ő ü ü ő ú ú ü ő ü ü ő ő ő ú ő ő ú ő ő ú ő ő ő ő ő ő ő ű ő ő ő

Ö ő ü Ö Ö Ő ü ő Ö Ö ü ű Á Í Ö ű ü ő ő ő Ö ü ü ő ő ő Ü ü ő ő ő ü ő ő ü ü

Átírás:

A magánhangzó-formánsok és a szubglottális rezonanciák összefüggése a spontán beszédben Csapó Tamás Gábor, 1 Bárkányi Zsuzsanna, 2 Gráczi Tekla Etelka, 2 Beke András, 3 Bőhm Tamás 1,4 csapot@tmit.bme.hu 1 BME Távközlési és Médiainformatikai Tanszék 2 MTA Nyelvtudományi Intézet 3 ELTE BTK Fonetikai Tanszék 4 MTA Pszichológiai Kutatóintézet Beszédkutatás, 2009. október 16.

Bevezetés Akusztikus Percepciós További irányok A szubglottális rendszer Hipotéziseink A szubglottális rendszer és rezonanciái szubglottális rendszer (tüdő, légcső) szubglottális rezonanciák (SGR) Sg1 ~600Hz Sg2 ~1400Hz Sg3 ~2100Hz nagyjából állandó egy-egy beszélőre SGR-ek "zavarhatják" a formáns-frekvenciákat a magánhangzók kerülik az SGR környéki frekvenciákat (Stevens, 1998) korábbi kutatások, néhány nyelvre amerikai angol (Lulich, 2009) angol, spanyol (Wang et al., 2008) német (Madsack et al., 2008) koreai (Jung, 2009) magyar (Csapó et al., 2009) 2 / 10 Csapó, Bárkányi, Gráczi, Beke, Bőhm Formánsok és szubglottális rezonanciák összefüggése

Bevezetés Akusztikus Percepciós További irányok A szubglottális rendszer Hipotéziseink Hipotéziseink a formánsok és szubglottális rezonanciák összefüggéséről, a magyar nyelvre 1 a szubglottális rezonanciák természetes elválasztók bizonyos fonológiai megkülönböztető jegyek +/- értékei között (Stevens, 2002) az Sg1 határ az alsó és nem-alsó magánhangzók között az Sg2 határ az elöl és hátul képzett magánhangzók között az Sg3 határ az elöl képzett ajakkerekítéses és ajakréses magánhangzók között 2 az SGR-ek elválasztó szerepe a spontán beszédben a semleges realizációk megjelenése miatt kisebb mértékű 3 a percepció számára érzékelhető az SGR-ek helye a beszédjelből 3 / 10 Csapó, Bárkányi, Gráczi, Beke, Bőhm Formánsok és szubglottális rezonanciák összefüggése

Bevezetés Akusztikus Percepciós További irányok Felvételek, mérések Formánsok Akusztikus eredmények Felvételek, mérések (formánsok, SGR) Felvételek BEA spontánbeszéd-adatbázis 6 kiválasztott beszélője (5 férfi, 1 nő) spontánbeszéd- és logatom-felvételek gyorsulásmérő felvételek (nyakra szorítva) Formánsmérések automatikus címkézés (BME TMIT) + kézi ellenőrzés automatikus formánsmérés (Praat) + kézi ellenőrzés F1 és F2, minden magánhangzó közepén Szubglottális rezonancia mérések manuális mérés (Wavesurfer, LPC) Sg1, Sg2 és Sg3, magánhangzókban 20 mérési pont / beszélő / SGR Frekvencia Frequency (khz) 4 3 2 1 0 0 0.1 0.2 0.3 0.4 0.5 Idı Time (s) Sg1 Sg2 Sg3 Frekvencia (khz) 4 / 10 Csapó, Bárkányi, Gráczi, Beke, Bőhm Formánsok és szubglottális rezonanciák összefüggése

Bevezetés Akusztikus Percepciós További irányok Felvételek, mérések Formánsok Akusztikus eredmények Formánsábrák 200 beaa logatom 200 beaa spontán 300 300 400 400 F1 600 700 Sg1 F1 600 700 Sg1 800 800 900 900 1000 Sg3 Sg2 1000 Sg3 Sg2 különbségek logatom spontán beaa beab 1100 3000 200 300 400 2 2000 1 F2 beab logatom 1000 1100 3000 200 300 400 2 2000 1 F2 beab spontán 1000 Medián (Hz) BEA Sg1 Sg2 Sg3 A 558 1532 2354 B 521 1402 2420 F1 600 700 800 900 1000 1100 3000 Sg3 Sg2 2 2000 1 1000 F2 Sg1 F1 600 700 800 900 1000 1100 3000 Sg3 Sg2 2 2000 1 1000 F2 Sg1 5 / 10 Csapó, Bárkányi, Gráczi, Beke, Bőhm Formánsok és szubglottális rezonanciák összefüggése

Bevezetés Akusztikus Percepciós További irányok Felvételek, mérések Formánsok Akusztikus eredmények Szubglottális rezonanciák csoportelválasztó szerepe logatom Távolság az optimálistól F1 / Sg1 17,23% F2 / Sg2 5,35% F2 / Sg3 18,02% spontán Távolság az optimálistól F1 / Sg1 17,95% F2 / Sg2 5,6% F2 / Sg3 22,59% 6 / 10 Csapó, Bárkányi, Gráczi, Beke, Bőhm Formánsok és szubglottális rezonanciák összefüggése

Bevezetés Akusztikus Percepciós További irányok Felvételek, mérések Formánsok Akusztikus eredmények Akusztikus eredmények összefoglalása Hipotézisek teljesülése 1 magánhangzó kategóriák elválasztásának pontossága F1 / Sg1 (alsó nem-alsó) : rossz F2 / Sg2 (elöl hátul) : jó F2 / Sg3 (ajakker. ajakrés) : rossz 2 az SGR-ek elválasztó szerepe a spontán beszédben közel optimális elválasztás a semlegesedés miatt kisebb pontosság Lehetséges okok Sg1-et és Sg3-at nehéz mérni magyarban az elöl / hátul (Sg2) fontosabb kontraszt beszélőnkénti eltérések 7 / 10 Csapó, Bárkányi, Gráczi, Beke, Bőhm Formánsok és szubglottális rezonanciák összefüggése

Bevezetés Akusztikus Percepciós További irányok Cél Eredmény Percepciós teszt - cél 2 beszélő (beaa és beab) spontánbeszéd-felvételeiből CVC kapcsolatok [O] magánhangzó vizsgálata F2 < Sg2 F2 > Sg2 beszélőnként 25 db [O] 5-5 db [a:], [E], [e:], [ø], [u] feladat: "Melyik hangot hallottad?" cél: van különbség a magánhangzók percepciójában, az F2 és Sg2 helyzetétől függően? 25 tesztelő 8 / 10 Csapó, Bárkányi, Gráczi, Beke, Bőhm Formánsok és szubglottális rezonanciák összefüggése

Bevezetés Akusztikus Percepciós További irányok Cél Eredmény Percepciós teszt - eredmények beaa válasz /a/ /á/ /e/ /o/ /ö/ /u/ stimulus /a/, F2<Sg2 60,77% 1,54% 0,77% 31,15% 5,00% 0,77% /a/, F2>Sg2 75,91% 10,91% 9,55% 2,27% 0,91% 0,45% beab válasz /a/ /á/ /e/ /o/ /ö/ /u/ stimulus /a/, F2<Sg2 70,94% 6,25% 1,88% 16,88% 3,75% 0,31% /a/, F2>Sg2 35,63% 2,50% 21,88% 8,75% 30,63% 0,63% Hipotézisek teljesülése 3 az SGR-ek elválasztó szerepét a percepciós teszt nem igazolta 9 / 10 Csapó, Bárkányi, Gráczi, Beke, Bőhm Formánsok és szubglottális rezonanciák összefüggése

Bevezetés Akusztikus Percepciós További irányok További kutatási irányok lehetséges alkalmazási területek beszélő normalizálás beszélő felismerés további kutatás alternatív SGR mérési módszerek percepciós vizsgálatok más hangokra más nyelvek vizsgálata 10 / 10 Csapó, Bárkányi, Gráczi, Beke, Bőhm Formánsok és szubglottális rezonanciák összefüggése

Bevezetés Akusztikus Percepciós További irányok További kutatási irányok lehetséges alkalmazási területek beszélő normalizálás beszélő felismerés további kutatás alternatív SGR mérési módszerek percepciós vizsgálatok más hangokra más nyelvek vizsgálata Köszönöm a figyelmet! csapot@tmit.bme.hu 10 / 10 Csapó, Bárkányi, Gráczi, Beke, Bőhm Formánsok és szubglottális rezonanciák összefüggése

Bevezetés Akusztikus Percepciós További irányok Irodalomjegyzék Csapó, T. G., Bárkányi, Zs., Gráczi, T. E., Bőhm, T., and Lulich, S. M. (2009). Relation of formants and subglottal resonances in Hungarian vowels, in Proc. Interspeech 484 487. Jung, Y. (2009). Subglottal effects on the vowels across language: Preliminary study on Korean, JASA 125:2638. Lulich, S. M. (2009). Subglottal resonances and distinctive features, Journal of Phonetics, doi:10.1016/j.wocn.2008.10.006. Madsack, A., Lulich, S. M., Wokurek, W., and Dogil, G. (2008). Subglottal resonances and vowel formant variability: A case study of high German monophthongs and Swabian diphthongs, in Proc. LabPhon, 11:91 92. Stevens, K. N. (1998). Acoustic Phonetics, Cambridge, MA: MIT Press. Stevens, K. N. (2002). Toward a model for lexical access based on acoustic landmarks and distinctive features, JASA 111:1872 1891. Wang, S., Lulich, S. M., and Alwan, A. (2008). A reliable technique for detecting the second subglottal resonance and its use in cross-language speaker adaptation, in Proc. Interspeech 1717 1720. 11 / 10 Csapó, Bárkányi, Gráczi, Beke, Bőhm Formánsok és szubglottális rezonanciák összefüggése