Beszédinformációs rendszerek

Hasonló dokumentumok
Akusztikai mérések SztahóDávid

Beszédhangok és spektrális jellemzésük

A beszéd. Segédlet a Kommunikáció-akusztika tanulásához

A magánhangzók fonetikai rendszerezése

Beszédinformációs rendszerek. 3. gyakorlat - Elemi jelfeldolgozás (a beszédjel feldolgozásának lépései)

1. A hang, mint akusztikus jel

Beszédinformációs rendszerek

Bevezetés a nyelvtudományba Fonetika

A beszédképzés szervei

A hangképz A hangszalagok működése (fonáció)

Bevezetés a nyelvtudományba. 2. Fonetika

Beszédinformációs rendszerek órajegyzet BEVEZETÉS

A mássalhangzók. Konszonánsok (consonans) jelölése: C Mássalhangzók vs. magánhangzók? Mi jellemző a mássalhangzókra?

Zaj- és rezgés. Törvényszerűségek

Az énekelt magánhangzók fonetikai elemzése

Felvételi előkészítő. magyar nyelvből. 1. foglalkozás

A beszédhang felfedezése. A hangok jelölése a fonetikában

A hangtan irányai, fajai Olvasnivaló: Bolla Kálmán: A leíró hangtan vázlata. Fejezetek a magyar leíró hangtanból. Szerk. Bolla Kálmán. Bp., 1982.

book 2010/9/9 14:36 page v #5

Tartalomjegyzék. Rövidítések jegyzéke... EMBER, NYELV, BESZÉD. 1. A beszéd és az információs társadalom... 3

Fonetika és fonológia

A BESZÉD ARTIKULÁCIÓS SZINTÉZISE AZ ELTE FüNETIKAI TANSZÉKÉN. Szűcs László Eötvös Loránd Tudományegyetem Fonetikai Tanszék

Beszédinformációs rendszerek

2. Az emberi hallásról

Hullámok, hanghullámok

Beszédátvitel a GSM rendszerben, fizikai és logikai csatornák

Beszédinformációs rendszerek 6. gyakorlat

A magánhangzók artikulációs jellemzése

Az énekelt magánhangzók észlelése réshangkörnyezetben

Fourier-sorfejtés vizsgálata Négyszögjel sorfejtése, átviteli vizsgálata

Leíró magyar hangtan. A magánhangzók fonetikai rendszerezése. Képzésmódok. A) Nyílás B) Akadály

Leíró magyar hangtan

1 OLASZY GÁBOR MÁSSALHANGZÓ-KAPCSOLÓDÁSOK A MAGYAR BESZÉDBEN

Gyakorlat. Bevezetés. Elméleti bevezető

ÉS S NYELVI REPREZENTÁCI CIÓ. MTA Nyelvtudományi Intézet

Fonetika. Tóth Ildikó, PhD. Bevezetés a nyelvtudományba 2. előadás 2009 Pázmány Péter Katolikus Egyetem

Beszéd és fizika. A gégefő horizontális metszete

1. témakör. A hírközlés célja, általános modellje A jelek osztályozása Periodikus jelek leírása időtartományban

Szivattyú-csővezeték rendszer rezgésfelügyelete. Dr. Hegedűs Ferenc

Ó Ó ó ö ó

ó Ó ú ó ó ó Á ó ó ó Á ó ó ó ó Á ó ú ó ó ó

Á ű ó ó

Analóg elektronika - laboratóriumi gyakorlatok

ű ű ű Ú Ú Á ű Ö ű ű Ú Ő É

ű Ö ű Ú ű ű ű Á ű

Á Ó ű ű Á É ű ű ű ű Ú Ú

Á Á ő ő Ö ő ő ö É ö ő ö ő ő ö ő ő ö ő ő ü ö

ö ö Á Á Ó Á ö ö ö ö ö ú ű ö ö Á Á ű ű ö ö ö ö ű

ű Ú ű ű É Ú ű ű

Á Ö Ö Ö Ö ú ú Ö Ö Ó Ó ú ú Ü ú Ó Ö Ö Ü Ó Ö Ö Á Ó ú ú ú ű Ö Ö Ö Ö Á Ó Ö Ó ú ú Ö

Ó é é Ó Ó ő ű Ó Ö ü Ó é Ó ő Ó Á Ö é Ö Ó Ó é Ó Ó Ó Ó ú Ó Ó Ó Ó ű Ö Ó Ó Ó é Ó Ó ö Ö Ó Ö Ö Ó Ó Ó é ö Ö é é Ü Ó Ö Ó é Ó é ö Ó Ú Ó ő Ö Ó é é Ö ú Ó Ö ö ű ő

ó ő ő ó ő ö ő ő ó ó ó ö ő ó ó ó ö ő ó ő ő ö Ö ő ö ó ő ö ő ő ú ö ö ü ö ó ö ö ö ő ö ö Ö ú ü ó ü ő ő ő ő ó ő ü ó ü ö ő ö ó ő ö ő ö ü ö ü ő ö ö ó ö ő ő ö

Ó Ó ö ú ö ö ö ö ü ú ú ö ö ö ú ú ö ö ö ú ú ú ű ö ö ú ö ü ö ö ö ö ü ú Á ö ü Á ö ö ö ö ö ö

Á Ü É Ü Ú Ü É

ü ü Ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü É ü ü

Ú ű É ű ű Ü Ü ű ű Ú É ű ű Ü ű ű ű ű ű ű ű Ú ű ű

ű ő ő ő

É Á Á Ö Á

ú ö ö ö ö ö ö Á ö ö ö á á á ű Ü ű ö ö Á á Á

Á ó ó ó Ü Ü ó ó Ü ó ó ú ú ó ó Ü ó ó ó Ü ó ó

é ü ó ö é Ö é ü é é ó ö é ü ü é é ó ó ó é Á é é ü ó é ó ó é ö ö ö é é ü é ü é é ö ü ü é ó é é é é é é ö é é é é é é ö é ó ö ü é é é ü é é ó é ü ó ö é

É É Ö

ú Ó ú ú ú ú ú ú ú É Á

ö ő ü ö ő ő ü ü ő ő ő ü ö ü ü ő ú ő ő ő ü ő ő ő ő ő ú ő ő ü ő ő ő ü ö ü ú ő ő ő ő ü ü ő ő ú

ü ú ú ü ú ú ú ú

ü ö ű ö ű ö Ö ö ú ü Á ü ü ö

Magánhangzók ejtése és észlelése. deme andrea. a szopránéneklésben

Különleges beszédképzési módok: éneklés, suttogás, gége nélküli beszéd, hasbeszélés

ö ö ö ö ö ő ú ü ő ö ü ő ú ő ő ő ö ő ö ü ű ö ü ő ú ő ő ő ű ű ö ő ő ü

Fizikai hangtan, fiziológiai hangtan és építészeti hangtan

Beszédészlelés 1: Beszédpercepció. A beszédpercepció helye a beszédmegértési folyamatban

KEMPELEN FARKAS BESZÉLŐGÉPÉNEK REKONSTRUKCIÓJA. Nikléczy Péter Olaszy Gábor

2. Hangfrekvenciás mechanikai rezgések vizsgálata jegyzőkönyv. Zsigmond Anna Fizika Bsc II. Mérés dátuma: Leadás dátuma:

Rezgés, Hullámok. Rezgés, oszcilláció. Harmonikus rezgő mozgás jellemzői

1. Nagy betűk - először a magánhangzók: A E U Ú I Í O Ó É Á Ü Ű Ö Ő - utána a mássalhangzók: M L H T S K R N B Z G V D SZ P C GY J CS NY F TY ZS LY

A 2014/2015. tanévi Országos Középiskolai Tanulmányi Verseny döntő forduló FIZIKA II. KATEGÓRIA MEGOLDÁSI ÚTMUTATÓ

Mechanikai hullámok. Hullámhegyek és hullámvölgyek alakulnak ki.

A spontán beszéd kísérőjelenségei

A gépi beszéd-előállítás természetességének növelése rejtett Markov-modell alapú szövegfelolvasó rendszerben

ű ú Í Ó Á ú Ű ű Ő Ö Á ú Ű Ü ú ú Á ú ű

Külső fül: Középfül: Belső fül:

ú Ü Í ú ú ú ú ú ú

Hangfrekvenciás mechanikai rezgések vizsgálata

Hullámmozgás. Mechanikai hullámok A hang és jellemzői A fény hullámtermészete

É ú É ö ö ű ö ö ö ú ú ú ű ű ú ö ű ö ű ű ü ö ö ü ű ö ü ö ö ö ö ú ü ö ö ö ú ö ö ú ö ö ú ü ú ú ú ű ü ö ö ű ú ű ű ü ö ű ö ö ö ű ú ö ö ü ú ü ö ö ö ü ú ö ű

É Í Á Á É Ü Ó É É É É Í Ó Ó Ő Á Á É Á É É É É Á É É Á Á É É Á É Í

É Ö Á Í Á Ó Ö ü

ú ű ú ú ű ú ű ű ú ű ú ű Á ű ű Á ű ű ú ú ú ú ú ú ű ú ú ú ú ú ú ú ú

Ö Ö Ú Ó Ö ű Ő Ő ű ű Ü Ő Ó Ő

É ö Ű ő ű ő ő ű ű

Ü

A magánhangzók fonológai rendszere

PRECÍZIÓS, PÁRHUZAMOS, MAGYAR BESZÉDADATBÁZIS FEJLESZTÉSE ÉS SZOLGÁLTATÁSAI. Olaszy Gábor

ú ú ö ö ü ü ü ü ű ü ü

ö ő ő ü ü Ó ü ö ű Á ő ő ö ő Á Ó ű ö ü ő ő ű

Ó ű ű Á ú ű ű ú ú ú ű ű É ú É Á Á ú ű Ü Á Ü Á ű Ö Ú É Ó É Á Á Á Ű Á úá Á Ö É Ö É Ü

BESZÉDADATBÁZISOK KÉSZÍTÉSE GÉPI BESZÉDELŐÁLLÍTÁSHOZ. Olaszy Gábor MTA Nyelvtudományi Intézet

é ú é é é é é é é é é é é é ú é ö é é é ö Ő é é é ú é é é é é é é é ö é é é ö é Ö é é ö é ö é é é ű é ö ö é ö é é ö ö é é ö ö é ö é Ö é ú é é é é é é

Á Á Ö Ö Ü É Ö É É Á Ú É É É É Á Á Ö Ö Ő

ő ő ő ő ú É ü ú ú ű ú ű ő ő ő ő Á Á ü ő É É É É É É Á Ú Á Á ő ő ő ő ő É Á Á Á ő ő ő Á ü ő ő ü

Átírás:

Beszédinformációs rendszerek Beszédkeltés gyakorlat A gyakorlatot előkészítették: Dr. Olaszy Gábor Dr. Németh Géza email: [olaszy, nemeth]@tmit.bme.hu

A gyakorlat anyaga Az emberi beszédkeltésről általában Hangkeltés a gége szintjén, akusztikai paraméterek Artikulációs csatorna és átviteli tulajdonságai A beszédre jellemző fizikai értékek és sarokpontjaik Hullámformák értelmezése hangtípusonként Hangspektrogramok és olvasásuk alapjai

A beszédkommunikáció elemei A beszéd hangteste (a fizikai rezgés): a beszélő közli a mondanivalót Szünet: két közlés közötti szakasz, a hallgatót segíti az elhangzottak megértésében A beszédkommunikációban a beszéd és a szünet váltakozva van jelen

Beszéd hangteste A beszéd biológiai rendszerek között működik, a végeredmény a fiziológiai állapottól függ, egyéni és egyszeri akusztikai jel, rezgésformája a pillanathoz köthető. Minősége mindaddig nem változik, ameddig ezt az egységet nem bontjuk meg (gépi beavatkozás) A beszéd zöngés és nem zöngés hangelemek váltakozása (egy homogén szakasz egy vagy több beszédhangot is magában foglalhat) Példa hullámforma: Lali, kapták A beszéd hangnyomás-idő függvénye az artikuláció akusztikai vetületeként értelmezhető minden időpillanatban KÖVETKEZMÉNY: A spektrális kép folyamatosan változik

A beszéd frekvencia tartománya Forrás: A magyar beszéd 27. o. Fmax= 10 000 Hz (sz, c hangok) Fmin= 70 Hz (férfi Fo a kijelentő mondat végén)

Beszédképzés rendszere Soros akusztikai rendszer: 1. Hangkeltés (forrás jel): tüdő, gége, 2. Hangformálás (szűrő): artikulációs csatorna Az eredmény a hangtest, a beszéd hangzó része A hangtest akusztikai szerkezete a soros rendszerben folyamatosan változik A soros rendszer minden elemét az agy vezérli

Az emberi beszédkeltés szervei Forrás: http://www.kt.tucottbus.de/speech-analysis/

A gége a hangképzés alapja Gége (CD 13. oldal) Gégeállások bemutatása (CD 16. oldal) Zöngeképzés (fix helyhez kötött) 1. Tüdő növeli a nyomást a szubglottális térben (légcső), mialatt a hangszalagokat a gégeizmok összezárják, tehát a levegő nem tud tovább jutni. Nyomásnövekedés. 2. A nyomásnövekedés egy pontján a gégeizmok erőhatása már nem tudja a zárt állapotot tartani, tehát a hangszalagok fokozatosan szétnyílnak (de a gégeizmok záró ereje nem változik). CD 17. oldal, nyitódási-záródási ciklus 3. A nyíláson a levegő kiszökik a gége feletti (szupraglottális) térbe, majd amikor a nyomáskiegyenlítődés létrejön, az izmok ismét összezárják a hangszalagokat. Ez egy periódus a zöngés hangok képzésében. A folyamat az 1. ponttól folytatódik tovább. Ez a nyomásváltozás hallható hang, elnevezése: zöngehang, zönge A hangszalagok nem rezegnek, hanem kényszermozgást végeznek, megszaggaták a tüdőből kiáramló levegőt! Ezt a kváziperiodikus jelet hívják zöngének. Minden zöngés hang alapja a zönge (ez formálódik tovább) A zönge időfüggvénye egyén és frekvenciafüggő! Akár minden időpillanatban más és más lehet a beszéd folyamán! (könyv: 22. o.) A zöngehang hangzása nem beszéd (CD 17. oldal) A zönge komplex periodikus hang

A zönge fizikai tulajdonságai Periódus gyakorisága: alaphang, alapfrekvencia (a periódus időből számítható) Fo (Hz) Jellemző átlagértékek: férfiaknál 100 Hz, nőknél 200 Hz, gyermekeknél 400 Hz Szerepe a beszédben: Az alaphang frekvenciájának változása alakítja ki a beszéd dallamát Alalaphangváltoztatással fejezzük ki a modalitást Az alaphang frekvenciaváltozása a hangsúlyozásban is részt vesz A nyomás-amplitúdó nagysága: hangerő Jellemző átlagérték: normál hangerejű beszélgetésnél 50 db a hangnyomásszint Átfogási sáv a beszéd dinamikájára a suttogástól a kiabálásig: 60 db Egyéb szerepe a beszédben: A beszédhangok specifikus intenzitásai A hangsúlyozás nyomatékának segítése hangerővel A beszéd érzelmi töltésének kifejezése hangerővel A zönge spektruma vonalas. Felharmonikusai 4000 Hz-ig terjednek 12 db/oktáv amplitúdó csökkenéssel A felharmonikusok frekvenciatávolsága egyenlő!

A zönge spektrumképe egyénfüggő gazdag felharmonikus tartalom = karakteres beszéd csökkentett felharmonikus tartalom = fátyolos beszéd

A gége szerepe a zöngétlen hangoknál (fúvó és h állás) A zöngétlen mássalhangzók hangképzése (kivéve a h hangot) a fúvó állással történik Fúvó állás. A tüdő növeli a nyomást a szubglottális térben (légcső), és a levegő megszakítás nélkül, folyamatosan tovább halad az artikulációs csatornába. A h állás csak ehhez a mássalhangzóhoz kötődik (pl. hal, hol, hitel). Ez a hang rendelkezik a legkisebb intenzitással a beszédben.

Hangzási típusok Hangzási formák a gerjesztés függvényében zöngés; zöngétlen (turbulens áramlás van), illetve csend szakasz (nincs jel) Zöngés hangok CD 16., 17. o. a zöngehang fix helyen képződik (gége) V-k és b, d, g, gy, m, n, ny, j, v, l, r Turbulens áramlásos hangok : h, f,sz,s,c, cs Zöngés-zörejes hangok: z, zs, dz, dzs Lökéshullámmal rendelkező hangok: (könyv 54.o.) zöngések: b, d, g, gy (fojtott zönge rész) zöngétlenek: p, t, k, ty (néma fázis, azaz csend szakasz)

A beszédhangok megformálása Artikulációs csatorna (toldalékcső: 14-17 cm) Fix artikulációs szervek CD 23. o. Aktív artikulációs szervek CD 23. o. Az artikulációs csatorna jellemző pontjai CD 24. o. A rezonanciafrekvenciák - formánsok A gége és a toldalékcső független rendszerek (lásd gégeirtottak beszéde, suttogott beszéd) Bemutató a spektrális tér kitöltésére: CD 84/2 o. Az artikulációs csatorna modellezése: forrásjellel gerjesztett szűrő

Mi a formáns? Az artikulációs csatorna rezonanciafrekvenciái által felerősített felhangok nyalábja, azaz a szűrő rezonanciahelyein kialakult felerősített felhangok csoportja. Egy hang hangzását több formáns alakítja ki. http://magyarbeszed.tmit.bme.hu/formans http://magyarbeszed.tmit.bme.hu/cvvc

Mi a formáns? Az artikulációs csatorna rezonanciafrekvenciái által felerősített felhangok nyalábja http://magyarbeszed.tmit.bme.hu/formans http://magyarbeszed.tmit.bme.hu/cvvc

http://magyarbeszed.tmit.bme.hu/formans

Mi a formáns? Az artikulációs csatorna rezonanciafrekvenciái által felerősített felhangok nyalábja http://magyarbeszed.tmit.bme.hu/formans

Mi a formáns? Az artikulációs csatorna rezonanciafrekvenciái által felerősített felhangok nyalábja http://magyarbeszed.tmit.bme.hu/cvvc

Szorgalmi feladat Az eredmény elküldendő: olaszy@tmit.bme.hu Saját nevének hangjait jellemezze (táblázatban) 1. Adja meg a hangsort valamilyen hangjelöléssel. 2. Mennyi az egyes hangok jellemző időtartama? 3. Mely hangokban mérhetők formánsok? 4. Mennyi a mérhető formánsok frekvenciája a mért hangok 50%-os pontjában? F1, F2, F3 értékét kell megadni. 5. Mennyi a V-k közepén az alapfrekvencia hangonként (pontosan)? 6. Mennyi a különbség a legintenzívebb és legkisebb intenzitású hang között a hangsorban? 7. Mely hangoknál van gerjesztésváltás? A FELADAT MEGOLDÁSÁNÁL LEGYEN KREATÍV! http://magyarbeszed.tmit.bme.hu/cvvc http://magyarbeszed.tmit.bme.hu/formans http://magyarbeszed.tmit.bme.hu/mksz A feladat fenti szövege a speechlab-on található!

Hangátmenet. A beszéd nem egymás után kapcsolt hangok sorozata. A beszédhangok hangátmenettel kapcsolódnak egymáshoz. (Forrás: Elektronikus beszédelőállítás)

Hangspektrogram olvasás Mit olvashatunk le egy hangspektrogramról? Frekvenciakomponenseket, intenzitást, időszerkezetet -- Jellemző, hogy milyen frekvenciafelbontással készült: keskeny sávú frekvencia felbontás (széles időablak) Fo + a felhangok látszanak az idő függvényében, Fo leolvasható a frekvenciatengelyen széles sáv (keskeny időablak) formánsok látszanak foltként (összemosódnak a felerősített felhangok), zárfelpattanások jól látszanak (finom az időfelbontás) Fo értéke az időtengely bordázottságából számítható A feketedés foka (3. dimenzió) mutatja a nagy energiájú frekvenciakomponenseket (formánsok, zörejsávok)

Hangspektrogram ábrázolási formák (színes is lehet)

Egy hangsor hullámformája és formánsszerkezete I s t v á nbe k a pcs o l t aa sz á mí t ó g é p e t.

Hullámforma olvasás A beszédhangok hullámformái jellegzetesek, a hangtípustól függnek Magánhangzók nagy amplitúdójú periodikus rezgés Mássalhangzók egyedi amplitúdó formák és nagyságok Gyakorlati bemutató az egyes hangtípusokra beszédszintetizátorral További gyakorlás: http://magyarbeszed.tmit.bme.hu

Vége a gyakorlatnak, várom a kérdéseket.