A HANGSÚLY EGYIK JELLEMZŐ MODALITÁSÁNAK VIZSGÁLATA EXAMINATION OF ONE OF THE CHARACTERISTIC MODALITIES OF STRESS

Hasonló dokumentumok
BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA

A HANGOK TANÁTÓL A BESZÉDTECHNOLÓGIÁIG. Gósy Mária. MTA Nyelvtudományi Intézet, Kempelen Farkas Beszédkutató Laboratórium

A fonetik ar ol altal aban szeptember 15.

Szerkesztők és szerzők:

Folyamatos beszéd szószintű automatikus szegmentálása szupraszegmentális jegyek alapján

A deixis megjelenési formái a prozódiában

A magánhangzó-formánsok és a szubglottális rezonanciák összefüggése a spontán beszédben

Szupraszegmentális szerkezet

Fonetika február 14.

Szókezdetek automatikus osztályozása spontán beszédben

MISKOLCI EGYETEM GÉPÉSZMÉRNÖKI ÉS INFORMATIKAI KAR A BESZÉDMINŐSÉG AUTOMATIKUS ÉRTÉKELÉSE. PhD értekezés tézisei

Szintetizált beszéd természetesebbé tétele

Beszédfelismerő szoftver adaptálása C# programozási nyelvre

Mély neuronhálók alkalmazása és optimalizálása

szakmai önéletrajz Bánhalmi András Személyes információk: Végzettségek, képzések: Idegen nyelv: Oktatás:

Multimédia az audiovizuális beszédfeldolgozásban. dr. Czap László

Bevezetés a nyelvtudományba Mondattan (szintaxis) Kiegészítés

VIII. Magyar Számítógépes. Nyelvészeti Konferencia MSZNY Szerkesztette: Tanács Attila. Vincze Veronika

Szaszák György okl. villamosmérnök. A szupraszegmentális jellemzők szerepe és felhasználása a gépi beszédfelismerésben

Beszédadatbázis irodai számítógép-felhasználói környezetben

TALAJVÍZSZINT ADATOK SPEKTRÁLIS FELDOLGOZÁSÁNAK EREDMÉNYEI

SZÁMÍTÓGÉPPEL TÁMOGATOTT PROZÓDIAOKTATÓ PROGRAM COMPUTER-AIDED PROSODY TEACHING PROGRAMME

Az előadás tartalma. Debrecen 110 év hosszúságú csapadékadatainak vizsgálata Ilyés Csaba Turai Endre Szűcs Péter Ciklusok felkutatása

Akusztikai mérések SztahóDávid

Beszédfelismerő modellépítési kísérletek akusztikai, fonetikai szinten, kórházi leletező beszédfelismerő kifejlesztése céljából

A spontán beszéd kísérőjelenségei

Dodé Réka (ELTE BTK Nyelvtudomány Doktori IskolaAlkalmazott Alknyelvdok 2017 nyelvészet program) február 3. 1 / 17

A szupraszegmentális jellemzők szerepe és felhasználása a gépi beszédfelismerésben. Szaszák György

AZ AKUSZTIKUS ÉS VIZUÁLIS JEL ASZINKRONITÁSA A BESZÉDBEN

Szegmentálási egységek összehasonlítása gépi érzelem felismerés esetén

Abari Kálmán publikációs jegyzéke

A szupraszegmentális szerkezet

A beszéd prozódiai jellemzőinek észlelése. Honbolygó Ferenc

Navracsics Judit Bátyi Szilvia (szerk.): Első- és második nyelv: interdiszciplináris megközelítések. Pszicholingvisztikai tanulmányok VI.

DETERMINATION OF SHEAR STRENGTH OF SOLID WASTES BASED ON CPT TEST RESULTS

A modern e-learning lehetőségei a tűzoltók oktatásának fejlesztésében. Dicse Jenő üzletfejlesztési igazgató

TALAJVÍZSZINT-ADATOK SPEKTRÁLIS FELDOLGOZÁSÁNAK EREDMÉNYEI

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

Beszámoló a Scopes SP2 együttműködés keretében a BME TMIT-n az 1. évben végzett kutatásról

A beszéd. Segédlet a Kommunikáció-akusztika tanulásához

Új alapokon az egészségügyi informatika

Csecsemők és nyelv Mit tudhat meg a nyelvészkutató a babáktól? Kutatók éjszakája 2013 (DE) Fehér Krisztina szeptember 27.

Beszédészlelés 1: Beszédpercepció. A beszédpercepció helye a beszédmegértési folyamatban

Tartalomjegyzék. Rövidítések jegyzéke... EMBER, NYELV, BESZÉD. 1. A beszéd és az információs társadalom... 3

Beszédfelismerés és szintézis tételek:

Jelek és rendszerek 1. 10/9/2011 Dr. Buchman Attila Informatikai Rendszerek és Hálózatok Tanszék

8. Pontmegfeleltetések

Syllabus. Partiumi Keresztény Egyetem, Nagyvárad Bölcsészettudományi Kar Magyar nyelv és irodalom

A CAN mint ipari kommunikációs protokoll CAN as industrial communication protocol

Alaphangjellemzők vizsgálata gyermekek beszédében

Audiovizuális beszédfelismerés és beszédszintézis. PhD értekezés tézisei. Czap László. Tudományos vezetők: Dr. Gordos Géza Dr. Vicsi Klára 2004.

Kétdimenziós mesterséges festési eljárások. Hatások és alkalmazások

Prozódiai információ felhasználása a beszédfelismerés hatékonyságának növelésére

Beszédtechnológia az információs esélyegyenlőség szolgálatában

A TANTÁRGY ADATLAPJA

KOPI. Fordítási plágiumok keresése MTA SZTAKI DSD. Pataki Máté MSZNY Department of Distributed Systems

Geokémia gyakorlat. 1. Geokémiai adatok értelmezése: egyszerű statisztikai módszerek. Geológus szakirány (BSc) Dr. Lukács Réka

2006. szeptember 28. A BESZÉDPERCEPCI DPERCEPCIÓ. Fonetikai Osztály

Beszédinformációs rendszerek 6. gyakorlat

1.ábra: A Beszédmester nyitóképe

Multimédia az audiovizuális beszédfeldolgozásban. dr. Czap László

Using the CW-Net in a user defined IP network

book 2010/9/9 14:36 page v #5

Honbolygó Ferenc. A beszéd prozódiai jellemzőinek észlelése

Beszédhiba és beszédfeldolgozás

CSAPADÉK ÉS TALAJVÍZSZINT ÉRTÉKEK SPEKTRÁLIS ELEMZÉSE A MEZŐKERESZTES-I ADATOK ALAPJÁN*

AUTOMATIKUS ÉRZELEM-FELISMERÉS AKUSZTIKAI PARAMÉTEREK ALAPJÁN

A zsidóság nyelvei. Biró Tamás március 24.

PUBLIKÁCIÓS JEGYZÉK Dr. Schéder Veronika PhD

Távközlô hálózati folyamatok monitorozása

EGYÜTTHALADÓ. migráns gyermekek az. iskolában. Európai Integrációs Alap

TÁMOP A-11/1/KONV WORKSHOP Június 27.

YANG ZIJIAN GYŐZŐ 杨子剑

A mesterképzési szakon szerezhető végzettségi szint és a szakképzettség oklevélben szereplő megjelölése:

LOGISZTIKA A TUDOMÁNYBAN ÉS A GAZDASÁGBAN

Óvodás és kisiskolás gyermekek interpretált beszédének vizsgálata

MAGASÉPÍTÉSI PROJEKT KOCÁZATAINAK VIZSGÁLATA SZAKMAI INTERJÚK TÜKRÉBEN 1 CSERPES IMRE 2

A beszédpercepció és az anyanyelv fonotaxisa. Bevezetés a társas-kognitív nyelvészetbe Fehér Krisztina március 21.

PRÓBAMÉRÉSEK TEREPI KÖRÜLMÉNYEK KÖZÖTT KÖNNYŰ EJTŐSÚLYOS DINAMIKUS TERHELŐTÁRCSÁVAL

Beszédfeldolgozási zavarok és a tanulási nehézségek összefüggései. Gósy Mária MTA Nyelvtudományi Intézete

Hulladékból energiát technológiák vizsgálata életciklus-elemzéssel kapcsolt energiatermelés esetén Bodnár István

Multi-modális ember-gép kapcsolatok

A beszédhang felfedezése. A hangok jelölése a fonetikában

A hangtan irányai, fajai Olvasnivaló: Bolla Kálmán: A leíró hangtan vázlata. Fejezetek a magyar leíró hangtanból. Szerk. Bolla Kálmán. Bp., 1982.

Önálló laboratórium tárgyak

Statisztikai eljárások a mintafelismerésben és a gépi tanulásban

A BDF website elemzése SPSS CLEMENTINE WEB MINING segítségével. Zsiros Péter

Geoelektromos tomográfia alkalmazása a kőbányászatban

A HG-1 Treebank és keresőfelület fejlesztői munkái, használata és felhasználhatósága

Markov modellek

PARAMÉTERES GÖRBÉK ALKALMAZÁSA VALÓSIDE- JŰ DIGITÁLIS HANGFELDOLGOZÁS SORÁN

Smarter cities okos városok. Dr. Lados Mihály intézetigazgató Horváthné Dr. Barsi Boglárka tudományos munkatárs MTA RKK NYUTI

FEJMOZGÁS MÉRTÉKEK HANGANYAGBÓL TÖRTÉNŐ MEGÁLLAPÍTÁSÁNAK KEZDETI EREDMÉNYEI

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

Számítógépes döntéstámogatás. Bevezetés és tematika

A BÜKKI KARSZTVÍZSZINT ÉSZLELŐ RENDSZER KERETÉBEN GYŰJTÖTT HIDROMETEOROLÓGIAI ADATOK ELEMZÉSE

A közlésfolyamat fonológiai szerveződése: szerkezetismétlő műveletek afáziások beszédében

Gépjármű fekete doboz az útvonalrekonstrukció új eszközei

NÉGYESI IMRE 1. A mesterséges intelligencia és a hadsereg II. (Beszédfelismerő rendszerek I.)

Beszédfelismerés, beszédmegértés

Átírás:

Alkalmazott Nyelvészeti Közlemények, Miskolc, IX. évfolyam, 1. szám (2014) pp. 114-121. A HANGSÚLY EGYIK JELLEMZŐ MODALITÁSÁNAK VIZSGÁLATA EXAMINATION OF ONE OF THE CHARACTERISTIC MODALITIES OF STRESS CZAP LÁSZLÓ 1 PINTÉR JUDIT MÁRIA 2 A szupraszegmentális tényezők, mint a hangerősség, ritmus, beszédtempó, hangszínezet stb. a beszéd alapvető tulajdonságai. Ezek a tulajdonságok nemcsak a mesterséges beszéd természetességét javítják, hanem a gépi beszédfelismerés hatékonyságát is. A mondathangsúly és a szóhangsúly egyaránt fontos prozódiai jellemzők. Ezek a tulajdonságok általában a magánhangzók energiái alapján becsülhetők meg, de az egyes magánhangzók átlagenergiái eltérőek. Egy hangsúlyos gyengébb magánhangzó energiája kisebb lehet, mint egy hangsúlytalan erősebb mangánhangzóé. Az aktuális magánhangzó amplitúdóját összehasonlítjuk az átlagával, hogy megtudjuk: az adott szótag hangsúlyos vagy hangsúlytalan-e. A magánhangzók átlagenergiáit egy több száz beszélővel betanított beszédfelismerőből nyertük ki. Kulcsszavak: hangsúlydetektálás, beszédfelismerés, lényegkiemelési módszerek Suprasegmental features are fundamental properties of speech. They can improve not only the naturalness of synthesized speech but the performance of machine speech recognition, as well. In linguistics, stress is the relative emphasis that may be given to certain syllables in a word, or to certain words in a phrase or sentence. The term is also used for similar patterns of phonetic prominence inside syllables. The stress placed on syllables within words is called word stress or lexical stress. The stress placed on words within sentences is called sentence stress or prosodic stress. Sentence and word stress are crucial prosodic features. They are usually estimated from the energy of syllables, but the average energies of vowels are varied. The energy of a stressed weak vowel can be lower than that of an unstressed strong vowel. We compare the amplitude of the actual vowel to that of its average to reveal the stressed or unstressed nature of the syllable. Average energies of vowels are obtained from a speech recognizer trained with voices of hundreds of speakers. Keywords: stress detection, speech recognition, acoustic feature extraction methods Bevezetés A hangsúly többféle, egymástól eltérő szerepet játszhat az emberek közötti kommunikációban. Az akusztikus prozódiai jellemzők segítségével megkülönböztethetünk például lexikai egységeket, így az eltérő hangsúlyminták nyomán különböztethetjük meg azokat a szavakat, illetve szókapcsolatokat, amelyek azonos fonémákból állnak (hat 1 CZAP LÁSZLÓ intézetigazgató, egyetemi docens Miskolci Egyetem, Villamosmérnöki Intézet Automatizálási és Infokommunikációs Intézeti Tanszék 3515 Miskolc-Egyetemváros czap@uni-miskolc.hu 2 PINTÉR JUDIT MÁRIA Miskolci Egyetem, Villamosmérnöki Intézet Automatizálási és Infokommunikációs Intézeti Tanszék 3515 Miskolc-Egyetemváros pinterjm@uni-miskolc.hu

A hangsúly egyik jellemző modalitásának vizsgálata 115 alma hatalma). A prozódiai jellemzők adják meg a mondat szerkezetét a kijelentés szempontjából is, kapcsolatot teremtve az egyes kifejezések vagy mondatok között. A közlések például saját intonációs mintákkal bírnak, amelyek az egyes speciális prozódiai jellemzőket tartalmazzák. A hangsúly segítségével az egyes szavak a figyelem középpontjába kerülhetnek, éspedig annak megfelelően, hogy milyen céllal akarjuk őket kiemelni, például a kontrasztot akarjuk erősíteni, a fontosságukat hangsúlyozni vagy az érthetőséget javítani. Mindezek összessége segíti a hallgatót a tartalom minél jobb megértésében. A gyermekkor preverbális szakaszában, azaz az anyanyelv elsajátítása előtt minden kommunikáció tisztán prozódiai. A prozódia a későbbiekben is igen fontos jellemzője minden kommunikációnak. A hangsúly detektálása a gépi beszédfelismerés hatékonyságát is javíthatja. A hagyományos, statisztikai alapú folyamatos beszédfelismerés mint például a rejtett Markov-modelleken (HMM) alapuló felismerés (részletesebben lásd pl. Németh Olaszy 2010: 242 243) a beszédet felismerési egységek (pl.: fonémák, diádok két félhangból összetevődő egység, amely az első hang felétől a második hang feléig tart, szótagok, szavak stb.) sorozatának tekinti. A statisztikai alapú beszédfelismerésnél a lényegkiemelés során létrejövő, lényegi információkat tartalmazó, csökkentett redundanciával rendelkező vektorok képezik a felismerés bemenetét. A szóhangsúly fontos része a magyar nyelvnek, ennek segítségével javítható a szóhatár-detektálás, valamint az akusztikus beszédfelismerés hatékonysága is. 1. Szupraszegmentális tényezők a beszédben A szupraszegmentális tényezők olyan többletinformációval bírnak, amely hozzájárul a beszédmegértéshez. Segítségével a beszélő érzelmeket, szintaktikai és pragmatikai információt stb. fejezhet ki. Szupraszegmentális tényezők a beszédtempó, a szünet, a ritmus és a hangszínezet, a hangerő, a hanglejtés, az intonáció és a hangsúly (Gósy 2004: 182 243). A nyelvi egységekhez kapcsolva beszélhetünk szó-, szakasz-, (szószerkezetek esetében), illetve mondathangsúlyról. A szóhangsúly valamely szó egy szótagjának a kiemelése, a többi szótagtól való megkülönböztetése. Hangsúlyozás szempontjából a nyelvek két csoportba sorolhatók: kötött hangsúlyú nyelvek (a hangsúly mindig a szó azonos elhelyezkedésű (első, második, utolsó vagy utolsó előtti stb. szótagjára esik); kötetlen vagy szabad hangsúlyú nyelvek (szabadon változik a hangsúly helye). A magyar nyelv a kötött hangsúlyú nyelvek közé tartozik, mivel benne a hangsúly mindig az első szótagon realizálódik. Ugyanakkor ez a szóhangsúly magasabb szintű egységeknek szakasznak, mondatnak van alárendelve (Kassai 1998: 224 225). A magyar hangsúly szerepe tisztán a közlés lényeges elemeinek kiemelésére és a közlés logikai tagolására szorítkozik, vagy érzelmet közvetít. Erős érzelmek kifejezésekor a hangsúly a kötött hangsúlyozású nyelvekben is eltolódhat, illetve akár egy szó minden szótagján is megjelenhet. A hangsúly létrehozásában három fő tényező együttesen vagy egyedileg játszik szerepet az adott nyelvtől függően, ennek során a következő szabályszerűségek figyelhetők meg: az alapfrekvencia kiemelkedése a hangsúlyos szótagon; a hangsúlyos szótag nagyobb intenzitással való kiejtése; a hangsúlyos szótag magánhangzójának időtartambeli hosszabbodása (Kassai, i. m. 222 224).

116 Czap László Pintér Judit Mária A hangsúly különböző mértékben és egy vagy több szón is realizálódhat egy mondaton belül. Néha az akusztikai jelek közötti különbség minimális egy hangsúlyos és egy hangsúlytalan szótag esetén. A hangsúlyos szótagokat gyakran erőteljesebbnek tartják, mint a hangsúlytalanokat. 2. Hangsúlydetektálás 2.1. Hangsúlydetektálási módszerek A hangsúly detektálását általában az energia alapján végzik. Megvizsgálták a hossz, az amplitúdó és a spektrális változások különböző módokon normalizált értékeit (Kuijk Boves 1999: 95 112). Több esetben mély neurális hálók betanításával és alkalmazásával valósították meg az automatikus hangsúlydetektálást angol nyelvre (Kun et al. 2013: 1811 1815; Xie et al. 2004: 145 150). Az angol nyelvet tanító szoftver fejlesztése során, amely a nyelvtanulók által produkált hangsúlymintázatokat vizsgálja, és adott esetben kijavítja azokat, egyesek arra az eredményre jutottak, hogy a hangsúly legmegbízhatóbb jelzése a hossz és az amplitúdó információinak kombinációja (l. Xie et al.). A magyar nyelvben a hangsúly, illetve áttételesen a hangsúlyt meghatározó akusztikaiprozódiai jellemzők, így az alapfrekvencia és az energia alapján lehetséges a szóhatárok detektálása is (Vicsi Szaszák 2005: 363 370). Megfelelő lényegkiemelési módszert választva az egyes hangok átlagenergiája nagy különbségeket mutat, ezért a kis energiájú hangsúlyos magánhangzók energiája nem éri el a nagyobb energiájú hangsúlytalan magánhangzókét. Módszerünkben a magánhangzók pillanatnyi energiáját az adott magánhangzók átlagenergiájához viszonyítjuk, s így mutatjuk ki azok hangsúlytalan vagy hangsúlyos jellegét. 2.2. A tesztelt beszédadatbázis A hangsúlydetektálási vizsgálatokat egy magyar nyelvű beszédadatbázison végeztük el. Az adatbázis olvasott szövegeket tartalmaz, amelyeket általános felhasználói környezetben (irodák, laboratóriumok, lakások) rögzítettek, ezért megfelelően alkalmazhatók célzott vizsgálatok elvégzéséhez. Néhány lényeges műszaki adat: magyar nyelvű, olvasott szövegű, személyi számítógépes környezetben felvett adatbázis, 16 bites, 16 khz-es mintavételezéssel; megközelítőleg 300 beszélő; a felvételek többféle mikrofonnal, hangkártyával, PC-kel készültek; a környezet változó zajosságú irodahelyiség, laboratórium, otthoni környezet. 2.3. Különböző lényegkiemelési módszerek vizsgálata A gépi beszédfelismerésnél akusztikai szinten működik az akusztikai előfeldolgozó egység, amely a beszédjel elemzését, a lényegkiemelést, tömörítést végzi. Kimenetén az időkeretenkénti lényegi paraméterek (jellemző vektorok) jelennek meg, azaz a digitalizált (beszéd-)jelből egy diszkrét idejű, adott dimenziójú lényegvektor-sorozatot alkot. Ezek leggyakrabban Mel-frekvencia kepsztrális együtthatók (MFCC) (részletesebben lásd pl. Németh Olaszy 2010: 343, illetve Young 2005).

A hangsúly egyik jellemző modalitásának vizsgálata 117 10,00 8,00 8,38 8,58 9,11 7,43 7,31 8,13 6,00 5,93 5,58 4,75 4,00 2,00 0,00 O A: E e: i o 2 u y 1. ábra. A magánhangzók magnitúdója MFCC lényegkiemelési módszer esetén Az MFCC jellemzőkhöz hozzáadtuk a logaritmikus energia komponenst is, ennek révén megvizsgálhattuk az egyes magánhangzók átlagenergiáját. Az 1. ábra diagramja szemlélteti a beszédadatbázison betanított diád alapú beszédfelismerő rejtett Markov-modelljeiből kinyert egyes magánhangzókra vonatkozó átlagenergiákat. Az átlagenergiák az egyes magánhangzók diádokon belüli összes előfordulásainak az átlagai. Valamennyi ábránkon megfigyelhető, hogy azok nem az ismert IPA-jeleket, hanem az ún. SAMPA-jelrendszert követik (l. Németh Olaszy 2010: 77 79). Egy szótag energiáját a benne szereplő magánhangzó átlagenergiájával szemléltetjük. Kontextusfüggő magánhangzók energiáját a diádok Markov-modelljének első állapotából nyerhetjük ki. Az energiák alapján látható, hogy egy hangsúlytalan á magánhangzó energiája nagyobb lehet, mint egy hangsúlyos u, ü vagy i magánhangzó energiája. Ezért érdemes összehasonlítani az aktuális magánhangzó energiáját a megfelelő diád magánhangzójának átlagenergiájával, amelyet betanított HMM állapotaiból nyerünk. A relatív intenzitás létrehozásának folyamata: 1. A HMM modellek betanítása az adatbázissal. 2. Kontextusfüggő magánhangzó-energiák kinyerése a diádok HMM modelljének első állapotából. 3. A magánhangzó aktuális energiájának kinyerése a lényegkiemelt fájlból felhasználva a betanított HMM modellt forced alignment (kényszerített időbeli igazítás) segítségével, majd kézi korrekcióval. 4. Relatív intenzitás kiszámítása az aktuális és a referenciaérték felhasználásával. A 2. ábra egy, az adatbázisból kiválasztott mondat hangsúlyozását szemlélteti: Hogy működnek itt kérem a jogszabályok. A könnyebb érthetőség érdekében a példamondat hangfájlját elérhetővé tettük az alábbi linken: http://mazsola.iit.uni-miskolc.hu/data/research/audio/pelda_mondat.wav.

118 Czap László Pintér Judit Mária 2,5 2 1,5 1 0,5 0 hod' my: k2d nek it: ke: rem O jok so ba: jok 2. ábra. A szótagok mért energiája A 3. ábra szemlélteti a relatív intenzitást ugyanabban a mondatban. A diádok HMM modelljeiből kinyert átlagolt kontextusfüggő energiát és a példamondat lényegkiemelt fájljából kinyert aktuális energiaértékeket normáltuk, és az összehasonlítást annak alapján végeztük el. 3,5 3 2,5 2 1,5 1 0,5 0 hod' my: k2d nek it: ke: rem O jok so ba: jok 3. ábra. A szótagok energiájának relatív intenzitása Ahogyan az minden mondatnál megfigyelhető volt, a hosszabb mondategységeken (150 ms) megvizsgált átlagenergiák az elejétől a vége felé csökkenést mutattak. Kiküszöbölve az energia ezen változását, megvizsgáltuk a relatív intenzitást a szomszédjaival összehasonlítva. Nevezzük ezt megjelenítési görbének. Ahhoz, hogy megkapjuk az n-edik szótag görbéjét, az alábbi képletet kell alkalmaznunk:

A hangsúly egyik jellemző modalitásának vizsgálata 119 e(n) = (r(n) r(n 1)+r(n) r(n+1)) 2 (1) az elsőhöz: az utolsóhoz pedig: e(1) = (r(1)+r(1) r(2)) 2 (2) e(n) = (r(n) r(n 1)+r(N)) 2 (3) ahol r(n) az n-edik szótag relatív energiája. A 4. ábra a példamondat ún. megjelenítési görbéjét szemlélteti. Az első szótag szó eleji hangsúlya jól megfigyelhető a jogszabályok szóban. 4 3,5 3 2,5 2 1,5 1 0,5 0 hod' my: k2d nek it: ke: rem O jok so ba: jok 4. ábra. A példamondat megjelenítési görbéje Ahhoz, hogy az eredmények hitelesek legyenek, ugyanazt a mondatot összevetettük konkrét személyek ítéletével. A hangsúlyos és hangsúlytalan szótagok kimutatására szubjektív észlelési vizsgálatot végeztünk. A Miskolci Egyetem 16 magyar szakos, a fonetikai alapfogalmakat ismerő hallgatója volt a vizsgálat alanya. Őket a minták meghallgatásakor arra kértük, hogy az akusztikai jellemzőkre koncentráljanak, bár ezek nehezen lesznek elválaszthatók a szintaktikai és/vagy szemantikai jelentésből adódó hangsúlyozási pontoktól. Megkértük őket, hogy jegyezzék fel minden egyes szótagnál, hogy az saját megítélésük szerint: hangsúlyos; semleges vagy hangsúlytalan-e. Az értékeléseket az alábbi pontszámokkal súlyoztuk és összegeztük: 1, ha hangsúlyos; 0,5, ha semleges; 0, ha hangsúlytalan az adott szótag. Az összegeket normalizáltuk, majd elosztottuk 16-tal, vagyis a hallgatók számával. Ezáltal a hangsúlyértékek 1 (határozottan hangsúlyos) és 0 (hangsúlytalan) közé esnek.

120 Czap László Pintér Judit Mária 1,2 1 0,8 0,6 0,4 0,2 0 hod' my: k2d nek it: ke: rem O jok so ba: jok 5. ábra. Hangsúlyértékek a szubjektív teszt alapján A mondat a hogy kérdőszóval kezdődik. Az elsődleges hangsúly a jogszabályok szó első szótagján realizálódik. A másodlagos hangsúly a kérem szó első szótagján látható. Az összehasonlítás érdekében egy úgynevezett korrelációs együtthatót adtunk meg. Összehasonlítottuk az aktuális energia változását szótagról szótagra (l. 2. ábra) és a relatív intenzitást (l. 3. ábra) a szubjektív vélemények pontszámával (5. ábra) vetettük össze. ((m(n) m(n+1)) (s(n) s(n+1))) = 0.03 (4) ((r(n) r(n+1)) (s(n) s(n+1))) = 0.97 (5) ahol m(n) az n-edik szótag aktuális energiája, r(n) az n-edik szótag relatív intenzitása és s(n) az n-edik szótag szubjektív teszt alapján meghatározott normalizált értéke. Összefoglalás Az eddig elért eredmények azt mutatják, hogy az MFCC energiakomponense és a módszerünk további kutatást igényel a hangsúlydetektálási feladatok intenzitáskomponensének vizsgálatára. A példamondat kiértékelésében megmutatkoznak a hangsúlyos szótagok. A továbbiakban tervezzük még több lényegkiemelési módszer vizsgálatát és az eddig elért eredményekkel való összehasonlítását, majd a kiértékelés folyamatát automatizálttá kívánjuk tenni. Irodalom GÓSY Mária 2004. Fonetika, a beszéd tudománya. Budapest: Osiris. KASSAI Ilona 1998. Fonetika. Budapest: Nemzeti Tankönyvkiadó. VAN KUIJK, D. BOVES, L. 1999. Acoustic characteristics of lexical stress in continuous telephone speech. Speech Communication. 27(2). 95 112.

A hangsúly egyik jellemző modalitásának vizsgálata 121 KUN L. XIAOJUN Q. SHIYIN K. HELEN M. 2013. Lexical Stress Detection for L2 English Speech Using Deep Belief Networks. Interspeech. 1811 1815. NÉMETH Géza OLASZY Gábor (szerk.) 2010. A magyar beszéd. Budapest: Akadémiai Kiadó. XIE, H. ANDREAE, P. ZHANG, M. WARREN, P. 2004. Detecting stress in spoken English using decision trees and support vector machines. In: Hogan, J. P. Montague M. Purvis (eds.) 2004. Proceedings of the second workshop on Australasian information security, Data Mining and Web Intelligence, and Software Internationalisation. Volume 32. Australian Computer Society, Inc. VICSI Klára SZASZÁK György 2005. Automatic Segmentation of Continuous Speech on Word Level Based on Suprasegmental Features. International Journal of Speech Technology. Vol. 8, Num. 4, 363 70. S. Young 2005. The HTK Book (for HTK Version 3.3). Köszönetnyilvánítás A kutatómunka a Miskolci Egyetem stratégiai kutatási területén működő Mechatronikai és Logisztikai Kiválósági Központ keretében és a TÁMOP-4.2.2.C-11/1/KONV-2012-0002 jelű projekt részeként az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósult meg. Dobos Csilla (szerk.) Miskolci Egyetemi Kiadó, 2014. ISBN 978-615-5216-63-3 NYELV ÉS JOG A kötet a szaknyelvkutatás egyik rendkívül érdekes területét, a jogi szakmai nyelvhasználatot és annak sajátosságait mutatja be a nyelvész szemszögéből. A jogi kommunikáció olyan komplex, számos különböző tényező összjátékából és együtthatásából kialakuló, többszintű információáramlási folyamat, amelynek színtere a jog világa. A könyv egyes fejezeteiből az Olvasó megismerheti a jogi szaknyelv használatának szemantikai és pragmatikai jellemzőit, betekintést nyerhet a jog és a nyelv világának bonyolult kapcsolatába, valamint a jogi eljárás verbális, nyelven belüli fordítások sorozatából álló folyamatába.