Prozódiai információ felhasználása a beszédfelismerés hatékonyságának növelésére
|
|
- Albert Ferenc Tamás
- 9 évvel ezelőtt
- Látták:
Átírás
1 Prozódiai információ felhasználása a beszédfelismerés hatékonyságának növelésére SZASZÁK GYÖRGY, VICSI KLÁRA BME Távközlési és Médiainformatikai Tanszék {szaszak, vicsi}@tmit.bme.hu Lektorált Kulcsszavak: beszédfelismerés, prozódia, szóhatár-detekció, prozódiai szegmentálás Cikkünkben lényegében a mondat-, tagmondat- és szóhatárok prozódia alapú detektálását mutatjuk be rejtett Markov modelles módszerrel. Az így elkészült prozódiai szegmentálót beszédfelismerôbe építve a felismerési hipotéziseket újrasúlyozzuk annak alapján, hogy mennyire illeszkednek a detektált dallammenetre. Ultrahangos leletezô alkalmazásban egyszerûsített nyelvi modellel a felismerési hatékonyság 3,82%-os javulását értük el. 1. Bevezetés A prozódia vagy szupraszegmentális szerkezet az emberi beszéd szerves részét képezi, így például a hallgató számára segíti a közlés értelmezését azáltal, hogy a beszédet tagolttá teszi, kiemeli a fontos vagy új információt tartalmazó részeket. E funkcióján túlmenôen hordozza a modalitást (kijelentô, kérdô stb.), illetve lehetôséget ad a beszélônek érzelmei kifejezésére is, ami jelentôs részben szintén a szupraszegmentumok révén valósul meg. A beszédtechnológia mûszaki oldaláról közelítve ma már elképzelhetetlen jó minôségû beszédszintézis a megfelelô prozódia azaz a megfelelô hangsúlyozás és a természetes dallammenet modellezése nélkül. A beszédfelismerésben azonban korábban szinte egyáltalán nem foglalkoztak a prozódiával, jóllehet a szupraszegmentumoknak nem csak a jelentést tagoló vagy árnyaló, hanem bizonyos esetekben a jelentés egy részét illetôen egyfajta hordozó szerepük is van. Mindezt a gépi beszédfelismerés során is figyelembe kell vennünk, ha nem szeretnénk a közlésbôl lényeges információt elveszíteni. Így például bizonyos beszédinformációs rendszerekben alapvetô követelmény lehet, hogy különbséget tudjunk tenni kérdések és kijelentések között akkor is, ha adott esetben a kérdô- és a kijelentô mondat ugyanazon szóláncból épül fel, különbség közöttük csak modalitásukban van [1]. Hagyományos beszédfelismerô rendszerrel amely csupán az elhangzott beszédhang-szekvenciára koncentrál ez a feladat megoldhatatlan. Ezen a magától értetôdô felhasználási területen túl a szupraszegmentális jellemzôk alakulásának nyomon követése a beszédfelismerési feladat során egyéb haszonnal is járhat, amennyiben a beszédfolyam prozódiai eszközökkel történô tagolása segítségünkre van a beszédfelismerésben. A mondatok, tagmondatok, szószerkezetek vagy akár az egyes szavak határainak ismerete hasznos lehet a keresési tér csökkentésében, ha ugyanis biztosak vagyunk benne, hogy valahol a beszédfolyamban szóhatárt találunk, akkor azokat a felismerési hipotéziseket, amelyek az adott ponton nem tartalmaznak szóhatárt, kizárhatjuk. Ezáltal gyorsul és pontosabb lesz a felismerés, amelynek során különösen a toldalékoló nyelvek esetében, amilyen a magyar nyelv is sokszor problémát, de legalábbis korlátozó tényezôt jelent a valós idejû mûködés követelménye. További segítséget adhat a prozódia a lényeges információ automatikus kiemeléséhez a közlésbôl, illetve segítheti a szintaktikai elemzést is [3]. A nemzetközi porondon többen próbálkoztak már a prozódiai információ felhasználásával a beszédfelismerésben, elsôsorban angol és német nyelven. Veilleux és Ostendorf például olyan algoritmust dolgoztak ki [10], amelyek az egyes hipotézis-gráfok közül az N darab legvalószínûbbet újrasúlyozzák (úgynevezett N-best rescoring) a prozódiai információk ismeretében, majd ezután az újrasúlyozott gráfokkal számítják a felismerés végeredményét a hagyományos módon. Hasonló munka készült a német nyelvre is [2]. Gallwitz és munkatársai ennél tovább lépve integrált gépi beszédfelismerôt készítettek [1], amely a beszédláncra vonatkozó, illetve a prozódiai információt egységesen kezeli és követi a felismerés során. A szerzôk is végeztek már kísérleteket magyar nyelvre a prozódia beszédfelismerésben történô felhasználhatóságát illetôen [12]. 2. A prozódiai információ kinyerése a beszédbôl A prozódiai jellemzôk közül az alapfrekvencia, az energiaszint, és az idôtartamok objektív mérésére van lehetôség. Ezen paraméterek közül az alapfrekvencia és az energiaszint értékeit találtuk jellemzônek a hangsúly detektálása szempontjából korábbi vizsgálataink alapján [8]. E két prozódiai tényezô értékeit a beszédjelbôl a Snack programcsomag [7] segítségével nyertük ki, majd elôfeldolgozásnak vetettük alá. Az alapfrekvencia számításához a Snack programban implementált AMDF-alapú algoritmust használtuk 25 ms ablakmérettel, 10 ms keretidôvel. Ezt követôen oktá- LXIII. ÉVFOLYAM 2008/5 45
2 HÍRADÁSTECHNIKA vugrást korrigáló szûrôt alkalmaztunk, amelyet 5 pontos átlagoló (mean) szûrô követett, majd az alapfrekvencia-értékek logaritmusát alapul véve lineáris interpolációt végeztünk annak érdekében, hogy az alapfrekvencia görbe többé-kevésbé folytonos legyen. Nem történt interpoláció olyan zöngétlen szakaszokon, amelyek hossza a 250 ms-ot meghaladta, illetve akkor sem, ha a zöngétlen szakasz utáni elsô zöngés keret alapfrekvenciája meghaladta a zöngétlen rész elôtti 3 utolsó keret alapfrekvencia-értékei átlagának 1,1-szeresét. Minderre azért volt szükség, hogy a 250 ms-nál hoszszabb, ezért igen nagy valószínûséggel beszédszünetet tartalmazó szakaszokon az alapfrekvenciát ne interpoláljuk, mivel egyrészt a szünetet magát is szeretnénk a késôbbiekben detektálni, másrészt ilyen hosszú szakaszon az interpolálás már túl durva közelítés lenne. Az alapfrekvencia-érték zöngétlen szakasz utáni emelkedését a zöngétlen szakasz elôtti utolsó három érték átlagánál pedig azért nem engedjük magasabbra, mert ekkor valószínûbb, hogy a kérdéses szakaszon mondat, tagmondat vagy szószerkezet határa volt, és emiatt indít magasabbról az alapfrekvencia. E fenti értékeket tapasztalati úton állítottuk be, de a jövôben célszerû lehet ezeket a beszélôtôl (beszédtempó, artikulációs sebesség stb.) függôen meghatározni, ehhez azonban további vizsgálatok szükségesek, így a továbbiakban ezzel egyelôre nem foglalkozunk. Az energiaszint-értékeket szintén a Snack programmal számítottuk, a keretidô ismét 10 ms volt, az alkalmazott ablakméret 25 ms, melyet szintén átlagoló (mean) szûrés követett. Mivel az energiaszint folytonosan számítható a beszédjelre, ezért itt interpolációra értelemszerûen nem volt szükség. Ezután mind az alapfrekvencia, mind az energiaértékekhez elsô és másodrendû deriváltjaikat is kiszámítottuk. A deriváltak közelítésére alkalmazott (1) regreszsziós képletben a figyelembe vett környezetet három lépcsôben fokozatosan növelve valójában 3-3 elsô és másodrendû deriváltat képeztünk, rendre ±10, ±25 és ±50 keretnek megfelelôen ablakolt (W az (1) képletben) minták alapján, így a véglegesen kapott jellemzôvektor összesen 14 elemet tartalmazott: az eredeti, feldolgozott alapfrekvencia- és energiaértéket, és ezek mindegyikéhez 3-3 elsô- és másodrendû deriváltat. A deriváltak számítására használt képlet ([9] alapján): 3. A prozódiai információ felhasználása a beszédfelismerésben A prozódia vizsgálatával és modellezésével célunk a beszéd durva felszegmentálása mondat- és tagmondat-határokon, illetve a szavak, szószerkezetek határainak minél pontosabb meghatározása. Az így nyert információt ezután a beszédfelismerôben felhasználva a felismerés hatékonysága javítható, illetve új, a beszédfelismerô felhasználási lehetôségeit kibôvítô a bevezetôben már említett egyéb funkciók is megvalósíthatóak lesznek. Munkánk során nagyban támaszkodunk arra a tényre, hogy a magyar nyelv kötött hangsúlyozású, azaz a hangsúly mindig a hangsúlyos szó elsô szótagjára esik [2]. Mindez azért rendkívül fontos, mert így lehetôségünk nyílik a prozódiai információ egységes kezelésére anélkül, hogy a beszédet szavak vagy beszédhangok szintjén is ismernünk kellene a prozódiai struktúra értelmezéséhez. Természetesen végcélunk ezzel együtt az, hogy a beszédhangok sorozatát jellemzô spektrális, illetve a prozódiát befolyásoló szintaktikai információt egységesen kezeljük és használjuk fel a beszédfelismerésben Automatikus prozódiai szegmentáló betanítása A prozódiai szegmentálás során az egyes mondatépítô szintaktikai elemek dallamtípusát szeretnénk felismerni és járulékosan a szintaktikai egységek határát a lehetô legnagyobb pontossággal meghatározni. A szintaktikai egységek határai egyben szóhatárok is lesznek, amelyek egybeeshetnek tagmondatok vagy mondatok határaival is. A felismerni szándékozott dallamtípusok kiválasztásánál tekintettel kell lennünk arra, hogy az egyes dallamok egymástól élesen elkülöníthetôek legyenek és felöleljék a leggyakrabban elôforduló dallamváltozatokat. Az éles különbségtétel követelménye miatt mindössze 6 alapvetô dallamtípust különíttettünk el a prozódiai felismeréshez. A szünet adja a 7. felismerendô dallamtípust. A felhasználandó dallamtípusokat az 1. táblázatban foglaltuk össze. A prozódiai szegmentáló betanításához a tanítómintákat a BABEL beszédadatbázis [6] szöveganyagából választottunk ki (22 beszélô által bemondott 1600 mon- (1) ahol d t a t idôpontban értelmezett derivált, c t-i és c t+i az eredeti (deriválandó) együtthatók, W pedig az ablakméret keretszámban. 1. táblázat A felismerésre kiválasztott dallamtípusok 46 LXIII. ÉVFOLYAM 2008/5
3 Prozódiai információ felhasználása... dat). Ezt a szöveganyagot kézzel, majd félautomatikusan felszegmentáltuk a táblázatban szereplô dallamtípusok szerint. A kézi szegmentálás az alapfrekvenciaés az energiakontúr alapján történt, a lehallgatás során kapott szubjektív ítéletet is figyelembe véve. Az elkészült prozódiai szegmentáló rejtett Markovmodell alapú, a keretidô a már említett 10 ms, a Markovmodellek lineárisak, állapotai száma (optimalizálás után) 11. A prozódiai szegmentálót a HTK szoftvercsomag [9] felhasználásával valósítottuk meg Az automatikus prozódiai szegmentálás menete Az automatikus prozódiai szegmentálás menete a beszédfelismerésben is használt algoritmusokkal az ott ismeretes lépések szerint történik, azaz a lényegkiemelést (elôfeldolgozást) követi a dekódolás. Az elôfeldolgozás a 2. szakaszban megismertek szerint történik, azaz az alapfrekvencia- és az energia-jelet az ott ismertetett módon nyerjük ki és dolgozzuk fel. A dekódolás során a Viterbi-algoritmus fut, amely a rövid jellemzô vektorok, a modellek csekély száma és az alkalmazott nyelvtan miatt igen gyors. A dekódolás során ugyanis a szintaktikai egységeknek megfelelô dallamtípusokra vonatkozóan szigorú nyelvtant vezetünk be, amely megadja, hogy azok milyen sorrendben követhetik egymást. Az ily módon létrehozott megszorítások tapasztalataink szerint a szegmentálás minôségét lényegesen javítják, ugyanakkor ehhez képest elhanyagolható azoknak az eseteknek a száma, amikor a szigorú, nem minden kivételes esetet leíró nyelvtan miatt történik tévesztés. A nyelvtan a HTK-ban is alkalmazott jelöléseket alapul véve (vö. [9], p.163.) összefüggéssel írható le, melyben a <> szimbólumok egy vagy több, a {} nulla, egy vagy több ismétlôdést jelölnek. A szimbólum kizáró vagy kapcsolatot, a [] opcionálisan elmaradó eseményeket jelöl. Az ily módon formalizálva lejegyzett sorozatot tekintjük a prozódiai mondatmodellnek. A prozódiai szegmentálás eredményeként a felismert dallamtípusok kezdô- és végidôpontjukkal együtt ismeretté válnak. Az 1. ábrán látható példa egy így nyert prozódiai szegmentálást jelenít meg Prozódiai szegmentáló beépítése beszédfelismerôbe A prozódiai szegmentáló kimenetét felhasználhatjuk a beszédfelismerôben a keresési tér csökkentésére, így jobb felismerés és gyorsabb mûködés remélhetô a beszédfelismerôtôl. Ehhez a beszédfelismerés folyamatába kell avatkoznunk. Erre egy lehetôség az a pont, ahol a dekódolás részeként a hipotézis-gráfok felépítése azaz voltaképpen a felismerés lehetséges eredményeinek felmérése és valószínûségeik kiértékelése történik. A prozódiai szegmentálás ismeretében a hipotézisgráfok újrasúlyozhatók, a felismerés további folyamatába pedig már az újrasúlyozott gráfok kerülnek, így a felismerés végeredményének kiértékelését már a prozódia alapján nyert információ is befolyásolja. Utolsó lépésként az újrasúlyozott hipotézis gráfon kell a maximális pontszámú utat megkeresnünk, amihez gyors keresôalgoritmusok állnak rendelkezésünkre. 1. ábra A prozódiai szegmentálás kimenete Az elôzô vizsgálattal összehasonlítva a choledochus most 11 milliméteres... mondatrészletre. (2) Afelsô sávban a spektrogram, az alatta levô sávokban rendre az idôfüggvény (hullámforma), az interpolált alapfrekvencia, az energia görbéje, a prozódiai szegmentálás, végül az elhangzott szöveg látható bejelölt szóhatárokkal. LXIII. ÉVFOLYAM 2008/5 47
4 HÍRADÁSTECHNIKA 2. ábra Prozódiai szegmentálóval kiegészített beszédfelismerô felépítése Afelismerés menetét a 2. ábrán követhetjük végig A hipotézis-gráfok újrasúlyozása Mint az elôzôekben láttuk, a hipotézis-gráfok újrasúlyozása a prozódiai szegmentálás alapján történhet. Az alapötlet az, hogy azokat a szavakat és szóláncokat (a hipotézis-gráfból kinyerhetô szósorozatokat, ezek egyegy lehetséges felismerést írnak le), amelyek esetén a szavak határai idôben egybecsengenek a prozódiai szegmentálás által jelzett határokkal, valamilyen módon részesítsük elônyben a felismeréskor, azaz a hozzájuk rendelt valószínûségi súlyt növeljük. Hasonlóképp, azokban az esetekben, amikor a prozódiai szegmentáló által megadott határok szavak belsejébe esnek, az eredetileg hozzárendelt súlyokat csökkenthetjük. Problémát okoz azonban, hogy a prozódiai szegmentáló sem mûködik hibamentesen, azaz bizonyos százalékkal téves ítéletet hoz a szintaktikai egységek határait illetôen. Spontán beszédben még gyakoribbak azok a jelenségek, amelyek az automatikusan futó algoritmust megzavarhatják (gyakoribbak a szótévesztések, javítások, elôfordulhat, hogy a prozódia eltorzul, ha a beszélô mondat közben meggondolja magát és máshogyan folytatja közlendôjét, a hevesebben kifejezett érzelmek is befolyásolhatják a prozódiát stb.). A prozódiai szegmentáló teljesítményének kiértékelésével korábban részletesen foglalkoztunk [8], jelen esetben pedig a hibaszázalék pontos számszerû ismerete nélkül is beláthatjuk, hogy az újrasúlyozás során valamennyire a prozódiai információt is fenntartással kell kezelnünk. Ügyelnünk kell továbbá arra is, hogy a prozódiai információ éppen szupraszegmentális jellegébôl adódóan idôben kevésbé pontosan lokalizálható, mint az egyes beszédhangok így akár az egyes szavak határai. Gondoljunk például arra, hogy ha egy adott szintaktikai egység utolsó beszédhangjaként zöngétlen hangot (különösen is, ha zöngétlen réshangot) találunk, a dallamban számunkra az utolsó biztos támpontot a legutóbbi magánhangzó jelenti. Ez máris egy beszédhanghossznyi bizonytalanságot jelent, amit a prozódiai szegmentáló a beszédhangsor ismeretének hiányában nem tud feloldani. Éppen ezért a prozódiai szegmentáló által megjelölt határokat intervallummá transzformáljuk, azaz megengedünk bizonyos T csúszást a prozódiai szegmentáló által megállapított határhoz (t B ) képest. Az intervallumon belül a ténylegesen elôrejelzett határtól való távolság függvényében értelmezzük a határ adott idôpontban történô elhelyezkedésének valószínûségét, pontosabban egy azzal arányos pontszámot (L B ) az alábbiak szerint: (3) ahol A és C konstansok. A kísérleteinkben T értéke 10 keret, azaz 100 ms volt. A cosinus függvényt az egyszerûség kedvéért választottuk, de lényeges, hogy minél távolabb van a határ az elôre jelzettôl, annál kisebb pontszámot rendelünk hozzá. Mindezek után rátérhetünk a hipotézis-gráfok tényleges újrasúlyozásának algoritmusára, amelyet az alábbiakban mutatunk be. Elöljáróban annyit jegyezzünk még meg, hogy a hipotézis-gráf éleihez szavak vagy szóláncok, csomópontjaihoz pedig a megfelelô kezdô- és végidôpontok vannak rendelve. Az újrasúlyozáshoz minden, a gráfban található szót vagy szóláncot kigyûjtünk, majd kezdô- és végpontjaira pontszámot számítunk, amely annál nagyobb (lásd (3)), minél közelebb van a prozódiai szegmentáló által jelzett határhoz a szó eleje, illetve vége: (4) ahol t start a szó gráf szerinti kezdô, t end a szó gráf szerinti végpontjának felel meg (az idôben), w a és w b pedig súlyok. Ezt követôen a szó valamennyi i keretére az elsô és utolsó k darab keret kivételével összegezzük L B (t i ) értékeket, ahol t i az aktuális keretidô: A fenti képletben N a szóhoz tartozó összes keret száma, k= T=100 ms pedig ésszerû választásnak kínálkozik. A gráf éléhez tartozó új Sc rescored pontszám értéke pedig: (6) ahol Sc orig a gráf éléhez eredetileg tartozó, most felülbírált pontszám (élsúly), w O és w P pedig súlytényezôk. (5) 48 LXIII. ÉVFOLYAM 2008/5
5 Prozódiai információ felhasználása Kísérlet a prozódiai szegmentáló beszédfelismerô rendszerbe való illesztésére A prozódiai szegmentáló elkészítésével célunk a beszédfelismerés hatékonyságának növelése volt, így a továbbiakban egy olyan kísérletrôl számolunk be, melynek során a prozódiai szegmentálót automatikus gépi beszédfelismerôbe építettük be. A 3.3. szakaszban már szó esett a beépítés módjáról, az elôzôekben (3.4. szakasz) pedig áttekintettük azokat az algoritmikus változtatásokat, amelyeket a felismerés folyamatában szükséges eszközölnünk. A kísérlethez magyar nyelvû, folyamatos beszédfelismerôt választottunk ki, amely az orvostudománybeli radiológiai leletezés területét, azon belül is a hasi és kismedencei ultrahangos vizsgálatok leletezésénél használt szótárkészletet öleli fel. A szótár elemszáma viszonylag csekély, mintegy 4000 szó. A területre bigram nyelvi modell is készült, azonban jelen kísérletben a bigram nyelvi modellt binarizáltuk, azaz csak azt tüntettük fel benne, milyen szavak után milyen szavak elôfordulása megengedett a szövegben. Ennek célja egyúttal annak kipróbálása is, hogy képes-e a prozódiai információ minimális nyelvtani információ mellett a felismerés hatékonyságát javítani. Ezzel egyúttal a késôbbiekben tervezett nagyszótáras alkalmazások felé is tekintünk, ugyanis nagy szótárméret esetén a nyelvi modell elkészítéshez rendkívül nagy szövegadatbázis kell, a nyelvi modell használata pedig rendkívül mûveletigényes. Különösen igaz ez az agglutináló nyelvekre így a magyarra is amelyek esetén viszonylag kis tématerület esetén is relatíve nagy az elôforduló szóalakok száma a toldalékoló jelleg miatt. A felismerô HTK környezetben implementált, felépítését tekintve a klasszikus 39 MFCC együtthatót alkalmazó, a kibocsátási valószínûségeket 32 Gauss függvény szuperponálásával leíró, 10 ms keretidejû rendszer. Afelismerô betanításához az MRBA adatbázis [11] mintegy 8 órányi, részben beszédhang szinten felszegmentált anyagát használtuk fel, összesen 37 beszédhang modell készült. Ebbe a felismerôbe építettük bele a prozódiai szegmentálót, és vizsgáltuk a felismerési eredmény változását. A (4) és a (6) képletekben megadott súlyok értékeit tapasztalati úton az alábbiakra állítottuk be: w a =0,5, w b =0,5, w O =1, w P =2,5. A táblázatban megjelenített mérôszámok a helyesen felismert szavak aránya, illetve a szótévesztési arány javulása, mindkettô százalékosan értendô. A táblázatból látható, hogy a prozódiai szegmentálóval kibôvített rendszer teljesítménye összességében 3,82%-kal javult. A javulás mértéke leletenként változó, egyes esetekben 10% fölötti eredményt is kaptunk (lásd pl. 03-as azonosítójú lelet), ugyanakkor elôfordul (lásd pl. 16-os azonosító), hogy a felismerés nem javul, hanem éppenséggel romlik a prozódiai információ figyelembe vételekor. Az egyes leletbemondásokat megvizsgálva arra a következtetésre jutottunk, hogy a prozódiai szempontból jobban ezzel együtt a megszokott hétköznapi, általánosan elvárható kiejtésnél nem gondosabban bemondott leletek felismerése a prozódiai információ figyelembe vételekor jelentôsebb mértékben javul. Azokban az esetekben, amikor a felismerés a kibôvített rendszerrel nem javult, hanem romlott, a hibát jellemzôen a prozódiai szegmentáló tévesztése okozta, ami a hipotézis gráfok újrasúlyozásakor eltorzította a felismerést. A hiba forrása esetenként a prozódiailag gondatlan beszéd, esetenként az alapfrekvencia-detektor tévesztése volt. Ez utóbbi történhet például egy kissé rekedt hangú beszélôtôl származó lelet esetében. Általános tapasztalatunk, hogy a prozódiai szegmentálás esetenként idôben kevésbé olyan pontos, mint ami a szóhatárok helyének biztosabb megállapításához szükséges lenne. Úgy gondoljuk, ez utóbbi probléma legalább részben orvosolható, amennyiben a prozódiai szegmentálóban figyelembe vesszük az adott szót felépítô fonémasorozatot. Korábban már említettük, hogy a prozódia követésének szempontjából számos szóvégi zöngétlen hang máris hosszának megfelelô, durván ms, de akár 150 ms nagyságrendjébe esô bizonytalanságot is eredményezhet a szóhatár megítélésében, mivel az alapfrekvencia menetére ekkor általában nem támaszkodhatunk. Amennyiben lehetôségünk van figyelembe venni az aktuálisan elhangzó beszédhangokat is, idôben korrigálni tudjuk a prozódiai alapján elôrejelzett és a tényleges szóhatárok eltérését, vagy legalábbis tud- 2. táblázat A helyesen felismert szavak arányának alakulása az alaprendszer és a kibôvített rendszer esetén, illetve a szótévesztési arány javulása Eredmények Akísérleti rendszerrel hasi és kismedencei ultrahangos leletek felismerését vizsgáltuk összesen 20 darab leletre. (Egy lelet nagyságrendileg kb mondatot tartalmaz.) A felismerést azonos körülmények között azonos (rögzített, majd visszajátszott) leletekre elôször az alaprendszerrel, majd a prozódiai szegmentálóval kibôvített rendszerrel végeztük el. Az eredményeket a 2. táblázatban mutatjuk be 6 darab, a teljes tesztanyag tekintetében reprezentatívan kiválasztott leletre. LXIII. ÉVFOLYAM 2008/5 49
6 HÍRADÁSTECHNIKA juk, hogy az adott helyen mennyiben támaszkodhatunk a prozódiai szegmentálás pontosságára. További kutatásaink során mindenképpen szeretnénk ilyen jellegû vizsgálatokat végezni, ezáltal a rendszert teljesebbé tenni. Megjegyezzük továbbá, hogy a prozódiai szegmentáló által meg nem jelölt szintaktikai vagy szóhatárok a beszédfelismerést a hipotézis gráfok újrasúlyozási algoritmusából kifolyólag nem rontják, jóllehet érdekünkben áll minél több szóhatárt megtalálni, ezáltal több lehetôséget adva a prozódiai információt nem használó felismerés hatékonyságának növelésére. A prozódiai szegmentálótól nem várhatjuk el, hogy valamennyi szóhatárt megtaláljon (erre még gyakorlott szakember sem vállalkozhat pusztán az alapfrekvencia és az energiaértékek ismeretében), ugyanakkor bebizonyosodott, hogy a megtalált szóhatárok alapján a felismerés hatékonysága javítható. 5. Összegzés Írásunkban azt vizsgáltuk, hogyan használhatók fel bizonyos szupraszegmentális jellemzôk a beszédfelismerés segítésére. Bemutattunk egy automatikus prozódiai szegmentálót, amely az alapfrekvencia és az energiaszint értékei alapján próbálja meg felismerni a dallam 6 kiválasztott alaptípusát, illetve a szünetet. A prozódiai szegmentálót beszédfelismerôbe építve arra használjuk, hogy a dallamtípusok felismerése révén megtaláljuk az egyes szintaktikai egységek közötti határokat, amelyek egyúttal szóhatárokat is jelentenek. Az elvégzett kísérletek tanúsága szerint a szóhatárok ismerete révén a felismerés hatékonysága a hipotézis gráfok újrasúlyozásával javítható (arról nem is beszélve, hogy egyes írásjelek, így a vesszô kitételében is nagy segítséget adhat a szintaktikai határok ismerete). Mindezek mellett a prozódiai szegmentáló akár automatikus szintaktikai elemzôkben is felhasználható lehet. A szerzôkrôl Szaszák György 2002-ben végzett a Budapesti Mûszaki és Gazdaságtudományi Egyetem Villamosmérnöki és Informatikai Karán. Ez évtôl kezdôdôen a BME-TMIT Beszédakusztikai Laboratóriumában dolgozik, fôbb kutatási területe a gépi beszédfelismerés, ezen belül beszédadatbázisok konstrukciója és feldolgozása, beszédfelismerés rejtett Markov-modellekkel, ejtésvariáció modellezés, szupraszegmentális jellemzôk felhasználása a beszédfelismerésben, érzelmek felismerése akusztikai beszédjel alapján. Doktorjelöltként PhD dolgozata megvédésére készül. Vicsi Klára a BME TMIT Beszédakusztikai Laboratórium vezetôje. Beszédfelismerési témában írta meg PhD-jét 1992-ben. A MTA Mérnöki Tudományok Doktora lett 2004-ben, BME habilitációja pedig 2007-ben volt. Számos korábbi hazai és nemzetközi kutatás témavezetôje és jelenleg is aktiv projektvezetô a beszédakusztika, a gépi beszédfelismerés, beszéd adatbázis készítés és a pszichológiai akusztika területén. Elôszeretettel foglalkozik beszédsegítô eszközök létrehozásában nagyothalló és beszédhibás személyek részére. A lektorált hazai és nemzetközi folyóiratokban, nemzetközi konferenciakiadványokban több mint 65 publikációja jelent meg. Szerzôje számos beszédkutatással foglalkozó könyvrészletnek. Irodalom [1] Gallwitz, F., Niemann, H., Nöth, E., Warnke, V.: Integrated recognition of words and prosodic phrase boundaries. Speech Communication, Vol. 36, 2002, pp [2] Kassai Ilona: Fonetika. Tankönyvkiadó, Budapest, [3] Kompe, R.: Prosody in Speech Understanding Systems. LNAI 1307, Springer Verlag, Berlin-Heidelberg, [4] Kompe, R., Kiessling, A., Niemann, H., Nöth, H., Schukat-Talamazzini E.G., Zottman, A., Batliner, A.: Prosodic scoring of word hypothesis graphs. In: Proceedings of the European Conference on Speech Communication and Technology, Madrid, 1995, pp [5] Riley, M., Byrne, W., Finke, M., Khudanpur, S., Ljolje, A.: Stochastic pronunciation modelling from hand-labelled phonetic corpora. In: Modeling Pronunciation Variation for ASR. Rolduc, 1998, pp [6] Roach, P.S. et al.: BABEL: An Eastern European Multi-language database. Int. Conference on Speech and Language, [7] Sjölander, K., Beskow, J.: Wavesurfer an open source speech tool. Proc. of the 6th International Conference of Spoken Language Processing in Beijing, China, Vol. 4, 2000, pp [8] Szaszák György, Vicsi Klára: Folyamatos beszéd szószintû szegmentálása szupra-szegmentális jegyek alapján. III. Magyar Számítógépes Nyelvészeti Konferencia, Szeged, 2005, pp [9] Young, S. et al.: The HTK Book (for version 3.3). Cambridge: Cambridge University, [10] Veilleux, N.M., Ostendorf, M.: Prosody/parse scoring and its application in ATIS. Human Language and Language and Technology. Proc. of the ARPA Workshop, Plainsboro, pp [11] Vicsi K., Kocsor A., Tóth L., Velkei Sz., Szaszák Gy., Teleki Cs., Bánhalmi A., Paczolay D.: A Magyar Referencia Beszédadatbázis és alkalmazása orvosi diktálórendszerek kifejlesztéséhez. III. Magyar Számítógépes Nyelvészeti Konferencia, Szeged, 2005, pp [12] Vicsi, K., Szaszák, Gy.: Automatic Segmentation of Continuous Speech on Word Level Based on Supra-segmental Features. International Journal of Speech Technology, Vol. 8., No.4, 2005, pp LXIII. ÉVFOLYAM 2008/5
A szupraszegmentális jellemzők szerepe és felhasználása a gépi beszédfelismerésben. Szaszák György
Budapesti Műszaki és Gazdaságtudományi Egyetem Távközlési és Médiainformatikai Tanszék A szupraszegmentális jellemzők szerepe és felhasználása a gépi beszédfelismerésben Szaszák György Tézisfüzet Tudományos
Szerkesztők és szerzők:
Szerkesztők szerzők Áttekintő szerkesztő: Gordos Géza (1937) a beszéd mérnöke, a műszaki indíttatású beszédkutatás vezéralakja. A Budapesti Műszaki Egyetemen (BME) szerzett híradástechnikai szakos oklevelet
BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA
BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA BESZÉDTUDOMÁNY Az emberi kommunikáció egyik leggyakrabban használt eszköze a nyelv. A nyelv hangzó változta, a beszéd a nyelvi kommunikáció
Folyamatos beszéd szószintű automatikus szegmentálása szupraszegmentális jegyek alapján
Folyamatos beszéd szószintű automatikus szegmentálása szupraszegmentális jegyek alapján Szaszák György 1, Vicsi Klára 1 1 Budapesti Műszaki és Gazdaságtudományi Egyetem, Távközlési és Médiainformatikai
A HANGSÚLY EGYIK JELLEMZŐ MODALITÁSÁNAK VIZSGÁLATA EXAMINATION OF ONE OF THE CHARACTERISTIC MODALITIES OF STRESS
Alkalmazott Nyelvészeti Közlemények, Miskolc, IX. évfolyam, 1. szám (2014) pp. 114-121. A HANGSÚLY EGYIK JELLEMZŐ MODALITÁSÁNAK VIZSGÁLATA EXAMINATION OF ONE OF THE CHARACTERISTIC MODALITIES OF STRESS
Szintetizált beszéd természetesebbé tétele
Csapó Tamás Gábor IV. évf. Szintetizált beszéd természetesebbé tétele Konzulensek: Dr. Németh Géza, Dr. Fék Márk Budapesti Mőszaki és Gazdaságtudományi Egyetem Távközlési és Médiainformatikai Tanszék OTDK
szakmai önéletrajz Bánhalmi András Személyes információk: Végzettségek, képzések: Idegen nyelv: Oktatás:
szakmai önéletrajz Személyes információk: Név: Bánhalmi András Pozíció: Tudományos segédmunkatárs Munkahely: MTA-SZTE Mesterséges Intelligencia Kutatócsoport Cím: 6720 Szeged, Aradi vértanúk tere 1. Telefon:
Akusztikai mérések SztahóDávid
Akusztikai mérések SztahóDávid sztaho@tmit.bme.hu http://alpha.tmit.bme.hu/speech http://berber.tmit.bme.hu/oktatas/gyak02.ppt Tartalom Akusztikai produktum Gerjesztés típus Vokális traktus Sugárzási ellenállás
Beszédfelismerő szoftver adaptálása C# programozási nyelvre
Beszédfelismerő szoftver adaptálása C# programozási nyelvre Készítette: Sztahó Dávid A szoftver leírása A szoftver által megvalósított funkciók blokkvázlatát az 1. ábra mutatja. A szoftver valós idejű
Beszédfelismerő modellépítési kísérletek akusztikai, fonetikai szinten, kórházi leletező beszédfelismerő kifejlesztése céljából
Beszédfelismerő modellépítési kísérletek akusztikai, fonetikai szinten, kórházi leletező beszédfelismerő kifejlesztése céljából Velkei Szabolcs, Vicsi Klára BME Távközlési és Médiainformatikai Tanszék,
book 2010/9/9 14:36 page v #5
1 A MAGYAR BESZÉD beszédakusztika, beszédtechnológia, beszédinformációs rendszerek Szrkesztette: Németh Géza, Olaszy Gábor Áttekint! szerkeszt!: Gordos Géza Akadémiai Kiadó KIKNEK SZÓLNA A KÖNYV? A könyv
Tartalomjegyzék. Rövidítések jegyzéke... EMBER, NYELV, BESZÉD. 1. A beszéd és az információs társadalom... 3
Előszó............................................................. Szerkesztők szerzők............................................... Rövidítések jegyzéke................................................
Beszédadatbázis irodai számítógép-felhasználói környezetben
Beszédadatbázis irodai számítógép-felhasználói környezetben Vicsi Klára*, Kocsor András**, Teleki Csaba*, Tóth László** *BME Távközlési és Médiainformatikai Tanszék, Beszédakusztikai Laboratórium **MTA
A HANGOK TANÁTÓL A BESZÉDTECHNOLÓGIÁIG. Gósy Mária. MTA Nyelvtudományi Intézet, Kempelen Farkas Beszédkutató Laboratórium
A HANGOK TANÁTÓL A BESZÉDTECHNOLÓGIÁIG Gósy Mária MTA Nyelvtudományi Intézet, Kempelen Farkas Beszédkutató Laboratórium beszédzavarok beszédtechnika beszélő felismerése fonológia fonetika alkalmazott fonetika
Mély neuronhálók alkalmazása és optimalizálása
magyar nyelv beszédfelismerési feladatokhoz 2015. január 10. Konzulens: Dr. Mihajlik Péter A megvalósítandó feladatok Irodalomkutatás Nyílt kutatási eszközök keresése, beszédfelismer rendszerek tervezése
A magánhangzó-formánsok és a szubglottális rezonanciák összefüggése a spontán beszédben
A magánhangzó-formánsok és a szubglottális rezonanciák összefüggése a spontán beszédben Csapó Tamás Gábor, 1 Bárkányi Zsuzsanna, 2 Gráczi Tekla Etelka, 2 Beke András, 3 Bőhm Tamás 1,4 csapot@tmit.bme.hu
Záróvizsga szakdolgozat. Mérési bizonytalanság meghatározásának módszertana metallográfiai vizsgálatoknál. Kivonat
Záróvizsga szakdolgozat Mérési bizonytalanság meghatározásának módszertana metallográfiai vizsgálatoknál Kivonat Csali-Kovács Krisztina Minőségirányítási szakirány 2006 1 1. Bevezetés 1.1. A dolgozat célja
A beszéd. Segédlet a Kommunikáció-akusztika tanulásához
A beszéd Segédlet a Kommunikáció-akusztika tanulásához Bevezetés Nyelv: az emberi társadalom egyedei közötti kommunikáció az egyed gondolkodásának legfőbb eszköze Beszéd: a nyelv elsődleges megnyilvánulása
1.ábra: A Beszédmester nyitóképe
A Beszédmester beszédjavítás-terápiai és olvasásfejlesztő rendszer és informatikai aspektusai Kocsor András 1, Papp Gabriella 2, Bácsi János 3, Mihalovics Jenő 4 Bevezetés A Beszédmester az OM támogatásával
Peltier-elemek vizsgálata
Peltier-elemek vizsgálata Mérés helyszíne: Vegyész labor Mérés időpontja: 2012.02.20. 17:00-20:00 Mérés végrehatói: Budai Csaba Sánta Botond I. Seebeck együttható közvetlen kimérése Az adott P-N átmenetre
A fonetik ar ol altal aban 2014. szeptember 15.
A fonetikáról általában 2014. szeptember 15. A félévben előforduló témák: Miben más a fonetika, mint a fonológia? Artikuláció, avagy beszédprodukció. Beszédakusztika. A Praat beszédelemző szoftver használata.
Nagyságrendek. Kiegészítő anyag az Algoritmuselmélet tárgyhoz. Friedl Katalin BME SZIT február 1.
Nagyságrendek Kiegészítő anyag az Algoritmuselmélet tárgyhoz (a Rónyai Ivanyos Szabó: Algoritmusok könyv mellé) Friedl Katalin BME SZIT friedl@cs.bme.hu 018. február 1. Az O, Ω, Θ jelölések Az algoritmusok
Folyamatos, középszótáras, beszédfelismerô rendszer fejlesztési tapasztalatai: kórházi leletezô beszédfelismerô
Folyamatos, középszótáras, beszédfelismerô rendszer fejlesztési tapasztalatai: kórházi leletezô beszédfelismerô VICSI KLÁRA, VELKEI SZABOLCS, SZASZÁK GYÖRGY, BOROSTYÁN GÁBOR, GORDOS GÉZA BME Távközlési
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,
Beszédadatbázisok a gépi beszédfelismerés segítésére
Beszédadatbázisok a gépi beszédfelismerés segítésére Vicsi Klára 1 Adatbázisok jelentősége A gépi beszéd és beszélő felismerési eljárások lényegében két jól elkülöníthető elméleti alapra épülnek. Az egyik
Soros felépítésű folytonos PID szabályozó
Soros felépítésű folytonos PID szabályozó Főbb funkciók: A program egy PID szabályozót és egy ez által szabályozott folyamatot szimulál, a kimeneti és a beavatkozó jel grafikonon való ábrázolásával. A
Al-Mg-Si háromalkotós egyensúlyi fázisdiagram közelítő számítása
l--si háromalkotós egyensúlyi fázisdiagram közelítő számítása evezetés Farkas János 1, Dr. Roósz ndrás 1 doktorandusz, tanszékvezető egyetemi tanár Miskolci Egyetem nyag- és Kohómérnöki Kar Fémtani Tanszék
Függvények növekedési korlátainak jellemzése
17 Függvények növekedési korlátainak jellemzése A jellemzés jól bevált eszközei az Ω, O, Θ, o és ω jelölések. Mivel az igények általában nemnegatívak, ezért az alábbi meghatározásokban mindenütt feltesszük,
Méréselmélet MI BSc 1
Mérés és s modellezés 2008.02.15. 1 Méréselmélet - bevezetés a mérnöki problémamegoldás menete 1. A probléma kitűzése 2. A hipotézis felállítása 3. Kísérlettervezés 4. Megfigyelések elvégzése 5. Adatok
I. BESZÁLLÍTÓI TELJESÍTMÉNYEK ÉRTÉKELÉSE
I. BESZÁLLÍTÓI TELJESÍTMÉNYEK ÉRTÉKELÉSE Komplex termékek gyártására jellemző, hogy egy-egy termékbe akár több ezer alkatrész is beépül. Ilyenkor az alkatrészek általában sok különböző beszállítótól érkeznek,
Példa: Tartó lehajlásfüggvényének meghatározása végeselemes módszer segítségével
Példa: Tartó lehajlásfüggvényének meghatározása végeselemes módszer segítségével Készítette: Dr. Kossa Attila (kossa@mm.bme.hu) BME, Műszaki Mechanikai Tanszék 213. október 8. Javítva: 213.1.13. Határozzuk
1. ábra Modell tér I.
1 Veres György Átbocsátó képesség vizsgálata számítógépes modell segítségével A kiürítés szimuláló számítógépes modellek egyes apró, de igen fontos részletek vizsgálatára is felhasználhatóak. Az átbocsátóképesség
DETERMINATION OF SHEAR STRENGTH OF SOLID WASTES BASED ON CPT TEST RESULTS
Műszaki Földtudományi Közlemények, 83. kötet, 1. szám (2012), pp. 271 276. HULLADÉKOK TEHERBÍRÁSÁNAK MEGHATÁROZÁSA CPT-EREDMÉNYEK ALAPJÁN DETERMINATION OF SHEAR STRENGTH OF SOLID WASTES BASED ON CPT TEST
Magyar nyelvű nagyszótáras beszédfelismerési feladatok adatelégtelenségi problémáinak csökkentése nyelvi modell interpoláció alkalmazásával
Magyar nyelvű nagyszótáras beszédfelismerési feladatok adatelégtelenségi problémáinak csökkentése nyelvi modell interpoláció alkalmazásával Tarján Balázs 1 és Mihajlik Péter 1,2 1 Budapesti Műszaki és
Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )
Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel: 463-6-80 Fa: 463-30-9 http://www.vizgep.bme.hu Alap-ötlet:
Grafikonok automatikus elemzése
Grafikonok automatikus elemzése MIT BSc önálló laboratórium konzulens: Orosz György 2016.05.18. A feladat elsődleges célkitűzései o eszközök adatlapján található grafikonok feldolgozása, digitalizálása
Dodé Réka (ELTE BTK Nyelvtudomány Doktori IskolaAlkalmazott Alknyelvdok 2017 nyelvészet program) február 3. 1 / 17
Doménspecifikus korpusz építése és validálása Dodé Réka ELTE BTK Nyelvtudomány Doktori Iskola Alkalmazott nyelvészet program 2017. február 3. Dodé Réka (ELTE BTK Nyelvtudomány Doktori IskolaAlkalmazott
A deixis megjelenési formái a prozódiában
A deixis megjelenési formái a prozódiában Erdős Klaudia ELTE BTK Nyelvtudományi Doktori Iskola Bevezetés - deixis A deixis fogalma - ógör. deiktikos mutatás - megnyilatkozás körülményeire mutat Típusok
Pontműveletek. Sergyán Szabolcs Óbudai Egyetem Neumann János Informatikai Kar február 20.
Pontműveletek Sergyán Szabolcs sergyan.szabolcs@nik.uni-obuda.hu Óbudai Egyetem Neumann János Informatikai Kar 2012. február 20. Sergyán (OE NIK) Pontműveletek 2012. február 20. 1 / 40 Felhasznált irodalom
A szegénység fogalmának megjelenése a magyar online médiában
A szegénység fogalmának megjelenése a magyar online médiában Tartalomelemzés 2000 január és 2015 március között megjelent cikkek alapján Bevezetés Elemzésünk célja, hogy áttekintő képet adjunk a szegénység
Hajlított tartó elmozdulásmez jének meghatározása Ritz-módszerrel
Hajlított tartó elmozdulásmez jének meghatározása Ritz-módszerrel Segédlet az A végeselem módszer alapjai tárgy 4. laborgyakorlatához http://www.mm.bme.hu/~kossa/vemalap4.pdf Kossa Attila (kossa@mm.bme.hu)
2. Hangfrekvenciás mechanikai rezgések vizsgálata jegyzőkönyv. Zsigmond Anna Fizika Bsc II. Mérés dátuma: Leadás dátuma:
2. Hangfrekvenciás mechanikai rezgések vizsgálata jegyzőkönyv Zsigmond Anna Fizika Bsc II. Mérés dátuma: 2008. 09. 24. Leadás dátuma: 2008. 10. 01. 1 1. Mérések ismertetése Az 1. ábrán látható összeállításban
Főnévi csoportok azonosítása szabályalapú és hibrid módszerekkel
Főnévi csoportok azonosítása szabályalapú és hibrid módszerekkel MTA SZTAKI Nyelvtechnológiai Kutatócsoport recski@sztaki.hu TLP20 2010. november 25. Tartalom Előzmények A feladat A hunchunk rendszer A
VIII. Magyar Számítógépes. Nyelvészeti Konferencia MSZNY 2011. Szerkesztette: Tanács Attila. Vincze Veronika
VIII. Magyar Számítógépes Nyelvészeti Konferencia MSZNY 2011 Szerkesztette: Tanács Attila Vincze Veronika Szeged, 2011. december 1-2. http://www.inf.u-szeged.hu/mszny2011 Tartalomjegyzék I. Többnyelvuség
MÉSZÁROS JÓZSEFNÉ, NUMERIKUS MÓDSZEREK
MÉSZÁROS JÓZSEFNÉ, NUmERIKUS módszerek 9 FÜGGVÉNYKÖZELÍTÉSEK IX. SPLINE INTERPOLÁCIÓ 1. SPLINE FÜGGVÉNYEK A Lagrange interpolációnál említettük, hogy az ún. globális interpoláció helyett gyakran célszerű
Önálló labor beszámoló Képek szegmentálása textúra analízis segítségével. MAJF21 Eisenberger András május 22. Konzulens: Dr.
Önálló labor beszámoló Képek szegmentálása textúra analízis segítségével 2011. május 22. Konzulens: Dr. Pataki Béla Tartalomjegyzék 1. Bevezetés 2 2. Források 2 3. Kiértékelő szoftver 3 4. A képek feldolgozása
BitTorrent felhasználók értékeléseinek következtetése a viselkedésük alapján. Hegedűs István
BitTorrent felhasználók értékeléseinek következtetése a viselkedésük alapján Hegedűs István Ajánló rendszerek Napjainkban egyre népszerűbb az ajánló rendszerek alkalmazása A cégeket is hasznos információval
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen
MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI
MÉRÉSI EREDMÉYEK POTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI. A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk
A szabályos sokszögek közelítő szerkesztéséhez
1 A szabályos sokszögek közelítő szerkesztéséhez A síkmértani szerkesztések között van egy kedvencünk: a szabályos n - szög közelítő szerkesztése. Azért vívta ki nálunk ezt az előkelő helyet, mert nagyon
Rugalmas állandók mérése
Rugalmas állandók mérése (Mérési jegyzőkönyv) Hagymási Imre 2007. április 23. (hétfő délelőtti csoport) 1. Young-modulus mérése behajlásból 1.1. A mérés menete A mérés elméleti háttere megtalálható a jegyzetben
Mérés és modellezés 1
Mérés és modellezés 1 Mérés és modellezés A mérnöki tevékenység alapeleme a mérés. A mérés célja valamely jelenség megismerése, vizsgálata. A mérés tervszerűen végzett tevékenység: azaz rögzíteni kell
Fázisátalakulások vizsgálata
Klasszikus Fizika Laboratórium VI.mérés Fázisátalakulások vizsgálata Mérést végezte: Vanó Lilla VALTAAT.ELTE Mérés időpontja: 2012.10.18.. 1. Mérés leírása A mérés során egy adott minta viselkedését vizsgáljuk
A beszédstílus meghatározó tényezői és temporális jellemzői
A BESZÉD ÉS AMI MÖGÖTTE VAN Magyar nyelv hete 2012. április 25. A beszédstílus meghatározó tényezői és temporális jellemzői Gráczi Tekla Etelka Beszédstílus Beszédstílus = az írás, megszólalás módja A
Audiovizuális beszédfelismerés és beszédszintézis. PhD értekezés tézisei. Czap László. Tudományos vezetők: Dr. Gordos Géza Dr. Vicsi Klára 2004.
Audiovizuális beszédfelismerés és beszédszintézis PhD értekezés tézisei Czap László Tudományos vezetők: Dr. Gordos Géza Dr. Vicsi Klára Budapesti Műszaki és Gazdaságtudományi Egyetem Távközlési és Médiainformatikai
Mérési hibák 2006.10.04. 1
Mérési hibák 2006.10.04. 1 Mérés jel- és rendszerelméleti modellje Mérési hibák_labor/2 Mérési hibák mérési hiba: a meghatározandó értékre a mérés során kapott eredmény és ideális értéke közötti különbség
IX. Alkalmazott Informatikai Konferencia Kaposvári Egyetem február 25.
Kaposvári Egyetem 2011. február 25. Egedy Attila, Varga Tamás, Chován Tibor Pannon Egyetem, Mérnöki Kar, Folyamatmérnöki Intézeti Tanszék Veszprém, 8200 Egyetem utca 10. Bevezetés Cellás modellezés Kvalitatív
PRECÍZIÓS, PÁRHUZAMOS, MAGYAR BESZÉDADATBÁZIS FEJLESZTÉSE ÉS SZOLGÁLTATÁSAI. Olaszy Gábor
261 PRECÍZIÓS, PÁRHUZAMOS, MAGYAR BESZÉDADATBÁZIS FEJLESZTÉSE ÉS SZOLGÁLTATÁSAI Bevezetés A beszédkutatásban világszerte egyre nagyobb teret kapnak az előre elkészített, annotált és szegmentált beszédadatbázisok.
[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria 2016.02.22. Valószínűségi változó Véletlentől függő számértékeket (értékek sokasága) felvevő változókat valószínűségi változóknak nevezzük(jelölés: ξ, η, x). (pl. x =
Mérés és modellezés Méréstechnika VM, GM, MM 1
Mérés és modellezés 2008.02.04. 1 Mérés és modellezés A mérnöki tevékenység alapeleme a mérés. A mérés célja valamely jelenség megismerése, vizsgálata. A mérés tervszerűen végzett tevékenység: azaz rögzíteni
Beszámoló a Scopes SP2 együttműködés keretében a BME TMIT-n az 1. évben végzett kutatásról
Beszámoló a Scopes SP2 együttműködés keretében a BME TMIT-n az 1. évben végzett kutatásról Bartalis Mátyás, Csapó Tamás Gábor, Nagy Péter, Szaszák György, Sztahó Dávid, Tóth Bálint Pál, Zainkó Csaba A
Abari Kálmán publikációs jegyzéke
Abari Kálmán publikációs jegyzéke Utolsó módosítás: 2017. január 22. 2016 Abari, K., & Olaszy, G. (2016). A magyar beszéd formánslenyomatai és a koartikuláció tágabb hatóköre. Beszédkutatás, 24, 89 102.
HÁZI DOLGOZAT. Érmefeldobások eredményei és statisztikája. ELTE-TTK Kémia BSc Tantárgy: Kémia felzárkóztató (A kémia alapjai)
ELTE-TTK Kémia BSc Tantárgy: Kémia felzárkóztató (A kémia alapjai) HÁZI DOLGOZAT Érmefeldobások eredményei és statisztikája Készítette: Babinszki Bence EHA-kód: BABSAET.ELTE E-mail cím: Törölve A jelentés
Magyar nyelvű, kísérleti diktáló rendszer
Magyar nyelvű, kísérleti e-mail diktáló rendszer Tarján Balázs 1, Nagy Tímea 1, Mihajlik Péter 1,2 és Fegyó Tibor 1,3 1 Budapesti Műszaki és Gazdaságtudományi Egyetem, Távközlési és Médiainformatikai Tanszék
Nehézségi gyorsulás mérése megfordítható ingával
Nehézségi gyorsulás mérése megfordítható ingával (Mérési jegyzőkönyv) Hagymási Imre 2007. április 21. (hétfő délelőtti csoport) 1. A mérés elmélete A nehézségi gyorsulás mérésének egy klasszikus módja
Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János
Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision
Angol nyelv. A feladatlapon az alábbi figyelmeztetés és tájékoztatás jelenik meg: A szószámra vonatkozó szabályok részletezése
Tájékoztató az Íráskészség feladatok értékeléséről 2017. május-júniusi vizsgaidőszaktól Angol nyelv A feladatlapon az alábbi figyelmeztetés és tájékoztatás jelenik meg: Ügyeljen a megadott szószámra! Amennyiben
a munkaerőpiac számos szegmensében egyaránt szükségszerű a használata (Szabó
Szakmai és kommunikációs kompetencia a spontán beszédben Erdős Klaudia Nyelvtudományi Doktori Iskola Alkalmazott nyelvészet program ELTE BTK Bevezetés Kompetencia = alkalmasság, hozzáértés Latin competo
Modern Fizika Labor. 2. Elemi töltés meghatározása
Modern Fizika Labor Fizika BSC A mérés dátuma: 2011.09.27. A mérés száma és címe: 2. Elemi töltés meghatározása Értékelés: A beadás dátuma: 2011.10.11. A mérést végezte: Kalas György Benjámin Németh Gergely
A projekt bemutatása és jelentősége a célvárosok számára. Unger János SZTE Éghajlattani és Tájföldrajzi Tanszék
AZ EMBERI HŐTERHELÉS VÁROSON BELÜLI ELOSZLÁSÁNAK KIÉRTÉKELÉSE ÉS NYILVÁNOS BEMUTATÁSA HUSRB/1203/122/166 A projekt bemutatása és jelentősége a célvárosok számára Unger János SZTE Éghajlattani és Tájföldrajzi
A HG-1 Treebank és keresőfelület fejlesztői munkái, használata és felhasználhatósága
A HG-1 Treebank és keresőfelület fejlesztői munkái, használata és felhasználhatósága Az elemzésektől a keresőfelületig DELITE Angol Nyelvészeti Tanszék 2014. 03. 12. Csernyi Gábor 1 Célok, előzmények Mit?
26. MINIMÁLIS KÖLTSÉGŰ UTAK MINDEN CSÚCSPÁRRA
26. MINIMÁLIS KÖLTSÉGŰ UTAK MINDEN CSÚCSPÁRRA Az előző két fejezetben tárgyalt feladat általánosításaként a gráfban található összes csúcspárra szeretnénk meghatározni a legkisebb költségű utat. A probléma
Lineáris regresszió vizsgálata resampling eljárással
Lineáris regresszió vizsgálata resampling eljárással Dolgozatomban az European Social Survey (ESS) harmadik hullámának adatait fogom felhasználni, melyben a teljes nemzetközi lekérdezés feldolgozásra került,
FIZIKA JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ
Fizika középszint 1413 ÉRETTSÉGI VIZSGA 014. május 19. FIZIKA KÖZÉPSZINTŰ ÍRÁSBELI ÉRETTSÉGI VIZSGA JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ EMBERI ERŐFORRÁSOK MINISZTÉRIUMA A dolgozatokat az útmutató utasításai szerint,
A II. kategória Fizika OKTV mérési feladatainak megoldása
Nyomaték (x 0 Nm) O k t a t á si Hivatal A II. kategória Fizika OKTV mérési feladatainak megoldása./ A mágnes-gyűrűket a feladatban meghatározott sorrendbe és helyre rögzítve az alábbi táblázatban feltüntetett
Ismeretlen kifejezések és a szófaji egyértelm sítés
Szeged, 2010. december 2 3. 275 Ismeretlen kifejezések és a szófaji egyértelm sítés Zsibrita János 1, Vincze Veronika 1, Farkas Richárd 2 1 Szegedi Tudományegyetem, Informatikai Tanszékcsoport Szeged,
Kutatási beszámoló. 2015. február. Tangens delta mérésére alkalmas mérési összeállítás elkészítése
Kutatási beszámoló 2015. február Gyüre Balázs BME Fizika tanszék Dr. Simon Ferenc csoportja Tangens delta mérésére alkalmas mérési összeállítás elkészítése A TKI-Ferrit Fejlsztő és Gyártó Kft.-nek munkája
Fázisátalakulások vizsgálata
KLASSZIKUS FIZIKA LABORATÓRIUM 6. MÉRÉS Fázisátalakulások vizsgálata Mérést végezte: Enyingi Vera Atala ENVSAAT.ELTE Mérés időpontja: 2011. szeptember 28. Szerda délelőtti csoport 1. A mérés célja A mérés
Beszédadatbázisok elôkészítése kutatási és fejlesztési célok hatékonyabb támogatására
Beszédadatbázisok elôkészítése kutatási és fejlesztési célok hatékonyabb támogatására NÉMETH GÉZA, OLASZY GÁBOR, BARTALIS MÁTYÁS, ZAINKÓ CSABA, FÉK MÁRK, MIHAJLIK PÉTER BME Távközlési és MédiainformatikaiTanszék
Mikroszkóp vizsgálata Folyadék törésmutatójának mérése
KLASSZIKUS FIZIKA LABORATÓRIUM 8. MÉRÉS Mikroszkóp vizsgálata Folyadék törésmutatójának mérése Mérést végezte: Enyingi Vera Atala ENVSAAT.ELTE Mérés időpontja: 2011. október 12. Szerda délelőtti csoport
Modern Fizika Labor. Fizika BSc. Értékelés: A mérés dátuma: A mérés száma és címe: 12. mérés: Infravörös spektroszkópia. 2008. május 6.
Modern Fizika Labor Fizika BSc A mérés dátuma: A mérés száma és címe: 12. mérés: Infravörös spektroszkópia Értékelés: A beadás dátuma: 28. május 13. A mérést végezte: 1/5 A mérés célja A mérés célja az
Mérési struktúrák
Mérési struktúrák 2007.02.19. 1 Mérési struktúrák A mérés művelete: a mérendő jellemző és a szimbólum halmaz közötti leképezés megvalósítása jel- és rendszerelméleti aspektus mérési folyamat: a leképezést
Numerikus integrálás
Közelítő és szimbolikus számítások 11. gyakorlat Numerikus integrálás Készítette: Gelle Kitti Csendes Tibor Somogyi Viktor Vinkó Tamás London András Deák Gábor jegyzetei alapján 1. Határozatlan integrál
Rugalmas állandók mérése
KLASSZIKUS FIZIKA LABORATÓRIUM 2. MÉRÉS Rugalmas állandók mérése Mérést végezte: Enyingi Vera Atala ENVSAAT.ELTE Mérés időpontja: 2011. november 16. Szerda délelőtti csoport 1. A mérés rövid leírása Mérésem
Akusztikai tervezés a geometriai akusztika módszereivel
Akusztikai tervezés a geometriai akusztika módszereivel Fürjes Andor Tamás BME Híradástechnikai Tanszék Kép- és Hangtechnikai Laborcsoport, Rezgésakusztika Laboratórium 1 Tartalom A geometriai akusztika
Matematikai geodéziai számítások 5.
Matematikai geodéziai számítások 5 Hibaterjedési feladatok Dr Bácsatyai László Matematikai geodéziai számítások 5: Hibaterjedési feladatok Dr Bácsatyai László Lektor: Dr Benedek Judit Ez a modul a TÁMOP
A KLT (Kanade Lucas Tomasi) Feature Tracker Működése (jellegzetes pontok választása és követése)
A KL (Kanade Lucas omasi) Feature racker Működése (jellegzetes pontok választása és követése) Készítette: Hajder Levente 008.11.18. 1. Feladat A rendelkezésre álló videó egy adott képkockájából minél több
Hidraulikus hálózatok robusztusságának növelése
Dr. Dulovics Dezső Junior Szimpózium 2018. Hidraulikus hálózatok robusztusságának növelése Előadó: Huzsvár Tamás MSc. Képzés, II. évfolyam Témavezető: Wéber Richárd, Dr. Hős Csaba www.hds.bme.hu Az előadás
AUTOMATIKUS ÉRZELEM-FELISMERÉS AKUSZTIKAI PARAMÉTEREK ALAPJÁN
BUDAPESTI MŰSZAKI ÉS GAZDASÁGTUDOMÁNYI EGYETEM VILLAMOSMÉRNÖKI ÉS INFORMATIKAI KAR TÁVKÖZLÉSI ÉS MÉDIAINFORMATIKAI TANSZÉK AUTOMATIKUS ÉRZELEM-FELISMERÉS AKUSZTIKAI PARAMÉTEREK ALAPJÁN Sztahó Dávid Okl.
A PAE 1-4. BLOKK HERMETIKUS TÉR SZIVÁRGÁS-KORLÁT CSÖKKENTÉS LEHETŐSÉGÉNEK VIZSGÁLATA. Az OAH-ABA-03/16-M1 kutatási jelentés rövid bemutatása
A PAE 1-4. BLOKK HERMETIKUS TÉR SZIVÁRGÁS-KORLÁT CSÖKKENTÉS LEHETŐSÉGÉNEK VIZSGÁLATA. Az OAH-ABA-03/16-M1 kutatási jelentés rövid bemutatása Készítette: Kapocs György PM Kft TSO szeminárium, 2017.május
BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.
BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011. 1 Mérési hibák súlya és szerepe a mérési eredményben A mérési hibák csoportosítása A hiba rendűsége Mérési bizonytalanság Standard és kiterjesztett
JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ
Fizika középszint ÉRETTSÉGI VIZSGA 2005. november 5. FIZIKA KÖZÉPSZINTŰ ÍRÁSBELI ÉRETTSÉGI VIZSGA JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ OKTATÁSI MINISZTÉRIUM A dolgozatokat az útmutató utasításai szerint, jól követhetően
Statisztikai módszerek a skálafüggetlen hálózatok
Statisztikai módszerek a skálafüggetlen hálózatok vizsgálatára Gyenge Ádám1 1 Budapesti Műszaki és Gazdaságtudományi Egyetem Villamosmérnöki és Informatikai Kar Számítástudományi és Információelméleti
2. Rugalmas állandók mérése
2. Rugalmas állandók mérése Klasszikus fizika laboratórium Mérési jegyzőkönyv Mérést végezte: Vitkóczi Fanni Jegyzőkönyv leadásának időpontja: 2012. 12. 15. I. A mérés célja: Két anyag Young-modulusának
Modern fizika laboratórium
Modern fizika laboratórium 11. Az I 2 molekula disszociációs energiája Készítette: Hagymási Imre A mérés dátuma: 2007. október 3. A beadás dátuma: 2007. október xx. 1. Bevezetés Ebben a mérésben egy kétatomos
Tájékoztató az Íráskészség feladatok értékeléséről május-júniusi vizsgaidőszaktól. Angol nyelv
Tájékoztató az Íráskészség feladatok értékeléséről 2017. május-júniusi vizsgaidőszaktól Angol nyelv A feladatlapon az alábbi figyelmeztetés és tájékoztatás jelenik meg: Ügyeljen a megadott szószámra! Amennyiben
Rejtett Markov Modell
Rejtett Markov Modell A Rejtett Markov Modell használata beszédfelismerésben Készítette Feldhoffer Gergely felhasználva Fodróczi Zoltán előadásanyagát Áttekintés hagyományos Markov Modell Beszédfelismerésbeli
SZÁMÍTÓGÉPPEL TÁMOGATOTT PROZÓDIAOKTATÓ PROGRAM COMPUTER-AIDED PROSODY TEACHING PROGRAMME
Alkalmazott Nyelvészeti Közlemények, Miskolc, IX. évfolyam, 1. szám (2014) pp. 144-153. SZÁMÍTÓGÉPPEL TÁMOGATOTT PROZÓDIAOKTATÓ PROGRAM COMPUTER-AIDED PROSODY TEACHING PROGRAMME SZTAHÓ DÁVID 1 KISS GÁBOR
A szemantikus elemzés elmélete. Szemantikus elemzés (attribútum fordítási grammatikák) A szemantikus elemzés elmélete. A szemantikus elemzés elmélete
A szemantikus elemzés elmélete Szemantikus elemzés (attribútum fordítási grammatikák) a nyelvtan szabályait kiegészítjük a szemantikus elemzés tevékenységeivel fordítási grammatikák Fordítóprogramok előadás
VIDÉKFEJLESZTÉSI MINISZTÉRIUM. Petrik Lajos Két Tanítási Nyelvű Vegyipari, Környezetvédelmi és Informatikai Szakközépiskola
A versenyző kódja:... VIDÉKFEJLESZTÉSI MINISZTÉRIUM Petrik Lajos Két Tanítási Nyelvű Vegyipari, Környezetvédelmi és Informatikai Szakközépiskola Budapest, Thököly út 48-54. XV. KÖRNYEZETVÉDELMI ÉS VÍZÜGYI