BESZÉDKORPUSZ TERVEZÉSE MAGYAR NYELV, REJTETT MARKOV-MODELL ALAPÚ SZÖVEGFELOLVASÓHOZ. Tóth Bálint Németh Géza Olaszy Gábor

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "BESZÉDKORPUSZ TERVEZÉSE MAGYAR NYELV, REJTETT MARKOV-MODELL ALAPÚ SZÖVEGFELOLVASÓHOZ. Tóth Bálint Németh Géza Olaszy Gábor"

Átírás

1 278 BESZÉDKORPUSZ TERVEZÉSE MAGYAR NYELV, REJTETT MARKOV-MODELL ALAPÚ SZÖVEGFELOLVASÓHOZ Tóth Bálint Németh Géza Olaszy Gábor Bevezetés A gépi beszéd-el állítás lehet ségét el ször Kempelen Farkas alkotta meg 1791-ben (Nikléczy Olaszy 2004), de a számítógépes szöveg-beszéd átalakítók fejl dése is több évtizedes múltra tekint vissza mind nemzetközi (Moulines Charpentier 1990; Hunt Black 1996; Black Lenzo 2000; Möbius 2000), mind pedig hazai viszonylatban (Kiss Olaszy 1982). A gépi szöveg-beszéd átalakítás általánosságban két f lépésb l áll: a szövegfeldolgozó és a beszéd-el állító részekb l (1. ábra). 1. ábra A gépi szöveg-beszéd átalakítás általános struktúrája A szövegfeldolgozó modul a bemeneti szövegen végez különböz átalakításokat, majd az eredmény alapján egy leíró adatmátrixot hoz létre, melyben szerepelnek a bemeneti szöveget reprezentáló beszédhangok és a bemeneti szövegre jellemz szegmentális és szupraszegmentális információk. Ezt a leíró mátrixot kapja meg a beszéd-el állító modul, amelyb l el állítja a gépi beszéd hullámformáját. Az elmúlt évtizedekben különböz megközelítésekkel modellezték az emberi beszéd-el állítás mechanizmusát. A gépi beszéd-el állító modul két nagy csoportját különböztetjük meg: a szabály- és az adatvezérelt beszédhang-el állítást. Szabályvezérelt beszédhang-el állítás esetén mérésekb l és tapasztalati úton szerzett információk alapján felállított szabályok szerint állítjuk el a gépi beszédhangot. Ilyen megoldás például az artikulációs (Mermelstein 1973), illetve a formánsszintézis (Kiss Olaszy 1982; Klatt Klatt 1990) és a hullámforma-összef zésen alapuló diád- és triádalapú rendszerek (Moulines- Charpentier 1990; Olaszy et al. 2000).

2 Beszédkorpusz tervezése magyar nyelv, rejtett Markov-modell 279 Adatvezérelt beszédhang-el állítás esetén úgynevezett beszédkorpuszokból kinyert információk alapján állítjuk el a gépi beszédhangot. A beszédkorpusz tartalma és felépítése alapvet en meghatározza az eredményt. Általában több órányi emberi beszédet használnak, továbbá annak fonemikus átiratát, a hanghatárokat és még további lehetséges információkat (pl. hangsúlyok). Adatvezérelt megoldás például a korpuszalapú elemkiválasztásos beszédszintézis (Möbius 2000; Németh et al. 2006) és a rejtett Markovmodell (Hidden Markov Model, HMM) alapú beszédszintézis (Yoshimura et al. 1999; Black et al. 2007). Az els, magyar nyelvre készített rejtett Markovmodell alapú szövegfelolvasó fejlesztésének részleteit Tóth és Németh (2010) tanulmánya tartalmazza. Napjainkban a rejtett Markov-modell alapú szövegfelolvasó rendszerek a leginkább elterjedtek számos el nyös tulajdonságuk miatt. Kisméret (1,5-2 Mbyte) beszédadatbázisból képesek jó, közel állandó min ség, érthet beszédet el állítani, amely hordozza a beszél hangszínezeti tulajdonságait is (Yoshimura et al. 1999). Ezen túl jelent s el ny más megoldásokkal szemben, hogy lehet ség van viszonylag kicsi (5-10 percnyi) beszédkorpusz segítségével a jellemz paraméterfolyamok, és így a gépi beszédhang karakterisztikájának adott célbeszél höz való adaptációjára (Tamura et al. 1998; Ogata et al. 2006; Yamagishi Kobayashi 2007). Hátránya is van az eljárásnak, nehéz a teljes prozódiai rendszert megvalósítani (kérdés, óhajtás stb.), az el állított beszéd hangkimeneti korrektsége nem hibamentes (rossz hangid tartamok, hangkimaradások el fordulhatnak). További hátrány, hogy a felmerül hangzási hibák korrigálása nehéz, hiszen nem látunk bele a tanulási és szintetizálási folyamat részleteibe. Célkit zés Célunk az volt, hogy megállapítsuk, hogy a rejtett Markov-modell alapú szövegfelolvasás esetén javul-e a hangmin ség, ha a beszédkorpusz automatikusan végzett címkézését utólagosan kézi ellen rzésnek vetjük alá, és az esetleges címkehibák számát így gyakorlatilag nullára csökkentjük. Rejtett Markov-modell alapú szövegfelolvasás A 2. ábra egy általános HMM-alapú szöveg-beszéd átalakító blokkdiagramját mutatja be. Az eljárás két f részb l áll: tanítási és szintézis szakaszból. A tanítási szakaszban a tanító beszédkorpusz hullámformáiból kinyerjük a gerjesztési és spektrális paramétereket, majd ezen paramétereket és a beszédkorpuszhoz tartozó további információkat (pl. fonemikus átirat, hanghatárok, szegmentális és szupraszegmentális információk) adjuk át a HMM tanítási szakasznak. A tanító beszédkorpusz néhány órányi, lehet leg stúdiómin ség felvételt tartalmaz egy beszél t l, illetve a hanganyag fonemikus átiratát és minél pontosabb hanghatárjelöléseket. Tehát el ször a jellemz gerjesztési és spektrális paramétereket kinyerjük a beszédkorpuszból, majd ezen paraméterek sokaságát generatív modellekkel helyettesítjük. A modell paramétereinek becslésére a következ képlet

3 280 Tóth Bálint Németh Géza Olaszy Gábor szerint általában a maximum likelihood (ML) vagy ahhoz hasonló becslést alkalmaznak: ˆ = arg max{ p( O W, )} (1) ahol a modell paramétereit, O a beszédkorpuszból származó jellemz paramétereket (tanítóadatok) és W az O-hoz tartozó szósorozatot jelöli. A címkék a hullámforma szövegének fonemikus átiratán és az id zítéseken túl számos szegmentális és szupraszegmentális információt tartalmaznak hang-, szótagmag-, szó-, mondatrész- és mondatszinten (Zen et al. 2007). Ezeket a címkéket környezetfügg címkéknek is nevezzük. A környezetfügg címkék lehetséges kombinációja túl nagy (> ) ahhoz, hogy megfelel en reprezentatív beszédkorpuszt tudjunk hozzá készíteni, ezért a paraméterfolyamokat döntési fák segítségével csoportokba soroljuk (Yoshimura et al. 1999). Külön-külön döntési fa tartozik az egyes paraméterfolyamokhoz. Például 40 beszédhanggal számolva a kvinfón (a vizsgált hang és az el tte, ill. utána következ 2-2 hang) lehetséges változatainak száma 40 5 = , melyhez hozzávéve a további környezetfügg címkéket óriásira növeljük az állapotteret. A HMM tanítási szakaszában a gerjesztési, a spektrális és az id zítési paraméterekhez készítünk generatív modelleket. A folytonos paraméterfolyamokat (pl. spektrális paraméterek) Gauss-eloszlásokkal közelítjük (Yoshimura et al. 1999), míg a diszkrét/folytonos paraméterfolyamokat (pl. gerjesztési paraméterek esetén diszkrét módon jelezzük a zöngétlen hangot, zöngés esetben pedig folytonos módon az alapfrekvenciát) többter valószín ségi eloszlású HMMekkel (Multi-Space Probability Distribution HMM, MSD-HMM) modellezzük (Tokuda et al. 1999). Annak érdekében, hogy a hangok és a mondat ritmikáját megfelel en modellezni tudjuk, a HMM-állapotok közötti átmeneti valószín ségeket nem egy értékkel, hanem Gauss-eloszlásokkal írjuk le. A tanítási folyamat végére el áll az úgynevezett HMM adatbázis, mely a beszédkorpusz jellemz paraméterfolyamainak generatív modelljeit tartalmazza. A szintézis során ezen modellek segítségével fogunk gépi beszédhangot el állítani a következ módon. A w szósorozathoz és becsült modell paraméterekhez tartozó o paraméterek kimeneti valószín ségét maximalizáljuk az alábbiak szerint: ô = arg max{p(o w, ˆ )} (2) o Tehát a (2)-es egyenlet maximalizálását hajtjuk végre: a HMM generatív modellekb l a bemeneti szöveg alapján el állított környezetfügg címkehalmazra legjellemz bb paraméterfolyamokat generáljuk. Ebb l a paraméterfolyamból állítjuk el a gépi beszédhangot olyan beszédkódoló eljárással, mint például az impulzus-zaj gerjesztésen alapuló LPC beszédkódoló.

4 Beszédkorpusz tervezése magyar nyelv, rejtett Markov-modell ábra HMM-alapú szövegfelolvasó tanítási és szintézis fázisának blokkdiagramja Rejtett Markov-modell alapú beszél adaptáció Az el z részben a beszél függ tanítást mutattuk be. A HMM-alapú beszédszintézis egyik nagy el nye, hogy képes a beszél adaptációra. A beszél adaptáció annyit jelent, hogy a rendszer hangkarakterisztikáját képesek vagyunk egy adott célbeszél höz hasonlóra kialakítani. Más megoldásokkal szemben a rejtett Markov-modellek esetén el ny, hogy a beszél adaptációhoz viszonylag rövid, 5-10 perces beszédkorpusz elegend. A beszél adaptált tanítás folyamata hasonló a beszél függ esethez, azonban itt a tanítást két f részre oszthatjuk: el ször egy átlaghangot tanítunk, melyet utána a célbeszél hangkarakteréhez igazítunk (3. ábra). Ebben az esetben így áll el a szintézis alapját képez HMM-adatbázis. Ezután a beszédhang el állításának módszere megegyezik a beszél függ esetben használt módszerrel (2. ábra alsó része). Az átlaghang el állításához több beszél -

5 282 Tóth Bálint Németh Géza Olaszy Gábor t l (legalább 4-5), minél hosszabb (személyenként legalább 1-1,5 óra) hangfelvételre, annak fonemikus átiratára és pontos hanghatárjelöléseire van szükség. Ezután a HMM-eket az összes beszél adatbázisa alapján tanítjuk be az átlaghangra, melyben jelen vannak minden egyes beszél re az alapfrekvencia, hangid tartam és spektrális paraméterek. 3. ábra A beszél adaptált tanítás blokkdiagramja Az átlaghang tanításához használhatunk férfihangot, n it vagy mindkett t. A gyakorlatban a kevert nem átlaghang-el állítást célszer választanunk, majd ebb l adaptálni mind férfi, mind n i hangra. Meg lehet csinálni, hogy el-

6 Beszédkorpusz tervezése magyar nyelv, rejtett Markov-modell 283 lentétes nem átlaghangból adaptálunk n i/férfihangra, azonban Isogai és munkatársai (2005) kutatásában ez jelent s min ség- és természetességcsökkenést okozott a végs hangnál a nemenkénti átlaghanghoz képest. Yamagishi és munkatársai (2007) olyan eljárásról számolnak be, mely segítségével kevert nem átlaghangból a nemenkénti átlaghanghoz képest minimális min ség- és természetességromlás mellett lehet n i és férfi hangra adaptálni. Miután elkészültek az átlaghang HMM modelljei, a célbeszél t l származó hangfelvételekkel tudjuk a modellt az adott személy hangkarakteréhez és beszédstílusához igazítani, adaptálni. A beszél adaptációjára alapvet en kétfajta lehet ségünk van. Amennyiben kevés (5-10 perc) hanganyag áll rendelkezésre a célbeszél t l, akkor el nyös maximum likelihood linear regression (MLLR) alapú adaptációt választani (Ogata et al. 2006). Tamura és munkatársai (1998) kísérlete alapján akár már öt mondat is elegend lehet ahhoz, hogy a célszemély hangkarakterét és beszédstílusát visszaadja a gépi beszédhang. Amennyiben hosszabb (több mint 1 óra) adaptációs hanganyag is elérhet, akkor a maximum a posteriori (MAP) technikát érdemes használni (Yamagishi et al. 2007), mely az el z nél jobb min ség mesterségesen generált hangot eredményez. Ennek a technológiának az új változatai, mint például a CSMAPLR (constrained structural maximum a posteriori linear regression) közel azonos min séget és természetességet képviselnek, mint a beszél függ tanítás esetén el állított mesterséges beszéd (Yamagishi et al. 2009). A beszél adaptáció során MLLR eljárást használtunk. Az MLLR lineáris transzformációk segítségével az átlaghang HMM modell paramétereit a célhang irányába módosítja. Az állapotkimenetek ekkor a következ képp alakulnak: b o ) = N( o ; ˆ µ ; ˆ ) (3) j( t t j j ˆ µ = A µ + b (4) j r ( j) j r( j) ˆ = H H (5) j T r( j) j r( j) ahol µˆ j és ˆ j a j-edik állapotra jellemz kimeneti s r ségfüggvényhez tartozó várható értékvektor, ill. kovarianciamátrix a lineáris transzformáció után. A r( j), b r( j) és H r( j) a várható érték lineáris-transzformációs mátrixa, a hozzá tartozó eltolásvektor és a kovariancia lineáris-transzformációs mátrixa az r(j)-edik regressziós osztályban. Az adott állapotokra jellemz kimeneti s r ségfüggvényeket regressziós fa segítségével osztályokba soroljuk, egy adott osztályban azonos lineáris-

7 284 Tóth Bálint Németh Géza Olaszy Gábor transzformációs mátrixokat és eltolásvektort használunk. A regressziós fa méretének az adaptációs anyag mennyiségéhez való igazításával tudjuk szabályozni az adaptáció komplexitását és általánosítható képességét. Alapvet en az MLLR két fajtáját különböztetjük meg: azonos A és H lineáristranszformációs mátrixok esetén korlátozott MLLR-r l (constrained MLLR, CMMLR), egyébként pedig korlátozás mentes MLLR-r l (unconstrained MLLR) beszélünk. A jelen cikkben ismertetett rendszer esetén CMLLR-t használtunk. Anyag és módszer A kutatásaink során adott szövegkorpuszokból felolvasással beszédkorpuszokat készítettünk. Ezen beszédkorpuszokat címkékkel láttuk el (szegmentálás). Megvizsgáltuk a fonématévesztés hibaarányát (phone error rate, PER), valamint a címketévesztés hatását a hangmin ségre. Az eredmények szubjektív értékelése céljából meghallgatásos tesztet végeztünk. Beszédkorpuszok Beszédkorpuszon a következ t értjük: hanganyag, a felolvasott szöveg fonemikus átirata és szegmentálási címkék halmaza. A betanításhoz felhasznált beszédkorpuszok felolvasott beszédb l készültek. Minden bemondó egységesen ugyanazt a szöveget olvasta fel, amely fonetikailag kiegyensúlyozott mondatokat (Vicsi et al. 2004) tartalmazott (kb mondat). Öt beszédadatbázis készült, 4 férfi bemondó (életkoruk 60, 50, 30, 29 év) és egy n i (33 év) hangból. A beszédkorpusz digitalizálási adatai: 16 khz, 16 bit. Az öt beszédadatbázishoz (1. táblázat) az eredeti szövegkorpuszok automatikus módszerrel készített fonemikus átiratát használtuk, ugyanakkor az F1 és N1 beszédadatbázison kézileg is ellen riztük a fonemikus átirat és a szegmentálás pontosságát. A kés bbiekben ez utóbbi két változatot tekintjük referenciának. A beszél függ tanítás során egyszer az F1 és N1 adatbázis automatikus módszerekkel elkészült változatát, majd a kézi ellen rzésen is átesett változatait használtuk fel (összesen 4 darab). Beszél adaptált esetben az átlaghangot az automatikus módszerekkel elkészített öt beszédkorpusszal tanítottuk. Ezután a beszél adaptációt az F1 és N1 adatbázisok egy részhalmazával végeztük el (szintén a kézi és automatikus változatokkal, összesen itt is 4 darab). Az átlaghang tanítása során a szövegek fonemikus átírása kizárólag automatikus úton történt az eredeti szövegb l. Megjegyezzük, hogy az ideális eset az lenne, ha az átlaghang adatbázisai mind kézzel ellen rzöttek lennének. Kutatásunk jelenlegi szakaszában azonban még nem állt rendelkezésre az összes beszédkorpusz kézi átirata javított hanghatárokkal, ezért a konzekvens adatbázis-építés elvét alkalmaztuk, mindegyik beszédkorpuszból az automatikus átiratot használtuk.

8 Beszédkorpusz tervezése magyar nyelv, rejtett Markov-modell táblázat: A kutatás során használt beszédkorpuszok Beszél Mondatszám Id tartam Feldolgozás 1. férfi beszél (F1) perc automatikus és kézi ellen rzés 2. férfi beszél (F2) perc automatikus 3. férfi beszél (F3) perc automatikus 4. férfi beszél (F4) perc automatikus 1. n i beszél (N1) perc automatikus és kézi ellen rzés Fonématévesztési hibaarány Módszert dolgoztunk ki a fonématévesztések hibaarányának (PER) megállapítására. A következ hibafajtákat kezeltük: A bemondó mást olvas fel, mint ami a szövegben van. 1. példa: szöveg: és, fonetikai átirat: és, kimondva: s. 2. példa: szöveg: lehtetlen, átirat: lehtetlen, kimondva: lehetetlen. A fonetikai átíró mást jelöl, mint az elhangzott elem. Példa: szöveg: 900, fonetikai átirat: kilencszáz, kimondva: kilencáz. A javítás módszere: a gépileg felcímkézett adatállományokat kézi ellen rzésnek vetjük alá. Ennek során a fonemikus átiratot és az elhangzott hanganyagot egybevetjük, és a hibákat javítjuk a megfelel helyen. Minden esetben a kézzel javított fonemikus átiratot tekintjük referenciának. A kézzel javított átiratról feltételezzük, hogy hangról hangra azt tartalmazza, ami a beszédkorpusz hanganyagában szerepel. A fonématévesztések hibaarányának meghatározása során a referenciához képest vizsgáljuk az automatikusan készített fonemikus átiratot. A fonématévesztések hibaarányának számítása közben a fontos jellemz k: Fonémák száma: az összes fonéma száma a beszédkorpuszban. Helyes fonémák száma: a kézi átirathoz képest mennyi fonéma azonos. Törlések: az automatikus átiratban a kézi átirathoz képest kitöröltünk egy fonémát. Helyettesítés: az automatikus átiratban a kézi átirathoz képest helyettesítettünk egy fonémát. Beszúrás: az automatikus átiratban a kézi átirathoz képest beszúrtunk egy fonémát. A javítások száma a törlések, helyettesítések és beszúrások számának öszszege. A fonématévesztések hibaarányát a következ képp számoltuk (Young et al. 2006): HelyesFonémákSzáma PER = (6) FonémákSzáma

9 286 Tóth Bálint Németh Géza Olaszy Gábor Szegmentálás Szegmentáláson azt a folyamatot értjük, mely során a hangfelvételek hullámformáján címkével bejelöljük minden hang és szünet kezdetét (hanghatárok). Szegmentálási szempontból kétféle címkét különböztetünk meg, a hang elejét jelz jelölést és a szünetek elején elhelyezett címkét (hangsor belseji szünet és hangsor végi). Ezeket a hanghatárokat automatikus módszerrel, úgynevezett kényszerített felismeréssel (forced alignment) határoztuk meg, ami gépi beszédfelismerési módszeren alapul (Mihajlik et al. 2002). Ekkor a beszédfelismer a bemeneti szöveget elemezve jelöli ki a hanghullámban a hangokat és a hanghatárokat. Az eljárást azért hívják kényszerített felismerésnek, mert a szövegb l adódik, hogy milyen hangok követik egymást, továbbá hogy a hanghullámban csak annyi hangot jelölhet be az algoritmus, amennyi a szövegb l következik. Fontos figyelembe vennünk, hogy hibátlan fonemikus átirat esetén is lehetnek hibás hanghatárcímkék. Ezért a kényszerített felismerés szegmentálási eredményét kézi ellen rzéssel javítottuk (4. ábra). Mivel a kézi ellen rzés nagy emberi er forrást igényel, ezért ezt a használt beszédkorpuszoknak csak egy részében végeztük el (lásd 1. táblázat). 4. ábra A hanghatárok automatikus, gépi elhelyezése (fent) és a kézi javítás eredménye (lent) az Itt volt, de már elment. mondatban A hanghatárhibákat osztályokba soroltuk be attól függ en, hogy hány ms eltérés van a referencia és az automatikus hanghatár-meghatározás között a következ képp: 0,1 9 ms, ms, ms, ms, ms, ms, ms, ms, ms, 90 ms-nál több. A szegmentálás végeztével el áll(nak) a HMM-tanításhoz, illetve adaptációhoz szükséges beszédkorpusz(ok). Az automatikus és kézi ellen rzéssel történ beszédkorpuszok el állítási folyamatát az 5. ábra szemlélteti. Az ábrán szürke dobozokkal jelöltük a tanítás/adaptáció során felhasznált elemeket. A gépi beszéd el állítása A HMM-szintézishez a HTS 2.1-es rendszer módosított, magyar változatát használtuk kevert gerjesztéssel (Tóth Németh 2010). A lényegkiemeléshez

10 Beszédkorpusz tervezése magyar nyelv, rejtett Markov-modell ms-os Hanning-ablakot használtunk 5 ms eltolással. A jellemz paraméterfolyam 39 mel-kepsztrális együtthatót, a log{f 0 }-t, a zöngésségi arányt és az ezekhez tartozó delta és delta-delta együtthatókat tartalmazta. Kutatásunk során vizsgáltuk a beszél függ és beszél adaptált eseteket is. 5. ábra A beszédkorpuszok el állítási folyamata kézi ellen rzéssel (bal) és automatikusan (jobb) Meghallgatásos teszt Az eredmények kiértékelése céljából meghallgatásos tesztet állítottunk össze. A korábban ismertetett módon összesen 8 különböz gépi beszédel állító rendszert hoztunk létre a teszthez: BF-F1-kézi, BF-F1-automatikus, BF-N1-kézi, BF-N1-automatikus, BA-F1-kézi, BA-F1-automatikus, BA-N1- kézi, BA-N1-automatikus. A meghallgatásos teszt két részb l állt. Az els részben a tesztalanyok a hangminták hangzásának természetességét osztályozták a következ rendszerek esetén: BF-F1-kézi BF-F1-automatikus, BF-N1-kézi BF-N1-automatikus, BA-F1-kézi BA-F1-automatikus, BA-N1-kézi BA-N1-automatikus.

11 288 Tóth Bálint Németh Géza Olaszy Gábor A meghallgatásos teszt els részében minden rendszerb l 10 hangmintát (mondatot) használtunk fel, páronként a minták szövege azonos volt. Egy tesztel a 10 mintából 2 mintapárt hallgatott meg a beszél függ férfi és n i, illetve beszél adaptált férfi és n i HMM-rendszerek által generált hangminták közül. A tesztalanyok ötelem skálán osztályozhatták, hogy a mintapár mintái ugyanolyan természetesek-e, illetve hogy valamelyik mintát kicsit vagy sokkal természetesebbnek érzik-e a másik mintánál. A mintapárokat mindkét sorrendben lejátszottuk a tesztalanyoknak, hogy ellen rizzük az ítéletalkotás következetességét. Amennyiben jelent s eltérés volt az osztályozásban a különböz sorrendek esetén, akkor ezen méréseket nem vettük figyelembe a tesztek során. Ilyen jelleg eltérés csupán néhány esetben volt észlelhet, de nem volt jellemz sem a beszél re, sem a tesztalanyokra. A meghallgatásos teszt második felében az eredeti beszél természetes bemondásához hasonlították a tesztalanyok a gépi beszédet, hogy mennyire adja vissza annak hangzását. Ebben az esetben mind a nyolc rendszer részt vett a tesztben. A meghallgatásos teszt második felében is összesen 10 hangmintát használtunk fel, egy tesztalany egy rendszerb l egy hangmintát hallgatott meg, és 1-t l 5-ig kellett a mintákat osztályoznia. Az 1-es osztályzat itt azt jelentette, hogy egyáltalán nem adja vissza az eredeti beszél hangkarakterét, az 5-ös pedig, hogy a szintetizált hangminta összetéveszthet az eredeti beszél vel. A meghallgatásos teszt mindkét részében minden tesztalany esetén másmás sorrendben játszottuk le a hangmintákat, így zárva ki az esetleges memóriahatásokat (van Santen 1993). A tesztet összesen 29-en végezték el, 14 férfi és 15 n. Az átlagéletkor 31 év volt, a legfiatalabb tesztalany 20, a legid sebb 65 éves volt. 6 tesztalany beszédszakért volt. A teszt internetalapú volt, böngész b l lehetett kitölteni, a hangminták MP3 kódolással voltak tárolva 128 kbps, 16 bit min ségben. Eredmények A korábbiak alapján az eredmények ismertetését három részre bontjuk: megvizsgáljuk a fonématévesztések hibaarányát (PER) a beszédkorpuszokban, ismertetjük az automatikus és kézi szegmentálás különbségeit, illetve meghallgatásos tesztekkel vizsgáljuk a pontos címkézés hatását a gépi beszéd min ségére. Fonéma tévesztések hibaarányának vizsgálata A kísérleteink során összesen 8-féle beszédkorpuszt vizsgáltunk: 4 korpuszt a beszél függ tanításhoz és 4 korpuszt a beszél adaptált változathoz (ezek a korábbi korpuszokat, illetve azoknak részhalmazait tartalmazták). Az adaptációs kis beszédkorpuszt az F1 és N1 korpuszból származtattuk, és elemeit úgy választottuk ki, hogy az adott F1 és N1-b l az összes törlés, helyettesítés és beszúrás szerepeljen benne. Ezáltal az automatikus fonemikus átiratból a legtöbb hibát tartalmazó részeket tartottuk meg, továbbá véletlen

12 Beszédkorpusz tervezése magyar nyelv, rejtett Markov-modell 289 módon kiválasztottunk hozzá annyi hanganyagot, hogy 10 perc körüli id tartam álljon rendelkezésünkre. Az eredményeket a 2. és a 3. táblázat mutatja. BF-fel jelöljük a beszél függ, BA-val a beszél adaptált eljárásokhoz tartozó korpuszokat. A 2. táblázat alapján megállapíthatjuk, hogy a beszél függ esetekben a hibák száma elenyész a teljes korpusz nagyságához képest. A 3. táblázat pedig megmutatja, hogy az adaptációs beszédkorpusz esetén már nagyobb mérték hibaaránnyal kell számolnunk. 2. táblázat: A beszél függ tanításhoz felhasznált beszédkorpuszok BF-F1- kézi BF-F1- automatikus BF-N1- kézi BF-N1- automatikus Mondatszám Id tartam 190 perc 190 perc 128 perc 128 perc Fonémaszám A helyes fonémák száma Törlések Helyettesítések Beszúrások A javítások száma PER 0% 0,83% 0% 0,52% 3. táblázat: A beszél adaptációhoz felhasznált beszédkorpuszok BA-F1- kézi BA-F1- automatikus BA-N1- kézi BA-N1- automatikus Mondatszám Id tartam 10 perc 10 perc 11 perc 11 perc Fonémaszám A helyes fonémák száma Törlések Helyettesítések Beszúrások A javítások száma PER 0% 15,5% 0% 6% A szegmentálás vizsgálata A hanghatárhibák összehasonlításából származó eredményeket beszél függ tanítás során felhasznált beszédkorpusz esetén a 6., 7., beszél adaptált esetben pedig a 8. és 9. ábrák mutatják be.

13 290 Tóth Bálint Németh Géza Olaszy Gábor A hangok száma (db) Hanghatárhiba (ms) 6. ábra Az automatikus hanghatár-meghatározás pontossága BF-F1 esetben A hangok száma (db) Hanghatárhiba (ms) 7. ábra Az automatikus hanghatár-meghatározás pontossága BF-N1 esetben A hangok száma (db) Hanghatárhiba (ms) 8. ábra Az automatikus hanghatár-meghatározás pontossága BA-F1 esetben

14 Beszédkorpusz tervezése magyar nyelv, rejtett Markov-modell 291 A hangok száma (db) Hanghatárhiba (ms) 9. ábra Az automatikus hanghatár-meghatározás pontossága BA-N1 esetben Az adaptációs beszédkorpusz esetén is megvizsgáltuk a hanghatárokat, hogy az automatikus módszer mennyire tér el a kézi javítástól. Az arányok hasonlóak voltak, mint a beszél függ esetben, a hanganyag hossza miatt azonban a hibák száma jóval alacsonyabb. Az eredményeket a 7. és 8. ábra mutatja. A 2. táblázatban szerepl fonémák számát a 8. és 9. ábrákkal, illetve a 3. táblázatban feltüntetett fonémák számát a 10. és 11. ábrákkal összevetve megállapítható, hogy a beszédkorpuszban szinte az összes hanghatár módosítva lett kisebb (0,1 9 ms) és kicsit nagyobb (10 19 ms, ms, ms, ms) mértékben. A meghallgatásos teszt eredményei Kutatásunk célja a kialakult szövegfelolvasó rendszerek hangjának összehasonlítása volt annak a céljából, hogy megállapítsuk, hogy a kézi címkézés okoz-e min ségbeli javulást beszél függ és beszél adaptált esetekben. A meghallgatásos teszt eredményeit a 10. (els teszt) és a 11. ábra (második) mutatja. A 10. ábra bal oldalán jelöljük, hogy melyik rendszereket hasonlítjuk össze, a jobb oldalán pedig rendre ábrázoljuk a rendszerek összehasonlításának eredményeit (balról jobbra: az els sokkal jobb, mint a második; az els jobb, mint a második; ugyanolyan mindkét rendszer; a második jobb, mint az els ; a második sokkal jobb, mint az els ). Az eredmények alapján nem volt szignifikáns különbség egyik esetben sem a kézi és az automatikus címkézés között. A szignifikanciát egymintás t-próbával ellen riztük. Egyedül a férfi beszél vel tanított beszél függ rendszer esetén volt tapasztalható szignifikáns eltérés a kézi ellen rzés javára (legalsó sor). A meghallgatásos teszt második részében az eredeti beszél természetes bemondásaihoz kellett a tesztalanyoknak a mintákat hasonlítaniuk. Megfigyelhet, hogy a min ség mindegyik rendszer esetén hasonló volt. Az eredményeket páronként megfigyelve (els -második, harmadik-negyedik, ötödikhatodik, hetedik-nyolcadik oszlop) láthatjuk, hogy a természetes bemondás-

15 292 Tóth Bálint Németh Géza Olaszy Gábor hoz képest sem volt szignifikáns eltérés a kézi és automatikus módszerek között. A szignifikanciát a várható értékre vonatkozó kétmintás párosított t- próbával ellen riztük. A beszél adaptált n i hang esetén a kézi ellen rzés minimálisan rosszabb pontokat kapott, mint az automatikus módszer. Ez a nem várt eredmény a mérést terhel zajból származhat, nagyobb számú tesztalany esetén ez a különbség vélhet leg megsz nne. 0% 20% 40% 60% 80% 100% BF-F1-kézi és BF-F1-auto BF-N1-kézi és BF-N1-auto BA-F1-kézi és BA-F1-auto BA-N1-kézi és BA-N1-auto Kézi sokkal jobb Kézi jobb Ugyanolyan Auto jobb Auto sokkal jobb 10. ábra A meghallgatásos teszt els részének eredményei: páros összehasonlítás a különböz gépi rendszerek között Pontszám 5,00 4,00 3,00 2,00 1,00 BF-F1- kézi BF-F1- auto BF-N1- kézi BF-N1- auto BA-F1- kézi BA-F1- auto BA-N1- kézi BA-N1- auto 11. ábra A meghallgatásos teszt második részének eredményei: páros összehasonlítás a gépi rendszerek és az eredeti beszél között Következtetések Az eredmények alapján egyedül egy esetben okozott szignifikáns min ségjavulást a kézi ellen rzés az automatikussal szemben (BF-F1), azonban a meghallgatásos teszt második része során ugyanebben az esetben már nem volt észlelhet szignifikáns min ségbeli különbség. Ez azzal magyarázható,

16 Beszédkorpusz tervezése magyar nyelv, rejtett Markov-modell 293 hogy a teszt els részében összehasonlítást végeztünk két rendszer között (relatív min sítés), ami a kis eltéréseket is jelent sen fel tudja nagyítani. A teszt második felében a rendszereket külön-külön vizsgáltuk meg (abszolút min sítés), és az így kapott eredményeket hasonlítottuk össze, és ekkor már nem mutatkozott BF-F1 esetén sem szignifikáns különbség. Az összes többi esetben (BA-F1, BF-N1, BA-N1) a kézi hanghatárjelölés és kézi fonemikus átirat nem okozott szignifikáns javulást a jelenlegi magyar nyelven m köd rejtett Markov-modell alapú szövegfelolvasó rendszerben. Ezt azzal lehet magyarázni, hogy a rejtett Markov-modell alapú szövegfelolvasó generatív modelleket épít a tanító beszédkorpuszból. A beszédkorpuszban szerepl fonémák nagyszámú el fordulásának köszönhet en az automatikus eljárások által a rendszerben jelenlév hibák a statisztikai módszerek hatására kiátlagolódnak, és így nem okoznak észlelhet min ségromlást a végs rendszerekben. A cikkben bemutatott eredmények alapján kiderül, hogy jelenleg nem feltétlen a címkézés és a fonemikus átirat pontossága határozza meg a jó hangmin séget HMM-alapú gépi beszédkeltés esetén. Elképzelhet, hogy más, min séget befolyásoló tényez k (pl. hangsúlyok pontos meghatározása) javítása után a fonemikus átirat és hanghatárcímkék pontossága is már szignifikáns mértékben fogja befolyásolni a gépi beszéd min ségét. Az eredmények alapján fontos vizsgálni, hogy mi az a hibahatár, ami már jelent s min ségromlást okoz beszél függ és beszél adaptált esetben. Amennyiben a generatív modellek nagyobb hibák esetén is még megfelel min séget képesek produkálni, lehetséges lehet automatikus beszédfelismer és kényszerített felismerés alapján felügyelet nélküli tanítás és beszél adaptáció (Tóth Németh 2011). A HMM-alapú szövegfelolvasók min ségével a korpuszalapú elem-összef zéses rendszerek min sége összemérhet, ezért fontos az alkalmazott módszerek elvi lehet ségét mindkét eljárás esetén megvizsgálni. A korpuszalapú elem-összef zéses szövegfelolvasó rendszerek esetén fontos szerepet játszik a gépi beszéd min ségében a pontos fonemikus átirat és a pontos hanghatárjelölés. Az automatikus módszerekb l ered hibák az elemkiválasztás és -összef zés során hibákat visznek be a rendszerbe, és így elkerülhetetlen, hogy amennyiben a felolvasandó szöveg a hibásan megjelölt elemek közül választ, az rosszabb min ség gépi beszédet okoz. Összefoglalás Jelen cikkünkben bemutattuk a rejtett Markov-modell alapú felolvasás alapjait, és röviden ismertettük a beszél függ rendszer és a beszél adaptáció legfontosabb lépéseit. A kutatás keretein belül beszédkorpuszokat készítettünk a rejtett Markov-modell alapú szövegfelolvasó rendszerek tanításához. Elkészítettük a korpuszok automatikus címkézését, majd annak kézi ellen rzés alapú javítását a fonemikus átiratra és a hanghatárokra vonatkozóan. Statisztikát készítettünk az automatikus eljárásokat összevetve a kézi címkézés-

17 294 Tóth Bálint Németh Géza Olaszy Gábor sel, és nyolc különböz HMM-adatbázist hoztunk létre. Ezek alapján meghallgatásos tesztet terveztünk annak érdekében, hogy megállapítsuk, hogy okoz-e szignifikáns min ségjavulást a kézi fonemikus átirat és kézi hanghatárjelölés az automatikus módszerekkel szemben. Eredményeink megmutatták, hogy a magyar nyelv rejtett Markov-modell alapú szövegfelolvasó rendszerekben a kézi fonemikus átirat és hanghatárjelölés nem okoz szignifikáns min ségjavulást. Ezen eredményekre támaszkodva a jöv ben a nagy mennyiség kézi címkézés helyett használhatunk automatikus módszereket, illetve további kutatási célunk a beszédkorpusz pontossága és a HMM-alapú gépi beszéd min sége közötti összefüggések vizsgálata. Irodalom Black, Alan Lenzo, Kevin Limited domain synthesis. In: Proceedings of ICSLP Black, Alan Zen, Heiga Tokuda, Keiichi Statistical parametric speech synthesis. In: Proceedings of ICASSP Hunt, Andrew Black, Alan Unit selection in a concatenative speech synthesis system using a large speech database. In: Proceedings of ICASSP Isogai, Juri Yamagishi, Junichi Kobayashi, Takao Model adaptation and adaptive training using ESAT algorithm for HMM-based speech synthesis. In: Proceedings of EUROSPEECH Kiss Gábor Olaszy Gábor Interaktív beszédszintetizáló rendszer számítógéppel és OVE III beszédszintetizátorral. Magyar Fonetikai Füzetek Klatt, Dennis H. Klatt, Laura C Analysis, synthesis, and perception of voice quality variations among female and male talkers. Journal of the Acoustical Society of America 87/ Mermelstein, Paul Articulatory model for the study of speech production. Journal of the Acoustical Society of America Möbius, Bernd Corpus-based speech synthesis: Methods and challenges. Speech and Signals - Aspects of Speech Synthesis and Automatic Speech Recognition Moulines, Eric Charpentier, Francis Pitch-synchronous waveform processing techniques for text-to-speech synthesis using diphones. Speech Communications Németh Géza Olaszy Gábor Fék Márk Új rendszer, korpusz alapú gépi szövegfelolvasó fejlesztése és kísérleti eredményei. Beszédkutatás Nikléczy, Péter Olaszy, Gábor Kempelen s speaking machine from 1791: Possibilities and limitations. (Recovering a 200 year-old technology.) Grazer linguistische Studien Ogata, Katsumi Tachibana, Makoto Yamagishi, Junichi Kobayashi, Takao Acoustic model training based on linear transformation and MAP modification for HSMM-based speech synthesis. In: Proceedings of ICSLP Olaszy, Gábor A phonetically based data and rule system for the real time textto-speech synthesis of Hungarian. In: Proceedings of the Xth International Congress of Phonetic Sciences. Volume

18 Beszédkorpusz tervezése magyar nyelv, rejtett Markov-modell 295 Olaszy, Gábor Németh, Géza Olaszi, Péter Kiss, Géza Zainkó, Csaba Gordos, Géza Profivox a Hungarian TTS System for telecommunications applications. International Journal of Speech Technology van Santen, Jan P. H Perceptual experiments for diagnostic testing of text-tospeech systems. Computer Speech and Language Tamura, Masatsune Masuko, Takashi Tokuda, Keiichi Kobayashi, Takao Speaker adaptation for HMM-based speech synthesis system using MLLR. In: Proceedings of ESCA/COCOSDA Workshop on Speech Synthesis Tokuda, Keiichi Masuko, Takashi Miyazaki, Noboru Kobayashi, Takao Hidden markov models based on multi-space probability distribution for pitch pattern modeling. In: Proceedings of ICASSP Tóth, Bálint Németh, Géza Improvements of Hungarian hidden Markov model-based Text-to-Speech synthesis. Acta Cybernetica 19/ Tóth, Bálint Németh, Géza The effects of phoneme errors in speaker adaptation for HMM speech synthesis. In: 12th Annual Conference of the International Speech Communication Association Vicsi Klára Kocsor András Teleki Csaba Tóth László Beszédadatbázis irodai számítógép-felhasználói környezetben. In: Second Conference on Hungarian Computational Linguistics (MSZNY 2004) Yamagishi, Junichi Kobayashi, Takao Nakano, Yuji Ogata, Katsumi Isogai, Juri Analysis of speaker adaptation algorithms for HMM-based speech synthesis and a constrained SMAPLR adaptation algorithm. IEEE Audio, Speech, & Language Processing 17/ Yamagishi, Junichi Kobayashi, Takao Renals, Steve King, Simon Zen, Heiga Toda, Tomoki Tokuda, Keiichi Improved average-voice-based speech synthesis using gender-mixed modeling and a parameter generation algorithm considering GV. In: Proceedings of ISCA SSW Yamagishi, Junichi Kobayashi, Takao Average-voice-based speech synthesis using HSMM-based speaker adaptation and adaptive training. In: IEICE Transactions on Inf. & Syst. E90-D/ Yoshimura, Takayoshi Tokuda, Keiichi Masuko, Takashi Kobayashi, Takao Kitamura, Tadashi Simultaneous modeling of spectrum, pitch and duration in HMM-based speech synthesis. In: Proceedings of Eurospeech Young, Steve Evermann, Gunnar Gales, Mark Hain, Thomas Kershaw, Dan Liu, Xunying Moore, Gareth Odell, Julian Ollason, Dave Povey, Dan Valtchev, Valtcho Woodland, Phil The HTK Book, Version Zen, Heiga Nose, Takashi Yamagishi, Junichi Sako, Shinji Masuko, Takashi Black, Alan Tokuda, Keiichi The HMM-based speech synthesis system version 2.0. In: Proceedings of ISCA SSW A kutatást a BelAmi: ALAP /2005, a TÁMOP /1/KMR , a TÁMOP-4.2.1/B-09/1/KMR és CESAR (No271022) projektek támogatták.

Mély neuronhálók alkalmazása és optimalizálása

Mély neuronhálók alkalmazása és optimalizálása magyar nyelv beszédfelismerési feladatokhoz 2015. január 10. Konzulens: Dr. Mihajlik Péter A megvalósítandó feladatok Irodalomkutatás Nyílt kutatási eszközök keresése, beszédfelismer rendszerek tervezése

Részletesebben

Folytonos paraméterű vokóder rejtett Markov-modell alapú beszédszintézisben

Folytonos paraméterű vokóder rejtett Markov-modell alapú beszédszintézisben Folytonos paraméterű vokóder rejtett Markov-modell alapú beszédszintézisben magyar nyelvű kísérletek 12 beszélővel Csapó Tamás Gábor, Németh Géza Budapesti Műszaki és Gazdaságtudományi Egyetem, Távközlési

Részletesebben

Rejtett Markov-modell alapú gépi beszédkeltés

Rejtett Markov-modell alapú gépi beszédkeltés Budapesti Műszaki és Gazdaságtudományi Egyetem Távközlési és Médiainformatikai Tanszék Rejtett Markov-modell alapú gépi beszédkeltés Ph.D. tézisfüzet Villamosmérnöki Tudományok Doktori Iskola Tóth Bálint

Részletesebben

Rejtett Markov-modell alapú gépi beszédkeltés

Rejtett Markov-modell alapú gépi beszédkeltés Budapesti Műszaki és Gazdaságtudományi Egyetem Távközlési és Médiainformatikai Tanszék Rejtett Markov-modell alapú gépi beszédkeltés Doktori értekezés Villamosmérnöki Tudományok Doktori Iskola Tóth Bálint

Részletesebben

Szintetizált beszéd természetesebbé tétele

Szintetizált beszéd természetesebbé tétele Csapó Tamás Gábor IV. évf. Szintetizált beszéd természetesebbé tétele Konzulensek: Dr. Németh Géza, Dr. Fék Márk Budapesti Mőszaki és Gazdaságtudományi Egyetem Távközlési és Médiainformatikai Tanszék OTDK

Részletesebben

Beszédinformációs rendszerek 6. gyakorlat

Beszédinformációs rendszerek 6. gyakorlat Beszédinformációs rendszerek 6. gyakorlat Beszédszintetizátorok a gyakorlatban és adatbázisaik könyv 8. és 10. fejezet Olaszy Gábor, Németh Géza, Zainkó Csaba olaszy,nemeth,zainko@tmit.bme.hu 2018. őszi

Részletesebben

Tóth Bálint, Németh Géza Rejtett Markov-modell alapú mesterséges beszédkeltés magyar nyelven 2

Tóth Bálint, Németh Géza Rejtett Markov-modell alapú mesterséges beszédkeltés magyar nyelven 2 A Hírközlési és Informatikai Tudományos Egyesület folyóirata Tartalom BESZÉDTECHNOLÓGIÁK 1 Tóth Bálint, Németh Géza Rejtett Markov-modell alapú mesterséges beszédkeltés magyar nyelven 2 Csapó Tamás Gábor,

Részletesebben

szakmai önéletrajz Bánhalmi András Személyes információk: Végzettségek, képzések: Idegen nyelv: Oktatás:

szakmai önéletrajz Bánhalmi András Személyes információk: Végzettségek, képzések: Idegen nyelv: Oktatás: szakmai önéletrajz Személyes információk: Név: Bánhalmi András Pozíció: Tudományos segédmunkatárs Munkahely: MTA-SZTE Mesterséges Intelligencia Kutatócsoport Cím: 6720 Szeged, Aradi vértanúk tere 1. Telefon:

Részletesebben

Kettőnél több csoport vizsgálata. Makara B. Gábor

Kettőnél több csoport vizsgálata. Makara B. Gábor Kettőnél több csoport vizsgálata Makara B. Gábor Három gyógytápszer elemzéséből az alábbi energia tartalom adatok származtak (kilokalória/adag egységben) Három gyógytápszer elemzésébô A B C 30 5 00 10

Részletesebben

Prozódiai változatosság rejtett Markov-modell alapú szövegfelolvasóval

Prozódiai változatosság rejtett Markov-modell alapú szövegfelolvasóval Szeged, 2011. december 1 2. 167 Prozódiai változatosság rejtett Markov-modell alapú szövegfelolvasóval Csapó Tamás Gábor 1, Németh Géza 1 1 Budapesti M szaki és Gazdaságtudományi Egyetem, Távközlési és

Részletesebben

1. szemináriumi. feladatok. Ricardói modell Bevezetés

1. szemináriumi. feladatok. Ricardói modell Bevezetés 1. szemináriumi feladatok Ricardói modell Bevezetés Termelési lehetőségek határa Relatív ár Helyettesítési határráta Optimális választás Fogyasztási pont Termelési pont Abszolút előny Komparatív előny

Részletesebben

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus. Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza

Részletesebben

Szerkesztők és szerzők:

Szerkesztők és szerzők: Szerkesztők szerzők Áttekintő szerkesztő: Gordos Géza (1937) a beszéd mérnöke, a műszaki indíttatású beszédkutatás vezéralakja. A Budapesti Műszaki Egyetemen (BME) szerzett híradástechnikai szakos oklevelet

Részletesebben

BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA

BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA BESZÉDTUDOMÁNY Az emberi kommunikáció egyik leggyakrabban használt eszköze a nyelv. A nyelv hangzó változta, a beszéd a nyelvi kommunikáció

Részletesebben

Online algoritmusok. Algoritmusok és bonyolultságuk. Horváth Bálint március 30. Horváth Bálint Online algoritmusok március 30.

Online algoritmusok. Algoritmusok és bonyolultságuk. Horváth Bálint március 30. Horváth Bálint Online algoritmusok március 30. Online algoritmusok Algoritmusok és bonyolultságuk Horváth Bálint 2018. március 30. Horváth Bálint Online algoritmusok 2018. március 30. 1 / 28 Motiváció Gyakran el fordul, hogy a bemenetet csak részenként

Részletesebben

Pszichometria Szemináriumi dolgozat

Pszichometria Szemináriumi dolgozat Pszichometria Szemináriumi dolgozat 2007-2008. tanév szi félév Temperamentum and Personality Questionnaire pszichometriai mutatóinak vizsgálata Készítette: XXX 1 Reliabilitás és validitás A kérd ívek vizsgálatának

Részletesebben

VIII. Magyar Számítógépes. Nyelvészeti Konferencia MSZNY 2011. Szerkesztette: Tanács Attila. Vincze Veronika

VIII. Magyar Számítógépes. Nyelvészeti Konferencia MSZNY 2011. Szerkesztette: Tanács Attila. Vincze Veronika VIII. Magyar Számítógépes Nyelvészeti Konferencia MSZNY 2011 Szerkesztette: Tanács Attila Vincze Veronika Szeged, 2011. december 1-2. http://www.inf.u-szeged.hu/mszny2011 Tartalomjegyzék I. Többnyelvuség

Részletesebben

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Egyszempontos variancia analízis. Statisztika I., 5. alkalom Statisztika I., 5. alkalom Számos t-próba versus variancia analízis Kreativitás vizsgálata -nık -férfiak ->kétmintás t-próba I. Fajú hiba=α Kreativitás vizsgálata -informatikusok -építészek -színészek

Részletesebben

Sztöchiometriai egyenletrendszerek minimális számú aktív változót tartalmazó megoldásainak meghatározása a P-gráf módszertan alkalmazásával

Sztöchiometriai egyenletrendszerek minimális számú aktív változót tartalmazó megoldásainak meghatározása a P-gráf módszertan alkalmazásával Sztöchiometriai egyenletrendszerek minimális számú aktív változót tartalmazó megoldásainak meghatározása a P-gráf módszertan alkalmazásával * Pannon Egyetem, M szaki Informatikai Kar, Számítástudomány

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus

Részletesebben

V. Magyar Számítógépes Nyelvészeti Konferencia MSZNY 2007

V. Magyar Számítógépes Nyelvészeti Konferencia MSZNY 2007 V. Magyar Számítógépes Nyelvészeti Konferencia MSZNY 2007 Szeged, 2007. december 6-7. http://www.inf.u-szeged.hu/mszny2007 ISBN: 978-963-482-848-8 Szerkesztette: Tanács Attila és Csendes Dóra {tanacs,

Részletesebben

A beszéd. Segédlet a Kommunikáció-akusztika tanulásához

A beszéd. Segédlet a Kommunikáció-akusztika tanulásához A beszéd Segédlet a Kommunikáció-akusztika tanulásához Bevezetés Nyelv: az emberi társadalom egyedei közötti kommunikáció az egyed gondolkodásának legfőbb eszköze Beszéd: a nyelv elsődleges megnyilvánulása

Részletesebben

Generációváltás a beszédszintézisben

Generációváltás a beszédszintézisben Generációváltás a beszédszintézisben FÉK MÁRK, PESTI PÉTER, NÉMETH GÉZA, ZAINKÓ CSABA {fek,nemeth, zainko}@tmit.bme.hu, pesti@alpha.tmit.bme.hu BME Távközlési és Médiainformatikai Tanszék Kulcsszavak:

Részletesebben

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben 1 feladatsor 1 Egy dobozban 20 fehér golyó van Egy szabályos dobókockával dobunk, majd a következ t tesszük: ha a dobott szám 1,2 vagy 3, akkor tíz golyót cserélünk ki pirosra; ha a dobott szám 4 vagy

Részletesebben

Beszédinformációs rendszerek 5. gyakorlat Mintavételezés, kvantálás, beszédkódolás. Csapó Tamás Gábor

Beszédinformációs rendszerek 5. gyakorlat Mintavételezés, kvantálás, beszédkódolás. Csapó Tamás Gábor Beszédinformációs rendszerek 5. gyakorlat Mintavételezés, kvantálás, beszédkódolás Csapó Tamás Gábor 2016/2017 ősz MINTAVÉTELEZÉS 2 1. Egy 6 khz-es szinusz jelet szűrés nélkül mintavételezünk

Részletesebben

Képfeldolgozás. 1. el adás. A képfeldolgozás alapfogalmai. Mechatronikai mérnök szak BME, 2008

Képfeldolgozás. 1. el adás. A képfeldolgozás alapfogalmai. Mechatronikai mérnök szak BME, 2008 Képfeldolgozás 1. el adás. A képfeldolgozás alapfogalmai BME, 2008 A digitális képfeldolgozás alapfeladata Deníció A digitális képfeldolgozás során arra törekszünk, hogy a természetes képek elemzése révén

Részletesebben

Taylor-polinomok. 1. Alapfeladatok. 2015. április 11. 1. Feladat: Írjuk fel az f(x) = e 2x függvény másodfokú Maclaurinpolinomját!

Taylor-polinomok. 1. Alapfeladatok. 2015. április 11. 1. Feladat: Írjuk fel az f(x) = e 2x függvény másodfokú Maclaurinpolinomját! Taylor-polinomok 205. április.. Alapfeladatok. Feladat: Írjuk fel az fx) = e 2x függvény másodfokú Maclaurinpolinomját! Megoldás: A feladatot kétféle úton is megoldjuk. Az els megoldásban induljunk el

Részletesebben

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet Kettőnél több csoport vizsgálata Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet Gyógytápszerek (kilokalória/adag) Három gyógytápszer A B C 30 5 00 10 05 08 40 45 03 50 35 190 Kérdések: 1. Van-e

Részletesebben

Biostatisztika VIII. Mátyus László. 19 October

Biostatisztika VIII. Mátyus László. 19 October Biostatisztika VIII Mátyus László 19 October 2010 1 Ha σ nem ismert A gyakorlatban ritkán ismerjük σ-t. Ha kiszámítjuk s-t a minta alapján, akkor becsülhetjük σ-t. Ez további bizonytalanságot okoz a becslésben.

Részletesebben

Lineáris regresszió vizsgálata resampling eljárással

Lineáris regresszió vizsgálata resampling eljárással Lineáris regresszió vizsgálata resampling eljárással Dolgozatomban az European Social Survey (ESS) harmadik hullámának adatait fogom felhasználni, melyben a teljes nemzetközi lekérdezés feldolgozásra került,

Részletesebben

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris

Részletesebben

y ij = µ + α i + e ij

y ij = µ + α i + e ij Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai

Részletesebben

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba Egymintás u-próba STATISZTIKA 2. Előadás Középérték-összehasonlító tesztek Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum

Részletesebben

Ellátási lánc optimalizálás P-gráf módszertan alkalmazásával mennyiségi és min ségi paraméterek gyelembevételével

Ellátási lánc optimalizálás P-gráf módszertan alkalmazásával mennyiségi és min ségi paraméterek gyelembevételével Ellátási lánc optimalizálás P-gráf módszertan alkalmazásával mennyiségi és min ségi paraméterek gyelembevételével Pekárdy Milán, Baumgartner János, Süle Zoltán Pannon Egyetem, Veszprém XXXII. Magyar Operációkutatási

Részletesebben

IRREGULÁRIS BESZÉD REGULÁRISSÁ ALAKÍTÁSA BESZÉDKÓDOLÁSON ALAPULÓ MÓDSZERREL. Csapó Tamás Gábor Németh Géza

IRREGULÁRIS BESZÉD REGULÁRISSÁ ALAKÍTÁSA BESZÉDKÓDOLÁSON ALAPULÓ MÓDSZERREL. Csapó Tamás Gábor Németh Géza 162 IRREGULÁRIS BESZÉD REGULÁRISSÁ ALAKÍTÁSA BESZÉDKÓDOLÁSON ALAPULÓ MÓDSZERREL Csapó Tamás Gábor Németh Géza Bevezetés Az emberi beszédben a zöngés hangok képzésekor a hangszalagok általában közel tökéletesen,

Részletesebben

Hipotézis vizsgálatok

Hipotézis vizsgálatok Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével

Részletesebben

Beszédinformációs rendszerek

Beszédinformációs rendszerek Beszédinformációs rendszerek 2005 tavasz Beszédkeltés gyakorlat (Olaszy Gábor, Kiss Géza) A beszéd biológiai rendszerek között működik. A beszéd akusztikai jele egyedi és egyéni, pillanatnyi produktum

Részletesebben

Gépi tanulás a gyakorlatban. Bevezetés

Gépi tanulás a gyakorlatban. Bevezetés Gépi tanulás a gyakorlatban Bevezetés Motiváció Nagyon gyakran találkozunk gépi tanuló alkalmazásokkal Spam detekció Karakter felismerés Fotó címkézés Szociális háló elemzés Piaci szegmentáció analízis

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,

Részletesebben

ÉRZELEM KIFEJEZÉSE GÉPI BESZÉDDEL. Fék Márk Olaszy Gábor Szabó János Németh Géza Gordos Géza

ÉRZELEM KIFEJEZÉSE GÉPI BESZÉDDEL. Fék Márk Olaszy Gábor Szabó János Németh Géza Gordos Géza 134 ÉRZELEM KIFEJEZÉSE GÉPI BESZÉDDEL Fék Márk Olaszy Gábor Szabó János Németh Géza Gordos Géza Bevezetés A mesterséges beszédkeltés mára elérte azt a minőségi szintet, hogy a számítógép által előállított

Részletesebben

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE Tartalomjegyzék 5 Tartalomjegyzék Előszó I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE 1. fejezet: Kontrollált kísérletek 21 1. A Salk-oltás kipróbálása 21 2. A porta-cava sönt 25 3. Történeti kontrollok 27 4. Összefoglalás

Részletesebben

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás

Részletesebben

Kétdimenziós mesterséges festési eljárások. Hatások és alkalmazások

Kétdimenziós mesterséges festési eljárások. Hatások és alkalmazások Pannon Egyetem Informatikai Tudományok Doktori Iskola Tézisfüzet Kétdimenziós mesterséges festési eljárások. Hatások és alkalmazások Kovács Levente Képfeldolgozás és Neuroszámítógépek Tanszék Témavezet

Részletesebben

DIPLOMATERV VÁLTOZATOS PROZÓDIA MEGVALÓSÍTÁSA SZÖVEGFELOLVASÓ RENDSZEREKBEN. Készítette: CSAPÓ TAMÁS GÁBOR

DIPLOMATERV VÁLTOZATOS PROZÓDIA MEGVALÓSÍTÁSA SZÖVEGFELOLVASÓ RENDSZEREKBEN. Készítette: CSAPÓ TAMÁS GÁBOR DIPLOMATERV VÁLTOZATOS PROZÓDIA MEGVALÓSÍTÁSA SZÖVEGFELOLVASÓ RENDSZEREKBEN Készítette: CSAPÓ TAMÁS GÁBOR csapo@tmit.bme.hu Konzulensek: DR. NÉMETH GÉZA nemeth@tmit.bme.hu DR. FÉK MÁRK fek@tmit.bme.hu

Részletesebben

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a Kabos: Statisztika II. t-próba 9.1 Egymintás z-próba Ha ismert a doboz szórása de nem ismerjük a doboz várhatóértékét, akkor a H 0 : a doboz várhatóértéke = egy rögzített érték hipotézisről úgy döntünk,

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát

Részletesebben

Makroökonómia (G-Kar és HR) gyakorló feladatok az 1. és 2. szemináriumra

Makroökonómia (G-Kar és HR) gyakorló feladatok az 1. és 2. szemináriumra Makroökonómia (G-Kar és HR) gyakorló feladatok az 1. és 2. szemináriumra 1. Feladat Az általunk vizsgált gazdaságban 2018-ban és 2019-ben csupán két terméket állítanak el : X-et és Y-t. Az ezekre vonatkozó

Részletesebben

Lineáris regressziós modellek 1

Lineáris regressziós modellek 1 Lineáris regressziós modellek 1 Ispány Márton és Jeszenszky Péter 2016. szeptember 19. 1 Az ábrák C.M. Bishop: Pattern Recognition and Machine Learning c. könyvéből származnak. Tartalom Bevezető példák

Részletesebben

Gépi tanulás és Mintafelismerés

Gépi tanulás és Mintafelismerés Gépi tanulás és Mintafelismerés jegyzet Csató Lehel Matematika-Informatika Tanszék BabesBolyai Tudományegyetem, Kolozsvár 2007 Aug. 20 2 1. fejezet Bevezet A mesterséges intelligencia azon módszereit,

Részletesebben

Hibrid előfeldolgozó algoritmusok morfológiailag komplex nyelvek és erőforrásszegény domainek hatékony feldolgozására Orosz György

Hibrid előfeldolgozó algoritmusok morfológiailag komplex nyelvek és erőforrásszegény domainek hatékony feldolgozására Orosz György Hibrid előfeldolgozó algoritmusok morfológiailag komplex nyelvek és erőforrásszegény domainek hatékony feldolgozására Orosz György Témavezető: Prószéky Gábor Bevezetés Előfeldolgozó algoritmusok Napjaink

Részletesebben

Irányítási struktúrák összehasonlító vizsgálata. Tóth László Richárd. Pannon Egyetem Vegyészmérnöki és Anyagtudományok Doktori Iskola

Irányítási struktúrák összehasonlító vizsgálata. Tóth László Richárd. Pannon Egyetem Vegyészmérnöki és Anyagtudományok Doktori Iskola Doktori (PhD) értekezés tézisei Irányítási struktúrák összehasonlító vizsgálata Tóth László Richárd Pannon Egyetem Vegyészmérnöki és Anyagtudományok Doktori Iskola Témavezetők: Dr. Szeifert Ferenc Dr.

Részletesebben

Al-Mg-Si háromalkotós egyensúlyi fázisdiagram közelítő számítása

Al-Mg-Si háromalkotós egyensúlyi fázisdiagram közelítő számítása l--si háromalkotós egyensúlyi fázisdiagram közelítő számítása evezetés Farkas János 1, Dr. Roósz ndrás 1 doktorandusz, tanszékvezető egyetemi tanár Miskolci Egyetem nyag- és Kohómérnöki Kar Fémtani Tanszék

Részletesebben

Idegennyelv-tanulás támogatása statisztikai és nyelvi eszközökkel

Idegennyelv-tanulás támogatása statisztikai és nyelvi eszközökkel statisztikai és nyelvi eszközökkel Témalabor 2. beszámoló Témavezet : Vámos Gábor 2009. január 9. Mir l lesz szó? A cél: tesztelni és tanítani 1 A cél: tesztelni és tanítani Eszközök és célok Szókincs

Részletesebben

Valószín ségszámítás és statisztika Gyakorlat (Kétmintás próbák)

Valószín ségszámítás és statisztika Gyakorlat (Kétmintás próbák) Gyakorlat (Kétmintás próbák) 2018. december 4. Kétmintás u-próba 1 Adott két független minta 0.0012 szórású normális eloszlásból. Az egyik, 9 elem minta realizációjának átlaga 0.1672, a másik 16 elem é

Részletesebben

Valószín ségszámítás. Survey statisztika mesterszak és földtudomány alapszak Backhausz Ágnes 2018/2019.

Valószín ségszámítás. Survey statisztika mesterszak és földtudomány alapszak Backhausz Ágnes 2018/2019. Valószín ségszámítás Survey statisztika mesterszak és földtudomány alapszak Backhausz Ágnes agnes@cs.elte.hu 2018/2019. szi félév A valószín ségszámítás kurzus céljai a statisztika megalapozása: a véletlen

Részletesebben

Ismeretlen kifejezések és a szófaji egyértelm sítés

Ismeretlen kifejezések és a szófaji egyértelm sítés Szeged, 2010. december 2 3. 275 Ismeretlen kifejezések és a szófaji egyértelm sítés Zsibrita János 1, Vincze Veronika 1, Farkas Richárd 2 1 Szegedi Tudományegyetem, Informatikai Tanszékcsoport Szeged,

Részletesebben

Szegmentálási egységek összehasonlítása gépi érzelem felismerés esetén

Szegmentálási egységek összehasonlítása gépi érzelem felismerés esetén Szegmentálási egységek összehasonlítása gépi érzelem felismerés esetén Kiss Gábor, első éves msc-s hallgató BME, Távközlési és Médiainformatikai kar, Beszéd Akusztikai Laboratórium 1. Bevezető Adva volt

Részletesebben

2015/16/1 Kvantummechanika B 2.ZH

2015/16/1 Kvantummechanika B 2.ZH 2015/16/1 Kvantummechanika B 2.ZH 2015. december 10. Információk 0. A ZH ideje minimum 90 perc, maximum 180 perc. 1. Az összesen elérhet pontszám 270 pont. 2. A jeles érdemjegy eléréséhez nem szükséges

Részletesebben

Az e-kereskedelem elvárásai a biometriával szemben

Az e-kereskedelem elvárásai a biometriával szemben Őszi Arnold Az e-kereskedelem elvárásai a biometriával szemben Az e-kereskedelem elvárásai a biometriával szemben Őszi Arnold Óbudai Egyetem, Bánki Donát Gépész és Biztonságtechnikai Mérnöki Kar oszi.arnold@bgk.uni-obuda.hu

Részletesebben

A gépi beszéd-előállítás természetességének növelése rejtett Markov-modell alapú szövegfelolvasó rendszerben

A gépi beszéd-előállítás természetességének növelése rejtett Markov-modell alapú szövegfelolvasó rendszerben Budapesti Műszaki és Gazdaságtudományi Egyetem Villamosmérnöki és Informatikai Kar Távközlési és Médiainformatikai Tanszék A gépi beszéd-előállítás természetességének növelése rejtett Markov-modell alapú

Részletesebben

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Biomatematika 13. Varianciaanaĺızis (ANOVA) Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 13. Varianciaanaĺızis (ANOVA) Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date:

Részletesebben

Beszédadatbázisok elôkészítése kutatási és fejlesztési célok hatékonyabb támogatására

Beszédadatbázisok elôkészítése kutatási és fejlesztési célok hatékonyabb támogatására Beszédadatbázisok elôkészítése kutatási és fejlesztési célok hatékonyabb támogatására NÉMETH GÉZA, OLASZY GÁBOR, BARTALIS MÁTYÁS, ZAINKÓ CSABA, FÉK MÁRK, MIHAJLIK PÉTER BME Távközlési és MédiainformatikaiTanszék

Részletesebben

book 2010/9/9 14:36 page v #5

book 2010/9/9 14:36 page v #5 1 A MAGYAR BESZÉD beszédakusztika, beszédtechnológia, beszédinformációs rendszerek Szrkesztette: Németh Géza, Olaszy Gábor Áttekint! szerkeszt!: Gordos Géza Akadémiai Kiadó KIKNEK SZÓLNA A KÖNYV? A könyv

Részletesebben

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision

Részletesebben

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat

Részletesebben

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011. BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011. 1 Mérési hibák súlya és szerepe a mérési eredményben A mérési hibák csoportosítása A hiba rendűsége Mérési bizonytalanság Standard és kiterjesztett

Részletesebben

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése 4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól

Részletesebben

A KUTATÁS EREDMÉNYEI ZÁRÓJELENTÉS 2004-2006.

A KUTATÁS EREDMÉNYEI ZÁRÓJELENTÉS 2004-2006. ÖNELLENŐRZÉS ÉS FUTÁSIDEJŰ VERIFIKÁCIÓ SZÁMÍTÓGÉPES PROGRAMOKBAN OTKA T-046527 A KUTATÁS EREDMÉNYEI ZÁRÓJELENTÉS 2004-2006. Témavezető: dr. Majzik István Budapesti Műszaki és Gazdaságtudományi Egyetem

Részletesebben

PRECÍZIÓS, PÁRHUZAMOS, MAGYAR BESZÉDADATBÁZIS FEJLESZTÉSE ÉS SZOLGÁLTATÁSAI. Olaszy Gábor

PRECÍZIÓS, PÁRHUZAMOS, MAGYAR BESZÉDADATBÁZIS FEJLESZTÉSE ÉS SZOLGÁLTATÁSAI. Olaszy Gábor 261 PRECÍZIÓS, PÁRHUZAMOS, MAGYAR BESZÉDADATBÁZIS FEJLESZTÉSE ÉS SZOLGÁLTATÁSAI Bevezetés A beszédkutatásban világszerte egyre nagyobb teret kapnak az előre elkészített, annotált és szegmentált beszédadatbázisok.

Részletesebben

Többnyelvû európai híranyag-adatbázis gyûjtése és feldolgozási módszereinek kutatása multimédiás mûsorok automatikus feldolgozásához

Többnyelvû európai híranyag-adatbázis gyûjtése és feldolgozási módszereinek kutatása multimédiás mûsorok automatikus feldolgozásához Többnyelvû európai híranyag-adatbázis gyûjtése és feldolgozási módszereinek kutatása multimédiás mûsorok automatikus feldolgozásához TELEKI CSABA, VICSI KLÁRA BME Távközlési és Médiainformatika Tanszék,

Részletesebben

Tartalomjegyzék. Rövidítések jegyzéke... EMBER, NYELV, BESZÉD. 1. A beszéd és az információs társadalom... 3

Tartalomjegyzék. Rövidítések jegyzéke... EMBER, NYELV, BESZÉD. 1. A beszéd és az információs társadalom... 3 Előszó............................................................. Szerkesztők szerzők............................................... Rövidítések jegyzéke................................................

Részletesebben

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés Gépi tanulás a gyakorlatban Kiértékelés és Klaszterezés Hogyan alkalmazzuk sikeresen a gépi tanuló módszereket? Hogyan válasszuk az algoritmusokat? Hogyan hangoljuk a paramétereiket? Precízebben: Tegyük

Részletesebben

Súlyozott automaták alkalmazása

Súlyozott automaták alkalmazása Súlyozott automaták alkalmazása képek reprezentációjára Gazdag Zsolt Szegedi Tudományegyetem Számítástudomány Alapjai Tanszék Tartalom Motiváció Fraktáltömörítés Súlyozott véges automaták Képek reprezentációja

Részletesebben

Általános statisztika II. Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László

Általános statisztika II. Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László Általános statisztika II Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László Általános statisztika II Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László Publication

Részletesebben

Képfeldolgozás. 1. el adás. A képfeldolgozás m veletei. Mechatronikai mérnök szak BME, 2008

Képfeldolgozás. 1. el adás. A képfeldolgozás m veletei. Mechatronikai mérnök szak BME, 2008 Képfeldolgozás 1. el adás. A képfeldolgozás m veletei Mechatronikai mérnök szak BME, 2008 1 / 61 Alapfogalmak transzformációk Deníció Deníció Geometriai korrekciókra akkor van szükség, ha a képr l valódi

Részletesebben

ELEKTRONIKAI ALAPISMERETEK

ELEKTRONIKAI ALAPISMERETEK Elektronikai alapismeretek emelt szint ÉETTSÉGI VIZSG 0. októr. ELEKTONIKI LPISMEETEK EMELT SZINTŰ ÍÁSELI ÉETTSÉGI VIZSG JVÍTÁSI-ÉTÉKELÉSI ÚTMTTÓ EMEI EŐFOÁSOK MINISZTÉIM Egyszerű, rövid feladatok Maximális

Részletesebben

Intelligens Rendszerek Gyakorlata. Neurális hálózatok I.

Intelligens Rendszerek Gyakorlata. Neurális hálózatok I. : Intelligens Rendszerek Gyakorlata Neurális hálózatok I. dr. Kutor László http://mobil.nik.bmf.hu/tantargyak/ir2.html IRG 3/1 Trend osztályozás Pnndemo.exe IRG 3/2 Hangulat azonosítás Happy.exe IRG 3/3

Részletesebben

AKTUÁTOR MODELLEK KIVÁLASZTÁSA ÉS OBJEKTÍV ÖSSZEHASONLÍTÁSA

AKTUÁTOR MODELLEK KIVÁLASZTÁSA ÉS OBJEKTÍV ÖSSZEHASONLÍTÁSA AKTUÁTOR MODELLEK KIVÁLASZTÁSA ÉS OBJEKTÍV ÖSSZEHASONLÍTÁSA Kovács Ernő 1, Füvesi Viktor 2 1 Egyetemi docens, PhD; 2 tudományos segédmunkatárs 1 Eletrotechnikai és Elektronikai Tanszék, Miskolci Egyetem

Részletesebben

Bevezetés a programozásba I.

Bevezetés a programozásba I. Bevezetés a programozásba I. 3. gyakorlat Tömbök, programozási tételek Surányi Márton PPKE-ITK 2010.09.21. ZH! PlanG-ból papír alapú zárthelyit írunk el reláthatólag október 5-én! Tömbök Tömbök Eddig egy-egy

Részletesebben

A Markowitz modell: kvadratikus programozás

A Markowitz modell: kvadratikus programozás A Markowitz modell: kvadratikus programozás Harry Markowitz 1990-ben kapott Közgazdasági Nobel díjat a portfolió optimalizálási modelljéért. Ld. http://en.wikipedia.org/wiki/harry_markowitz Ennek a legegyszer

Részletesebben

Szöveges adatbázis tervezése rendszerüzenet generátorhoz

Szöveges adatbázis tervezése rendszerüzenet generátorhoz Szöveges adatbázis tervezése rendszerüzenet generátorhoz NÉMETH GÉZA, OLASZY GÁBOR +, BÔHM TAMÁS BME Távközlési és Médiainformatikai Tanszék, + MTA Nyelvtudományi Intézet, {olaszy, nemeth, bohm}@tmit.bme.hu

Részletesebben

Csapó Tamás Gábor. Önéletrajz TANULMÁNYOK NEMZETKÖZI TANULMÁNYOK JELENLEGI MUNKAHELY KORÁBBI MUNKAHELYEK. 2008. szept. 2014. okt.

Csapó Tamás Gábor. Önéletrajz TANULMÁNYOK NEMZETKÖZI TANULMÁNYOK JELENLEGI MUNKAHELY KORÁBBI MUNKAHELYEK. 2008. szept. 2014. okt. Csapó Tamás Gábor Önéletrajz 1117, Budapest Magyar tudósok krt. 2. +36 (30) 495 0215 +36 (1) 463 3512 +36 (1) 463 3107 csapot@tmit.bme.hu speechlab.tmit.bme.hu/csapo/ 2008. szept. 2014. okt. 2003. szept.

Részletesebben

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell Példa STATISZTIKA Egy gazdálkodó k kukorica hibrid termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a hibridek termesztése esetén azonos terméseredményre számíthatunk-e.

Részletesebben

Döntési fák. (Klasszifikációs és regressziós fák: (Classification And Regression Trees: CART ))

Döntési fák. (Klasszifikációs és regressziós fák: (Classification And Regression Trees: CART )) Döntési fák (Klasszifikációs és regressziós fák: (Classification And Regression Trees: CART )) Rekurzív osztályozó módszer, Klasszifikációs és regressziós fák folytonos, kategóriás, illetve túlélés adatok

Részletesebben

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév A pirossal írt anyagrészeket nem fogom közvetlenül számon kérni a vizsgán, azok háttérismeretként,

Részletesebben

Markov modellek 2015.03.19.

Markov modellek 2015.03.19. Markov modellek 2015.03.19. Markov-láncok Markov-tulajdonság: egy folyamat korábbi állapotai a későbbiekre csak a jelen állapoton keresztül gyakorolnak befolyást. Semmi, ami a múltban történt, nem ad előrejelzést

Részletesebben

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23 TARTALOMJEGYZÉK 1. téma Átlagbecslés (Barna Katalin).... 7 2. téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23 3. téma Összefüggések vizsgálata, korrelációanalízis (Dr. Molnár Tamás)... 73 4. téma Összefüggések

Részletesebben

A regisztrált álláskeresők számára vonatkozó becslések előrejelző képességének vizsgálata

A regisztrált álláskeresők számára vonatkozó becslések előrejelző képességének vizsgálata A regisztrált álláskeresők számára vonatkozó becslések előrejelző képességének vizsgálata Az elemzésben a GoogleTrends (GT, korábban Google Insights for Search) modellek mintán kívüli illeszkedésének vizsgálatával

Részletesebben

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása Matematikai alapok és valószínőségszámítás Statisztikai becslés Statisztikák eloszlása Mintavétel A statisztikában a cél, hogy az érdeklõdés tárgyát képezõ populáció bizonyos paramétereit a populációból

Részletesebben

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás STATISZTIKA, BIOMETRIA. Előadás Mintavétel, mintavételi technikák, adatbázis Mintavétel fogalmai A mintavételt meg kell tervezni A sokaság elemei: X, X X N, lehet véges és végtelen Mintaelemek: x, x x

Részletesebben

Környezetfüggő akusztikai modellek létrehozása Kullback-Leibler divergencia alapú klaszterezéssel

Környezetfüggő akusztikai modellek létrehozása Kullback-Leibler divergencia alapú klaszterezéssel 174 XI. Magyar Számítógépes Nyelvészeti Konferencia Környezetfüggő akusztikai modellek létrehozása Kullback-Leibler divergencia alapú klaszterezéssel Grósz Tamás, Gosztolya Gábor, Tóth László MTA-SZTE

Részletesebben

Folyadékszcintillációs spektroszkópia jegyz könyv

Folyadékszcintillációs spektroszkópia jegyz könyv Folyadékszcintillációs spektroszkópia jegyz könyv Zsigmond Anna Julia Fizika MSc I. Mérés vezet je: Horváth Ákos Mérés dátuma: 2010. október 21. Leadás dátuma: 2010. november 8. 1 1. Bevezetés A mérés

Részletesebben

24. szakkör (Csoportelméleti alapfogalmak 3.)

24. szakkör (Csoportelméleti alapfogalmak 3.) 24. szakkör (Csoportelméleti alapfogalmak 3.) D) PERMUTÁCIÓK RENDJE Fontos kérdés a csoportelméletben, hogy egy adott elem hanyadik hatványa lesz az egység. DEFINÍCIÓ: A legkisebb olyan pozitív k számot,

Részletesebben

Beszédfelismerés és szintézis tételek:

Beszédfelismerés és szintézis tételek: Beszédfelismerés és szintézis tételek: 1. tétel: Emberi beszédlánc, beszéd szerkezete, beszédhang, beszédhangok osztályozása, fonéma A nyelv egy jelrendszer, amelynek elemeihez egy nyelvközösségen belül

Részletesebben

Beszédadatbázis irodai számítógép-felhasználói környezetben

Beszédadatbázis irodai számítógép-felhasználói környezetben Beszédadatbázis irodai számítógép-felhasználói környezetben Vicsi Klára*, Kocsor András**, Teleki Csaba*, Tóth László** *BME Távközlési és Médiainformatikai Tanszék, Beszédakusztikai Laboratórium **MTA

Részletesebben

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H

Részletesebben

0,424 0,576. f) P (X 2 = 3) g) P (X 3 = 1) h) P (X 4 = 1 vagy 2 X 2 = 2) i) P (X 7 = 3, X 4 = 1, X 2 = 2 X 0 = 2) j) P (X 7 = 3, X 4 = 1, X 2 = 2)

0,424 0,576. f) P (X 2 = 3) g) P (X 3 = 1) h) P (X 4 = 1 vagy 2 X 2 = 2) i) P (X 7 = 3, X 4 = 1, X 2 = 2 X 0 = 2) j) P (X 7 = 3, X 4 = 1, X 2 = 2) Legyen adott a P átmenetvalószín ség mátrix és a ϕ 0 kezdeti eloszlás Kérdés, hogy miként lehetne meghatározni az egyes állapotokban való tartózkodás valószín ségét az n-edik lépés múlva Deniáljuk az n-lépéses

Részletesebben

Önálló labor beszámoló Képek szegmentálása textúra analízis segítségével. MAJF21 Eisenberger András május 22. Konzulens: Dr.

Önálló labor beszámoló Képek szegmentálása textúra analízis segítségével. MAJF21 Eisenberger András május 22. Konzulens: Dr. Önálló labor beszámoló Képek szegmentálása textúra analízis segítségével 2011. május 22. Konzulens: Dr. Pataki Béla Tartalomjegyzék 1. Bevezetés 2 2. Források 2 3. Kiértékelő szoftver 3 4. A képek feldolgozása

Részletesebben

A magánhangzó-formánsok és a szubglottális rezonanciák összefüggése a spontán beszédben

A magánhangzó-formánsok és a szubglottális rezonanciák összefüggése a spontán beszédben A magánhangzó-formánsok és a szubglottális rezonanciák összefüggése a spontán beszédben Csapó Tamás Gábor, 1 Bárkányi Zsuzsanna, 2 Gráczi Tekla Etelka, 2 Beke András, 3 Bőhm Tamás 1,4 csapot@tmit.bme.hu

Részletesebben

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani

Részletesebben