Szintetizált beszéd természetesebbé tétele

Hasonló dokumentumok
TDK dolgozat. Szintetizált beszéd természetesebbé tétele. Készítette: Csapó Tamás Gábor Konzulensek:

TDK dolgozat. Beszédszintetizátor prozódiai változatosságának növelése. Készítette: Csapó Tamás Gábor

Prozódiai változatosság rejtett Markov-modell alapú szövegfelolvasóval

DIPLOMATERV VÁLTOZATOS PROZÓDIA MEGVALÓSÍTÁSA SZÖVEGFELOLVASÓ RENDSZEREKBEN. Készítette: CSAPÓ TAMÁS GÁBOR

Szerkesztők és szerzők:

Tóth Bálint, Németh Géza Rejtett Markov-modell alapú mesterséges beszédkeltés magyar nyelven 2

Beszédtechnológia az információs esélyegyenlőség szolgálatában

PROFIVOX A LEGKORSZERŰBB HAZAI BESZÉDSZINTETIZÁTOR ÉS SZÖVEGFELOLVASÓ

Tartalomjegyzék. Rövidítések jegyzéke... EMBER, NYELV, BESZÉD. 1. A beszéd és az információs társadalom... 3

Magyar nyelvû, kötött témájú korpusz-alapú beszédszintézis és a kötetlenség felé vezetô út vizsgálata

book 2010/9/9 14:36 page v #5

Beszédinformációs rendszerek 6. gyakorlat

A HANGOK TANÁTÓL A BESZÉDTECHNOLÓGIÁIG. Gósy Mária. MTA Nyelvtudományi Intézet, Kempelen Farkas Beszédkutató Laboratórium

Generációváltás a beszédszintézisben

Beszédfelismerés alapú megoldások. AITIA International Zrt. Fegyó Tibor

Beszámoló a Scopes SP2 együttműködés keretében a BME TMIT-n az 1. évben végzett kutatásról

V. Magyar Számítógépes Nyelvészeti Konferencia MSZNY 2007

Szupraszegmentális szerkezet

Gépi beszédkeltés infokommunikációs rendszerekben

A magánhangzó-formánsok és a szubglottális rezonanciák összefüggése a spontán beszédben

MÉRNÖK-SZÓTÁR. számítógépes program rendszer. magyar-angol-német-orosz és más nyelvek. Mérnökök által összeállított szakmai szótárak, szakembereknek!

KÉPZÉS NEVE: Informatikai statisztikus és gazdasági tervezı TANTÁRGY CÍME: Kommunikáció és viselkedéskultúra. Készítette: Dr.

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

Adatelemzés az R-ben április 25.

A gépi beszéd-előállítás természetességének növelése rejtett Markov-modell alapú szövegfelolvasó rendszerben

Pedagógiai program. VI. kötet

Kompetenciák fejlesztése a pedagógusképzésben. IKT kompetenciák. Farkas András f_andras@bdf.hu

kodolosuli.hu: Interaktív, programozást tanító portál BALLA TAMÁS, DR. KIRÁLY SÁNDOR NETWORKSHOP 2017, SZEGED

Korpusz-alapú beszédszintézis rendszerek megvalósítási kérdései

VIII. Magyar Számítógépes. Nyelvészeti Konferencia MSZNY Szerkesztette: Tanács Attila. Vincze Veronika

A deixis megjelenési formái a prozódiában

Eötvös Loránd Tudományegyetem Tanító- és Óvóképző Kar. Útmutató a szakdolgozat szerkesztéséhez

ÉRZELEM KIFEJEZÉSE GÉPI BESZÉDDEL. Fék Márk Olaszy Gábor Szabó János Németh Géza Gordos Géza

ÖNKÖLTSÉGSZÁMÍTÁSI SZABÁLYZAT

A GONDOLKODTATÓ PÖSZETERÁPIA, azaz egy terápiás könyvegység bemutatása

Mesterséges Intelligencia Elektronikus Almanach

Szegedi Tudományegyetem Juhász Gyula Pedagógusképzı Kar Testnevelés és Sporttudományi intézet. A sportmozgások oktatásának alapjai

Újfajta, automatikus, döntési fa alapú adatbányászati módszer idősorok osztályozására

KORPUSZ-ALAPÚ SZÖVEGFELOLVASÓ RENDSZER FEJLESZTÉSE

április 24. INFO Savaria április 24. INFO Savaria április 24. INFO Savaria

A TANTÁRGY ADATLAPJA

Tantárgyi program 1. A tantárgy neve (csoportja): 2. A tantárgyfelelıs neve, beosztása: 3. Szakcsoport (szakirány) megnevezése:

KOPI. Fordítási plágiumok keresése MTA SZTAKI DSD. Pataki Máté MSZNY Department of Distributed Systems

Tömörítés. I. Fogalma: A tömörítés egy olyan eljárás, amelynek segítségével egy fájlból egy kisebb fájl állítható elő.

OTSZ VILLÁMVÉDELEM. Elemzés és módosítási javaslat

A pedagógiai kutatás metodológiai alapjai. Dr. Nyéki Lajos 2015

Kalibrálás és mérési bizonytalanság. Drégelyi-Kiss Ágota I

Informatikai ellenırzések, az informatika szerepe az ellenırzések támogatásában

hirdetési lehetıséget Városi Televízióval civil szervezet bejelentett székhelyéül iratszekrényt számítástechnikai képzés munkerı-piaci

90 Éves az MST. Kilencven éves a Statisztikai Szemle

Beszédkutatás a technológiai fejlődés tükrében. Gráczi Tekla Etelka MTA Nyelvtudományi Intézet, Fonetikai osztály

Portfólió a. TÁMOP /1/C Képzık képzése projekt keretében. Selmeczi Éva Faipari Mérnöki Kar Fa- és Papírtechnológiák Intézet

A hazai regionális klímamodellek eredményeinek együttes kiértékelése

A pedagógia mint tudomány. Dr. Nyéki Lajos 2015

KÉPZÉS NEVE: Informatikai statisztikus és gazdasági tervezı TANTÁRGY CÍME: Projektmenedzsment. Készítette: Dr. Sediviné Balassa Ildikó

BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

Az adatszolgáltatás technológiájának/algoritmusának vizsgálata, minőségi ajánlások

Költségbecslési módszerek a szerszámgyártásban. Tartalom. CEE-Product Groups. Költségbecslés. A költségbecslés szerepe. Dr.

13. modul: MÁSODFOKÚ FÜGGVÉNYEK

Tudásalapú információ integráció

Adatmodellezés. 1. Fogalmi modell

Forgalom nyilvántartó program Kezelési útmutató

az értékelemzés alapjai

40/2010. (V. 12.) KHEM rendelet

PRECÍZIÓS, PÁRHUZAMOS, MAGYAR BESZÉDADATBÁZIS FEJLESZTÉSE ÉS SZOLGÁLTATÁSAI. Olaszy Gábor

(2013. szeptember 1-tıl) 1. AZ ORSZÁGOS KÉPZÉSI JEGYZÉKBEN SZEREPLİ ADATOK 2. EGYÉB ADATOK

Miskolci Egyetem Gépészmérnöki és Informatikai Kar Alkalmazott Informatikai Tanszék

Szöveges adatbázis tervezése rendszerüzenet generátorhoz

Beszédinformációs rendszerek

Neumann János Egyetem GAMF Műszaki és Informatikai Kar

Intelligens Rendszerek Elmélete. Versengéses és önszervező tanulás neurális hálózatokban

ÚTMUTATÓ AZ ÉPÍTİIPARI IGAZSÁGÜGYI SZAKIRÁNYÚ TOVÁBBKÉPZÉS SZAKDOLGOZATÁNAK

MŐSZAKI KÉMIA. Anyagmérnök MSc képzés. Tantárgyi Kommunikációs Dosszié MISKOLCI EGYETEM MŐSZAKI ANYAGTUDOMÁNYI KAR KÉMIAI INTÉZET

A magyar beszéd. Beszédkutatás, beszédtechnológia, beszédinformációs rendszerek.

Beszédadatbázisok elôkészítése kutatási és fejlesztési célok hatékonyabb támogatására

Tököl Településrendezési Tervének és Építési Szabályzatának módosítása és aktualizálása, valamint a Tököli Repül

Építsünk IP telefont!

A beszédtechnológia jelene és jövıje

A rendelet célja. A rendelet hatálya I. FEJEZET. Az önkormányzati lakások bérletére, valamint a lakbérek mértékére vonatkozó elıírások

AJÁNLATTÉTELI FELHÍVÁS

Adatbáziskezelés alapjai. jegyzet

Kockázatalapú fenntartás-tervezés Fuzzy logika alkalmazásával. ELMŰ Hálózat Bálint Zsolt 2017/11/20

A SZAKDOLGOZAT / DIPLOMAMUNKA FORMAI KÖVETELMÉNYEI

1991. évi LXXXII. törvény. a gépjármőadóról ÁLTALÁNOS RENDELKEZÉS II. A BELFÖLDI GÉPJÁRMŐVEK ADÓJA. Az adó alanya, az adófizetésre kötelezett

AZ INFO-KOMMUNIKÁCIÓS TECHNOLÓGIA (IKT) HASZNÁLATA. Szövegértés-szövegalkotás területen

A TANTÁRGY ADATLAPJA

Mély neuronhálók alkalmazása és optimalizálása

Folytonos paraméterű vokóder rejtett Markov-modell alapú beszédszintézisben

LOGISZTIKA FOGALMA, ALAP KÉRDÉSEI

A WINETTOU Távközlési Szolgáltató Korlátolt Felelısségő Társaság. Internet szolgáltatásra vonatkozó Általános Szerzıdéses Feltételek

STATISZTIKAI PROBLÉMÁK A

Kvantitatív módszerek

Méréstechnikai alapfogalmak

Képi információk hatékony feldolgozása széles társadalmi rétegeket érintő egészségügyi problémákban

Mőanyag fröccsöntı szerszámok tervezése és gyártása

MŰSZAKI ÉS GAZDASÁGTUDOMÁNYI EGYETEM KÖZLEKEDÉSMÉRNÖKI ÉS JÁRMŰMÉRNÖKI KAR

Korpusz-alapú beszédszintézis rendszerek megvalósítási kérdései

TÁMOP kiemelt projekt. Központi szociális információs fejlesztések a szociális szolgáltatások modernizációja keretében

TÁMOP / IPR menedzsment munkaterve

Átírás:

Csapó Tamás Gábor IV. évf. Szintetizált beszéd természetesebbé tétele Konzulensek: Dr. Németh Géza, Dr. Fék Márk Budapesti Mőszaki és Gazdaságtudományi Egyetem Távközlési és Médiainformatikai Tanszék OTDK elıadás 2007. április 26.

Tartalom A kutatás célja Elméleti háttér Kísérleti munka Meghallgatásos vizsgálatok Továbbfejlesztési lehetıségek

A kutatás célja (1) Beszédszintetizátorok generációi: Formánsszintézis Elemösszefőzés Korpusz alapú elemkiválasztásos A hővös, párás hajnalt követıen változóan felhıs lesz az ég, többkevesebb napsütés várható.

A kutatás célja (2) Emberi beszédben: ugyanaz a mondat többször kiejtve kicsit máshogy hangzik változatosság a dallamban, hangsúlyozásban, ritmusban

A kutatás célja (2) Emberi beszédben: ugyanaz a mondat többször kiejtve kicsit máshogy hangzik változatosság a dallamban, hangsúlyozásban, ritmusban Szövegfelolvasókban eddig: egy adott mondat szinte mindig ugyanúgy hangzik többnyire determinisztikus rendszer nincs jól észlelhetı változatosság

A kutatás célja (2) Emberi beszédben: ugyanaz a mondat többször kiejtve kicsit máshogy hangzik változatosság a dallamban, hangsúlyozásban, ritmusban Szövegfelolvasókban eddig: egy adott mondat szinte mindig ugyanúgy hangzik többnyire determinisztikus rendszer nincs jól észlelhetı változatosság Cél: változatos beszéd megvalósítása a szövegfelolvasókban

Elméleti háttér (1) Beszéd (prozódia) összetevıi: Szubjektív Objektív Dallam alapfrekvencia (F 0 ) változtatás Hangsúly F 0, intenzitás emelés, idıtartam módosítás Ritmus beszédtempó változtatása, szünetek A menüben minden szükséges információ elhangzik. prozódia nélkül prozódiával Mivel a dallam a meghatározó, a továbbiakban ezzel foglalkozunk

Elméleti háttér (2) Beszédszintézis: szöveg beszéd A SZINTÉZIS ADAT SZINTŐ ELİKÉSZÍTÉSE Forrás: Magyar nyelvi beszédtechnológiai alapismeretek CD

Elméleti háttér (2) Beszédszintézis: szöveg beszéd A SZINTÉZIS ADAT SZINTŐ ELİKÉSZÍTÉSE Dallammenet módosítása Forrás: Magyar nyelvi beszédtechnológiai alapismeretek CD

Elméleti háttér (3) Prozódiai modellek Leíró jellegő (ToBi, GToBi, IViE) Szabály alapú Adatvezérelt (CART-tal, neurális hálóval) Szabály alapú, szuperpozíciós : Profivox, elemösszefőzéses

Beszéddallam-adatbázis Kísérleteinkben 200 mondatos hangkorpusz (idıjárásjelentés) 50 mondatos hangkorpusz ( harangok története ) 5000 mondatos hangkorpusz (idıjárásjelentés)

Beszéddallam-adatbázis Kísérleteinkben 200 mondatos hangkorpusz (idıjárásjelentés) 50 mondatos hangkorpusz ( harangok története ) 5000 mondatos hangkorpusz (idıjárásjelentés) Tartalma: Hullámforma fájl Szöveges átírás Fonetikus átírás Hang-, szünethatárok Zöngeperiódus-határok

Beszéddallam-adatbázis Kísérleteinkben 200 mondatos hangkorpusz (idıjárásjelentés) 50 mondatos hangkorpusz ( harangok története ) 5000 mondatos hangkorpusz (idıjárásjelentés) Tartalma: Hullámforma fájl Szöveges átírás Fonetikus átírás Hang-, szünethatárok Zöngeperiódus-határok

Beszéddallam-adatbázis Kísérleteinkben 200 mondatos hangkorpusz (idıjárásjelentés) 50 mondatos hangkorpusz ( harangok története ) 5000 mondatos hangkorpusz (idıjárásjelentés) Tartalma: Hullámforma fájl Szöveges átírás Fonetikus átírás Hang-, szünethatárok Zöngeperiódus-határok Többfelé lesznek csúszós útszakaszok.

Beszéddallam-adatbázis Kísérleteinkben 200 mondatos hangkorpusz (idıjárásjelentés) 50 mondatos hangkorpusz ( harangok története ) 5000 mondatos hangkorpusz (idıjárásjelentés) Tartalma: Hullámforma fájl Szöveges átírás Fonetikus átírás Hang-, szünethatárok Zöngeperiódus-határok töpfelé lesznek csúszós úcakaszok

Beszéddallam-adatbázis Kísérleteinkben 200 mondatos hangkorpusz (idıjárásjelentés) 50 mondatos hangkorpusz ( harangok története ) 5000 mondatos hangkorpusz (idıjárásjelentés) Tartalma: Hullámforma fájl Szöveges átírás Fonetikus átírás Hang-, szünethatárok Zöngeperiódus-határok

Beszéddallam-adatbázis Kísérleteinkben 200 mondatos hangkorpusz (idıjárásjelentés) 50 mondatos hangkorpusz ( harangok története ) 5000 mondatos hangkorpusz (idıjárásjelentés) Tartalma: Hullámforma fájl Szöveges átírás Fonetikus átírás Hang-, szünethatárok Zöngeperiódus-határok

Mondatok vizsgálata - 2006 Hasonlóságok keresése mondatok között mondat azonosító #2203 szószám szótagszám 10 szavak szótagszáma 6-1-1-2 Hasonlóság alapja: idıtartam szótagszám teljes mondat #2563 #3056 #2019 #2150 #2565 10 10 11 11 11 3 5 3--2-1 -3-3 1-1-3-3-3-1-5-1 3-2-2- egyes szavak #302 11-1-3-3 Szótagszám a mondatok dallama feltételezhetıen hasonló #2031 #2380 #3031 12 12 12 5 7 3--2-3 3--1-2-2 3-1-1-1-3-1-2

Mondatok vizsgálata - 2006 Hasonlóságok keresése mondatok között mondat azonosító #2203 szószám szótagszám 10 szavak szótagszáma 6-1-1-2 Hasonlóság alapja: idıtartam szótagszám teljes mondat #2563 #3056 #2019 #2150 #2565 10 10 11 11 11 3 5 3--2-1 -3-3 1-1-3-3-3-1-5-1 3-2-2- egyes szavak #302 11-1-3-3 Szótagszám a mondatok dallama feltételezhetıen hasonló #2031 #2380 #3031 12 12 12 5 7 3--2-3 3--1-2-2 3-1-1-1-3-1-2

Mondatok vizsgálata - 2006 Hasonlóságok keresése mondatok között mondat azonosító #2203 szószám szótagszám 10 szavak szótagszáma 6-1-1-2 Hasonlóság alapja: idıtartam szótagszám teljes mondat #2563 #3056 #2019 #2150 #2565 10 10 11 11 11 3 5 3--2-1 -3-3 1-1-3-3-3-1-5-1 3-2-2- egyes szavak #302 11-1-3-3 Szótagszám a mondatok dallama feltételezhetıen hasonló #2031 #2380 #3031 12 12 12 5 7 3--2-3 3--1-2-2 3-1-1-1-3-1-2

Mondatok vizsgálata - 2006 Hasonlóságok keresése mondatok között mondat azonosító #2203 szószám szótagszám 10 szavak szótagszáma 6-1-1-2 Hasonlóság alapja: idıtartam szótagszám teljes mondat #2563 #3056 #2019 #2150 #2565 10 10 11 11 11 3 5 3--2-1 -3-3 1-1-3-3-3-1-5-1 3-2-2- egyes szavak #302 11-1-3-3 Szótagszám a mondatok dallama feltételezhetıen hasonló #2031 #2380 #3031 12 12 12 5 7 3--2-3 3--1-2-2 3-1-1-1-3-1-2

Mondatok vizsgálata - 2007 Hasonlóság keresése nagyobb adatbázisban: 5000 mondat Hasonlóság alapja: mondat azonosító #3053 #361 #3855 szószám szótagszám 7 7 7 3 3 3 szavak szótagszáma 3-1-3 3-1-3 3-1-3 egyezı szótagszerkezet #3056 #3373 #1773 10 10 11 3 3-3-3-3-3 3-2-2- #2565 11 3-2-2- #3517 17 6 3--1--2 #3953 17 6 3--1--2 #2551 17 6 1-5-3-5-2-1 #3966 17 6 1-5-3-5-2-1

Mondatok vizsgálata (2) 2006 Dallammenetek összehasonlítása

Mondatok vizsgálata (2) 2006 Dallammenetek összehasonlítása magánhangzók határai eltérı helyeken

Mondatok vizsgálata (2) 2006 Dallammenetek összehasonlítása idıvetemítéssel magánhangzók határai eltérı helyeken

Mondatok vizsgálata (2) 2006 Dallammenetek összehasonlítása idıvetemítéssel magánhangzók határai azonos eltérı helyeken

Dallamcsere - 2006 Természetes bemondások között: Praat [www.praat.org] Szótagonkénti átlagos alapfrekvencia kiszámítása mindkét mondatban

Dallamcsere - 2006 Természetes bemondások között: Praat [www.praat.org] Szótagonkénti átlagos alapfrekvencia kiszámítása mindkét mondatban Ez alapján dallam emelés / csökkentés szótagonként

Dallamcsere - 2006 Természetes bemondások között: Praat [www.praat.org] Szótagonkénti átlagos alapfrekvencia kiszámítása mindkét mondatban Ez alapján dallam emelés / csökkentés szótagonként #2031: Elszórtan számíthatunk kisebb esıre. #2380: Péntekig folytatódik a meleg idı. eredeti (#2031) referencia (#2380) módosított (#2031)

Dallamcsere - 2006, 2007 Szintetizált mondatok között: szabály alapú szövegfelolvasóval (Profivox) Felhısödés estétıl várható.

Dallamcsere - 2006, 2007 Szintetizált mondatok között: szabály alapú szövegfelolvasóval (Profivox) # E gye se ket fej fá jás gyö tör het. Felhısödés estétıl várható.

Dallamcsere - 2006, 2007 Szintetizált mondatok között: szabály alapú szövegfelolvasóval (Profivox) # E gye se ket fej fá jás gyö tör het. Felhısödés estétıl várható.

Dallamcsere - 2006, 2007 Szintetizált mondatok között: szabály alapú szövegfelolvasóval (Profivox) # referencia (#3056) E gye se ket fej fá jás gyö tör het. módosított (#3373) # Felhısödés estétıl várható. Profivox szabály alapú (#3373) Fel hı sö dés es té tıl vár ha tó.

Vizsgálatok - 2006 Meghallgatásos vizsgálatok weben 28 mondatpár, egy-egy mondat több változata: eredeti, eredeti módosítva, szintetizált, szintetizált módosítva 26 tesztelı, el kellett dönteniük, hogy melyik változat természetesebb (1. jobb / 2. jobb / egyformák) Mit akartunk megtudni? Vajon a megváltoztatott prozódia észlelhetı-e? Ha igen, elviselhetı-e a változás?

Kísérletek eredménye - 2006 Az eredeti változat jobb, mint a módosított Különbözı referenciával módosított változatok között hallható a különbség, minıségük hasonló sikerült elérni a prozódiai változatosságot #2031-es mondatváltozatok összehasonlításának eredménye 100% 90% szint(2380) term(3031) szint(kezzel) szint(geppel) 7% % 19% tesztelık eloszlása 80% 70% 60% 50% 0% 30% 20% 10% 96% 33% 52% 8% 1% 8% 26% 26% 1. jobb egyforma 2. jobb 0% term(eredeti) term(2380) term(2380) szint(profivox)

Kísérletek eredménye - 2006 Az eredeti változat jobb, mint a módosított Különbözı referenciával módosított változatok között hallható a különbség, minıségük hasonló sikerült elérni a prozódiai változatosságot #2031-es mondatváltozatok összehasonlításának eredménye 100% 90% szint(2380) term(3031) szint(kezzel) szint(geppel) 7% % 19% tesztelık eloszlása 80% 70% 60% 50% 0% 30% 20% 10% 96% 33% 52% 8% 1% 8% 26% 26% 1. jobb egyforma 2. jobb 0% term(eredeti) term(2380) term(2380) szint(profivox)

Kísérletek eredménye - 2006 Az eredeti változat jobb, mint a módosított Különbözı referenciával módosított változatok között hallható a különbség, minıségük hasonló sikerült elérni a prozódiai változatosságot #2031-es mondatváltozatok összehasonlításának eredménye 100% 90% szint(2380) term(3031) szint(kezzel) szint(geppel) 7% % 19% tesztelık eloszlása 80% 70% 60% 50% 0% 30% 20% 10% 96% 33% 52% 8% 1% 8% 26% 26% 1. jobb egyforma 2. jobb 0% term(eredeti) term(2380) term(2380) szint(profivox)

Kísérletek eredménye - 2006 Az eredeti változat jobb, mint a módosított Különbözı referenciával módosított változatok között hallható a különbség, minıségük hasonló sikerült elérni a prozódiai változatosságot 50% szint(2380) term(3031) szint(kezzel) szint(geppel) 0% 30% 20% % 2% 10% 1% 0% Profivox szabály alapú egyforma Dallammásolt jobb term(eredeti) jobb term(2380) term(2380) szint(profivox)

Vizsgálatok, eredmények - 2007 Újabb meghallgatásos vizsgálatok weben 8 mondatpár összesen 19 tesztelı 21 tesztelı / mondatpár 60% 50% 0% 30% 20% 9% 10% 25% 26% 0% Profivox szabály alapú jobb egyforma Dallammásolt jobb

Vizsgálatok, eredmények - 2007 Újabb meghallgatásos vizsgálatok weben 8 mondatpár összesen 19 tesztelı 21 tesztelı / mondatpár 60% 60% 50% 50% 0% 30% 20% 10% 0% 0% % 25% 25% 26% 26% 1% Profivox szabály alapú jobb 2006 2007 egyforma 9% 9% 2% Dallammásolt jobb

Eredményeim összegzése Szakirodalom áttekintése (összesen 17 tétel, ebbıl 5 magyar, 12 angol) Adatbázisok megismerése, címkézési munka végzése Mondatdallamok összehasonlítása idıvetemítéssel Mondatok dallamának cseréje Meghallgatásos vizsgálat 26 tesztelıvel Bebizonyosodott, hogy a prozódiai változatosság megvalósítható Nagyobb adatbázis, algoritmusok javítása Újabb meghallgatásos vizsgálat 19 tesztelıvel Interspeech 2007 konferenciára beadott cikk

Továbbfejlesztési lehetıségek hasonló mondatok keresése pontosabban nagyobb beszéd-adatbázis: NAVA (Nemzeti Audiovizuális Archívum) NDA (Nemzeti Digitális Adattár) prozódiai változatosságért felelıs modul beépítése a Profivox-ba

Bírálatra reagálva (1) Beszéddallam-adatbázis mérete: a vizsgálatok nagyon kis mérető adatbázisokon történtek, és nem világos, hogy mekkora nagy adatbázis lenne elégséges a módszer általánosításához Cél a koncepció ellenırzése volt -> kis adatbázis elég Pontosabb mérethez hosszabb kutatás szükséges Tárolás: megoldott (csak dallam- és idızítéscímke, hullámforma nem) Hosszabb szöveg szintetizálása -> elég néhány változatos mondat (pl. ismétlıdés helyett)

Bírálatra reagálva (2) Egy mondat különbözı dallamú változatai: a 7. táblázatból pont a legizgalmasabbnak tőnı kombinációk hiányoznak #3056-os mondat változatai 100% #3056 alapján #3373 alapján #3373 alapján 90% 80% 27% tesztelık eloszlása 70% 60% 7% 70% 50% 0% 30% 20% 13% 17% 10% 13% 13% 0% Profivox szabály alapú Profivox szabály alapú 36% 36% #3056 alapján 1. jobb egyforma 2. jobb

Köszönöm a figyelmet! Csapó Tamás Gábor csapszi@sch.bme.hu