BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA

Hasonló dokumentumok
A HANGOK TANÁTÓL A BESZÉDTECHNOLÓGIÁIG. Gósy Mária. MTA Nyelvtudományi Intézet, Kempelen Farkas Beszédkutató Laboratórium

Mély neuronhálók alkalmazása és optimalizálása

2006. szeptember 28. A BESZÉDPERCEPCI DPERCEPCIÓ. Fonetikai Osztály

Intelligens Rendszerek Elmélete. Versengéses és önszervező tanulás neurális hálózatokban

Gépi tanulás. Hány tanítómintára van szükség? VKH. Pataki Béla (Bolgár Bence)

Neurális hálózatok bemutató

Új típusú döntési fa építés és annak alkalmazása többtényezős döntés területén

A spontán beszéd kísérőjelenségei

A deixis megjelenési formái a prozódiában

Intelligens Rendszerek Gyakorlata. Neurális hálózatok I.

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

Support Vector Machines

Újfajta, automatikus, döntési fa alapú adatbányászati módszer idősorok osztályozására

Statisztikai eljárások a mintafelismerésben és a gépi tanulásban

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

IV.7 MÓDSZER KIDOLGOZÁSA FELHASZNÁLÓI ADATOK VÉDELMÉRE MOBIL ALKALMAZÁSOK ESETÉN

Gépi tanulás a gyakorlatban. Bevezetés

VIII. Magyar Számítógépes. Nyelvészeti Konferencia MSZNY Szerkesztette: Tanács Attila. Vincze Veronika

Gépi tanulás. Féligellenőrzött tanulás. Pataki Béla (Bolgár Bence)

Számítógép-rendszerek fontos jellemzői (Hardver és Szoftver):

Költségbecslési módszerek a szerszámgyártásban. Tartalom. CEE-Product Groups. Költségbecslés. A költségbecslés szerepe. Dr.

Beszédfeldolgozási zavarok és a tanulási nehézségek összefüggései. Gósy Mária MTA Nyelvtudományi Intézete

Hibrid előfeldolgozó algoritmusok morfológiailag komplex nyelvek és erőforrásszegény domainek hatékony feldolgozására Orosz György

Intelligens adatelemzés

A magánhangzó-formánsok és a szubglottális rezonanciák összefüggése a spontán beszédben

Funkcionális konnektivitás vizsgálata fmri adatok alapján

KOPI. Többnyelvű dokumentum nyelvének megállapítása MTA SZTAKI DSD. Vajna Miklós Pataki Máté MSZNY Department of Distributed Systems

Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017.

KÖZELÍTŐ INFERENCIA II.

Kísérlettervezés alapfogalmak

Rejtett Markov Modell

Teljesen elosztott adatbányászat pletyka algoritmusokkal. Jelasity Márk Ormándi Róbert, Hegedűs István

Deep Learning a gyakorlatban Python és LUA alapon. Beszédfelismerés (ASR)

Távérzékelés a precíziós gazdálkodás szolgálatában : látvány vagy tudomány. Verőné Dr. Wojtaszek Malgorzata

AUTOMATIKUS ÉRZELEM-FELISMERÉS AKUSZTIKAI PARAMÉTEREK ALAPJÁN

A szupraszegmentális jellemzők szerepe és felhasználása a gépi beszédfelismerésben. Szaszák György

Statisztikai módszerek a skálafüggetlen hálózatok

TARTALOMJEGYZÉK. TARTALOMJEGYZÉK...vii ELŐSZÓ... xiii BEVEZETÉS A lágy számításról A könyv célkitűzése és felépítése...

Szerkesztők és szerzők:

Számítógépes képelemzés 7. előadás. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

[1000 ; 0] 7 [1000 ; 3000]

Fuzzy rendszerek és neurális hálózatok alkalmazása a diagnosztikában

SZTE Eötvös Loránd Kollégium. 2. Móra György: Információkinyerés természetes nyelvű szövegekből

A digitális korszak kihívásai és módszerei az egyetemi oktatásban

KÖZELÍTŐ INFERENCIA II.

Óvodás és kisiskolás gyermekek interpretált beszédének vizsgálata

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

Tanulás tanuló gépek tanuló algoritmusok mesterséges neurális hálózatok

Beszédkutatás a technológiai fejlődés tükrében. Gráczi Tekla Etelka MTA Nyelvtudományi Intézet, Fonetikai osztály

Szegmentálási egységek összehasonlítása gépi érzelem felismerés esetén

1. gyakorlat. Mesterséges Intelligencia 2.

Beszédtechnológia az információs esélyegyenlőség szolgálatában

A spontán beszéd egyes jellemzői különböző felnőtt korcsoportokban

Etológia Emelt A viselkedés mérése. Miklósi Ádám egyetemi tanár ELTE TTK Etológia Tanszék 2018

Elektronikus kommunikáció jelentősége a fiatalok baráti kapcsolataiban

ESZKÖZTÁMOGATÁS A TESZTELÉSBEN

A beszéd. Segédlet a Kommunikáció-akusztika tanulásához

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Szupraszegmentális szerkezet

Eredmények kiértékelése

Mesterséges neurális hálózatok II. - A felügyelt tanítás paraméterei, gyorsító megoldásai - Versengéses tanulás

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Gépi tanulás a Rapidminer programmal. Stubendek Attila

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Modell alapú tesztelés mobil környezetben

Markov modellek

Neurális hálózatok.... a gyakorlatban

Jelnyelvi alapismeretek

Intelligens Rendszerek Elmélete. Párhuzamos keresés genetikus algoritmusokkal. A genetikus algoritmus működése. Az élet információ tárolói

Takács Árpád K+F irányok

a munkaerőpiac számos szegmensében egyaránt szükségszerű a használata (Szabó

Beszédhiba és beszédfeldolgozás

A napsugárzás mérések szerepe a napenergia előrejelzésében

ProSeniis projekt. Monos János GE Healthcare

Mérési struktúrák

Környezeti informatika

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2007/2008

Bevezetés a nyelvtudományba. 2. Fonetika

Numerikus matematika. Irodalom: Stoyan Gisbert, Numerikus matematika mérnököknek és programozóknak, Typotex, Lebegőpontos számok

A BLOWER DOOR mérés. VARGA ÁDÁM ÉMI Nonprofit Kft. Budapest, október 27. ÉMI Nonprofit Kft.

MULTIPARAMETRIKUS MR VIZSGÁLATOK SZEGMENTÁLÁSA NYAKI RÉGIÓBAN

Gépi tanulás és Mintafelismerés

Az alállomási kezelést támogató szakértői funkciók

Gépi tanulás a gyakorlatban. Lineáris regresszió

A szóhasonlóság mértékének tesztelése CVCVC szerkezetű hangkivető főnevekkel. Rung András BME Fizikai Intézet

Tartalomjegyzék. Rövidítések jegyzéke... EMBER, NYELV, BESZÉD. 1. A beszéd és az információs társadalom... 3

brandetect riport Megfigyelt logók: Újpest FC FTC 1.félidő 0:00-15:

Kódverifikáció gépi tanulással

A fonetik ar ol altal aban szeptember 15.

A kockázat fogalma. A kockázat fogalma. Fejezetek a környezeti kockázatok menedzsmentjéből 2 Bezegh András

RÁDIÓSZONDÁS MÉRÉSEKEN ALAPULÓ MÓDSZEREK A FELHŐALAP ÉS A FELHŐBORÍTOTTSÁG MEGHATÁROZÁSÁRA

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

A horizontális tanulás eredményei

Mérhető a védőnői munka objektíven? A védőnői munka értékelése kontrolling módszertannal.

andrás

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Átírás:

BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA

BESZÉDTUDOMÁNY Az emberi kommunikáció egyik leggyakrabban használt eszköze a nyelv. A nyelv hangzó változta, a beszéd a nyelvi kommunikáció legtermészetesebb és legtöbbet használt formája. A beszédtudomány vizsgálati tárgya maga a beszéd. A beszédtudomány interdiszciplináris tudomány.

HATÁRTUDOMÁNYOK

BESZÉDTUDOMÁNY FEJLŐDÉSE A három forradalom: 1. A beszéd láthatóvá tétele (20. század közepe) 2. A számítógép lehetőségei (20. század nyolcvanas éveitől) 3. A nagy adatbázisok fejlesztésének lehetősége (napjainkban) ÚJ ESZKÖZÖK MEGJELENÉSE (TANULÓ ALGORITMUSOK)

TANULÓ ALGORITMUS A számítógépes tudományok egy ága, amely az intelligens viselkedés automatizálásával foglalkozik (Luger 1993) Annak tanulmányozása, hogy hogyan lehet a számítógéppel olyan dolgokat művelni, amiben pillanatnyilag az emberek a jobbak (Rich 1991)

SZABÁLY ALAPÚ RENDSZEREK VS. GÉPI TANULÁS Szabály alapú rendszer: a terület szakértője manuálisan állít elő döntési szabályokat. Gépi tanulás: a szakértő példákat mutat a gépnek, és a gép azok alapján automatikusan állítja elő a döntési szabályokat.

A GÉPI TANULÁS BLOKKDIAGRAMJA A BESZÉDRE TANÍTÁS Modellek kialakítása Jellemzőkinyerés TESZTELÉS Mintaillesztés DÖNTÉS

PÉLDA A GÉPI TANULÁSRA

GÉPI TANULÁS A BESZÉDTUDOMÁNYBAN Beszédtechnológia Szia! Köszönöm, jól. Klinikai fonetika Kriminalisztikai fonetika

AZ ISMÉTLÉSEK GÉPI OSZTÁLYOZÁSA SPONTÁN BESZÉDBEN Az ismétlés során a beszédészlelés számára azonos fonémasorok hangzanak el. A beszélő ugyanazt a lexikai egységet ismétli meg nagyon rövid időn belül, az első és a második kimondás akusztikai vetülete mégis különböző lehet (Benkenstein Simpson 2003). h o gy 186 ms h o gy

AZ ISMÉTLÉSEK GÉPI OSZTÁLYOZÁSA SPONTÁN BESZÉDBEN szósorozat amíg amíg még beszédjel jellemzőkinyerés jellemzővektorok hasonlóság mérése osztályozás ismétlés nem ismétlés Az ismétléseket közel 88%-os helyes arányban tudtuk osztályozni tanuló algoritmussal magyar spontán beszédben.

NAGYOTHALLÓK BESZÉDÉNEK AUTOMATIKUS OSZTÁLYOZÁSA Automatikus osztályozás az alapfrekvencia alapján Az alapfrekvencia a fonetikai kutatások alapján nagyobb mértékben ingadozik a nagyothalló gyermekeknél, mint az ép hallóknál. Gépi tanulással a nagyothalló és az ép halló gyermekek 74%-ban osztályozhatók helyesen a beszédük alapján

BESZÉLŐSZEMÉLY-FELISMERÉS A BESZÉLŐ HANGJA A beszélő hangszínezetére különböző megnevezések léteznek: borízű, kellemes, érdes, lágy, sipító, fénytelen. Kérdés: a beszéd oly mértékben jellemző az emberre, hogy a beszéde alapján azonosítható a beszélő személy? Ujjlenyomat és hanglenyomat?

FONETIKAI CÉLOK A BESZÉLŐ SZEMÉLY AZONOSÍTÁSÁBAN Meg kell határozni azokat a tényezőket, amelyek: relatíve állandóak, illetőleg igen változékonyak a beszédben. Meg kell határozni a tényezők változékonyságának szintjeit és előfordulási valószínűségét.

EGY LEHETSÉGES MEGVALÓSÍTÁS

JELLEMZŐK Az akusztikai jellemzők igen sokfélék lehetnek A jellemzőkinyerés célja az, hogy megtaláljuk azon akusztikai jellemzőket, amelyek mentén az egyes beszélők elkülöníthetők, azaz beszélőszemély specifikusak. Az akusztikai jellemzőnek ugyanakkor egyszerűen mérhetőnek, minden beszélőnél jól mérhetőnek, érzelmi állapottól függetlennek kell lenniük. A legtöbbet használt akusztikai jellemző a hallást is modellező MFCC (Mel Frequency Cepstral Coefficients).

OSZTÁLYOZÓ ALGORITMUSOK GMM: kevert Gauss modell HMM: rejtett Markov modell ANN: Neurális hálózatok SVM: Szupport VEKTOR Gépek Döntési fák stb.

A GMM két okból használható a beszélő-felismeréshez. a GMM univerzális eloszlásbecslő, jól kezelhető, nem igényel komplex számítást, mégis pontosan lehet vele becsülni a függvény paramétereit. A függvény paramétereinek becslése alatt a haranggörbe (Gauss-görbe) paramétereinek becslését értjük. A tanítóminták alapján iteratív módon becslést végzünk a Gauss-görbe paramétereire; ezt a folyamatot nevezzük betanításnak. GMM

GMM-UBM Számos kutatás kimutatta, hogy a beszélőfelismerés eredménye jelentősen javítható, hogy ha a beszélő valószerűségi értékét normalizáljuk egy általános háttérmodellből származó valószerűségi értékkel (Higgins et al. 1991; Rosenberg et al. 1992; Reynolds 1995; Matsui Furui 1995; Reynolds 1997). A UBM egy nagy adatbázison tanított modell, amely a jellemzők beszélőfüggetlen eloszlását reprezentálja. A UBM létrehozásában azonban nincsenek egységes irányelvek, sem objektív mérőeszköz annak meghatározására, hogy hány beszélőre, és milyen hosszú beszédre tanítsuk a UBM-et.

Felismerés eredménye (%) EREDMÉNYEK 100 80 60 40 20 0 GMM-UBM GMM 8 16 32 64 128 256

ÖSSZEFOGLALÁS A beszédtudományban a gépi tanuló algoritmusok jól alkalmazhatók hipotézis vizsgálatokra, a fonetikai elemzések kibővítéseként.

Köszönöm a figyelmet!