Az ember-gép közötti párbeszéd megteremtésének egyik alapja a gépi beszéd felismerésének (Automatic Speech Recognition, ASR) megoldása.

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "Az ember-gép közötti párbeszéd megteremtésének egyik alapja a gépi beszéd felismerésének (Automatic Speech Recognition, ASR) megoldása."

Átírás

1 Az ember-gép közötti párbeszéd megteremtésének egyik alapja a gépi beszéd felismerésének (Automatic Speech Recognition, ASR) megoldása. A beszédfelismer rendszerek számos tudományterület eredményeit egyesítik magukban, ilyenek a statisztikus mintaillesztés, a kommunikációelmélet, a jelfeldolgozás, a kombinatorikus matematika, a nyelvészet és egyebek. Ennek megfelel en az egyes komponensek megismeréséhez széles kör ismeretek szükségesek. A mérés célja az, hogy betekintést nyújtson a beszédfelismerési alkalmazások tervezési folyamatába. A f feladat egy magyar számok felismerésére alkalmas folyamatos beszédfelismer rendszer tervezése, majd el re el készített elemek segítségével megvalósítása, végül pedig tesztelése és a kapott eredmények értékelése. A silabusz 2. fejezete tartalmazza a gyakorlat során használt beszédfelismer rendszer m ködésének rövid leírását, így ennek elolvasása kötelez, a gyakorlat elején ebb l az anyagból írásban kérdéseket teszünk fel ( beugró ). A 3. fejezet tartalmazza a feladatok leírását, a 4. rész pedig a beszédfelismerés elméletér l és gyakorlatáról szól, ennek elolvasása ajánlott. A gyakorlat során csoportonként egy jegyz könyv készül, melyben a gyakorlat során elvégzend feladatok eredményei és a hozzájuk f zött magyarázat kell, hogy szerepeljen. 2

2 A gyakorlat során a TMIT Beszédakusztikai Laboratóriumában fejlesztett Magyar Középszótáras Beszéd-Felismer rendszert fogjuk használni. A laborban az utóbbi években kifejlesztésre került MKBF egy fonéma alapú, Rejtett Markov Modell alapján m köd, statisztikai elvi alapokra épül, folyamatos beszédfelismer amely alkalmas különböz középszótáras ( különböz szóból álló) szövegek betanítására és felismerésére. A rendszer öt, jól elkülöníthet modulból áll (1. ábra): akusztikai el feldolgozás (lényegkiemelés) (a) akusztikai (statisztikai; HMM alapú) modellépítés (b) lexikon (c) nyelvtani (statisztikai; fonetikai, fonológiai és szószint ) modellépítés (d) dekóder (e) 1. ábra: az MKBF felépítése 3

3 2.1. Akusztikai el feldolgozás A beszédfeldolgozást gépi úton megvalósító eljárások közös tulajdonsága, hogy lényegkiemelést és osztályozást hajtanak végre. A felismerend szimbólumok például fonémák száma mindig véges, azonban azok végtelen sok alakzat (id függvény) formájában nyilvánulhatnak meg. A felismerés lényege az, hogy a végtelen változatosságú, folytonos beszédjel bizonyos mérhet jellemz i alapján becslést teszünk arra, hogy a közölhet diszkrét szimbólumok közül melyiknek megfelel információt hordozza a kérdéses beszédjelszakasz. Ennek megfelel en például a gépi felismerésben a felismerend alakzatot el ször mérhet paraméterekkel jellemezzük. Mivel ez az el feldolgozás törekszik arra, hogy a felismerés szempontjából minél hatékonyabb paramétereket eredményezzen, lényegkiemelésnek nevezzük. A lényegkiemelés akkor jó, ha a különböz szimbólumokhoz tartozó alakzatok mért paraméterei egymástól jól elkülöníthet k, azaz ha különböz osztályokba esnek. Alapvet lényegkiemelési eszközök a megfelel színképelemzés, a beszédjel/beszédszünet detektálása, a zöngés/zöngétlen detektálás, valamint az alapfrekvencia meghatározása. Az akusztikai el feldolgozásra különböz rendszerek különböz megközelítéseket használnak, de közös bennük, hogy a beszédjelb l a felismerés számára fontos, számítógéppel feldolgozható adatokat állítanak el. A beszédkutatók jelent s eredményeket értek el a beszédkelt és beszédfelfogó szervek m ködtetésének feltárásában, és elkészítették ezek matematikai modelljét. Ezeken a modelleken alapulnak a jelfeldolgozás alapvet lépései. Az MKBF el feldolgozó (lényegkiemel ) modulja egy zajcsökkent algoritmus után egy DBFFT (Derivated Bark Filterbank Frequency Transformation) transzformációt hajt végre: el ször 17 bark-frekvenciasávra bontja a bemeneti beszédjel diszkrét reprezentációjának a vizsgált id keretbe (jellemz en 10 ms) tartozó részét. A bark-sávok az emberi hallás m ködésére jellemz, adott frekvenciasávok. Az el feldolgozó egység ezt követ en kiszámítja ezen értékek átlagának frekvenciatérbeli deriváltját (tehát azt, hogy az egyes sávokban mért átlagintenzitás mennyit változik az el z bark-sávban mérthez képest). Végül képzi az egymás utáni kereteket figyelembe vége az így kapott 17 elem vektorok id beli, els és második deriváltját (delta és delta-delta paraméterek). Ezzel kaptunk egy keretenként 51 számból álló vektort, ami a kés bbiekben a statisztikai akusztikai modellépítés és a felismerés (dekódolás) alapja lesz; innent l kezdve így reprezentáljuk a beszédjel minden akusztikai el fordulását. 4

4 2.2. Akusztikai modellépítés Miután a lényegkiemeléssel megválasztottuk, hogy mi az er sen redundáns beszédjelb l a nekünk hasznos információ, a feladat az, hogy a kés bbiekben bejöv, felismerend beszédjel id kereteit osztályokba sorolhassuk, osztályozzuk. Az osztályok esetünkben nyilván a felismerend szimbólumoknak, például a fonémáknak felelhetnek meg. Az els modulban, a lényegkiemelésben felhasznált jellemz ket tapasztalat alapján választottuk ki (esetünkben ezek a derivált bark-sávos sz r sor kimenetén kapott jellemz k). Az emberi beszéd biológiai folyamat eredménye, és mint ilyen, jelent s nemdeterminisztikus összetev je van. A gyakorlatban emiatt sem sikerülhet olyan jellemz ket találni, amelyek alapján a felismerés teljes biztonsággal (100%) elvégezhet. A beszédfelismer, mint osztályozó algoritmus feladata ezért az, hogy a felismerést ezen (nem dönt erej ) paraméterek birtokában is minél megbízhatóbban hajtsa végre. Ezért kulcskérdés az osztályhatárok kijelölése, ezt nevezzük akusztikai modellépítésnek. Az akusztikai modellépítés tehát a statisztikai alapon m köd beszédefelismer rendszerek betanítása egy gondosan kiválasztott, szegmentált (ld.: 4.2. fejezet) és el feldolgozott beszédjellel. Az MKBF rendszer akusztikai-fonetikai modellje fonémamodellek készlete, amelyet nagymennyiség beszéd adattal tanítanak be. A felismer egy statisztikai alapon m köd, rejtett markov modell (Hidden Markov Model, HMM) alapú rendszer 2.3. Lexikon A felismer a hasonulást és egyéb fonológiai jelenségeket figyelembe véve fonetikusan, kiejtés szerinti alakban kezeli a nyelvtanában el forduló szavakat (például: leírva: azt, kiejtve: aszt, fonetikusan átírva: O s t), azonban a felismert, írott szövegkimeneten már a magyar helyesírás szabályai szerint, az írásban megengedett szimbólumokat szeretnénk látni. A lexikon a fonéma-láncok helyesen írott szavakká történ átalakításához szükséges, ezért tartalmazza a nyelvtani modell alapján megengedett összes szót (mivel a magyar ragozó nyelv, esetünkben szóalakot), és annak kiejtett és fonetikusan átírt változatát Nyelvtani modellépítés Egy kimondott szó önálló felismeréséhez (tehát csak az akusztikai-fonetikai szintet használva) egy nyelv szavainak körülbelül 70 %-a alkalmas. Miután az emberi beszédészlelés ennél lényegesen jobb eredménnyel m ködik, nyilvánvaló, hogy a beszéd több, mint elemek egymásutánisága. A jobb felismeréshez szükség van az illet nyelv fonetikai, fonológiai, szintaktikai, lexikai szabályaira, melyet a nyelvtani betanításkor, egy nagyméret szöveges betanítóanyag egítségével nyerünk ki. Ennek a 5

5 szabályrendszernek egy leegyszer sített változata az MKBF-ben is alkalmazott unigram és bigram modell. Leírt alak Kiejtett alak SAMPA jelöléssel ( zárójel z A: r o: j E l ) zárójelbezárva z A: r o: j E l b E z A: r v O / per p E r a a O A á A: abba abba O b: O abbahagyta abbahagyta O b: O h\ O t' t O abbahagytuk abbahagytuk O b: O h\ O t' t u k aborális aborális O b o r A: l i S aborálisan aborálisan O b o r A: l i S O n abszolút abszolút O p s o l u: t absztinencia absztinencia O p s t i n E n ts i j O absztinens absztinens O p s t i n E n S accessoricus accesszórikus O ts: E s: o: r i k u S 3. ábra: részlet egy MKBF lexikonból biopszia: nem volt. anamnesis: acut recidiváló pancreatitis miatt kezeljük. _ fels panendoscopia: az eszközt akadálytalanul vezetem 4. ábra: részlet egy MKBF betanítószövegb l 6

6 Az unigram modell egy N hosszú vektor, melynek i-dik eleme az N elem (az összes el forduló szavat tartalmazó) szótár i-dik elemének el fordulási gyakorisága a nyelvtani betanító szövegben. A bigram valószín ségi mez szintén az el forduló szóalakokból épül fel. A bigram egy N N-es mátrix, melynek (i,j) eleme annak a gyakoriságát (valószín ségét) adja meg, hogy a betanítóanyagban a szótár i-dik szavát a szótár j-dik szava követi. Az MKBF nyelvtani betanításához olyan formátumra kell hozni a szöveget, hogy minden sorban egy (nyelvtani) felismerési egység szerepeljen. Speciális szimbólumok az aláhúzásjel ( _ ), illetve a space szimbólum, melyet használhatunk akkor, ha a szövegben két egymás után következ szó közötti átmenethez nem akarunk valószín séget hozzárendelni. A szavak végén alkalmazott írásjeleket a program nyelvtani része úgy kezeli, mint ha a vessz vagy pont el tt lév szó az azt követ írásjellel együtt egy új szót képezne (ld. 3. ábra), így bizonyos mértékben a mondattagolás is betanítható. Természetesen figyelembe lehetne venni a beszéd szupraszegmentális jegyeit (pl. prozódia) is a felismerés során, és ez alapján képezni a felismert szövegben az írásjeleket, ez a funkció jelenleg fejlesztés alatt áll Dekóder Az MKBF dekóder az akusztikai-fonetikai és a nyelvtani modell valószín ségei alapján eldönti, hogy a beérkezett beszédjelb l keretenként képzett vektor milyen fonémaosztályba sorolható. A dekóder az akusztikai-fonetikai és nyelvtani döntéseket párhuzamosan hozza meg, és a programban paraméteresen állítható, hogy ezen döntések a végs döntést (tehát hogy mi legyen a kimenet) milyen súllyal befolyásolják. A dekóder tulajdonképen egy keres algoritmus a kimondott kifejezés és a szóba jöhet szóláncok legjobb illesztésére, tehát a felismerés során minden újabb beérkez keretr l eldöntend, hogy még az el z fonéma része, vagy egy új fonéma kezdete, és amennyiben az, az eddigi nagy valószín séggel felismert fonémákkal együtt milyen szavakat alkothat. Ez a folyamat egy gráfban (szó-fában) történ állandó keresést eredményez, ahol csomópontok a fonémák, az irányított élek pedig a nyelvtani betanítás (unigram és bigram) szerint súlyozott valószín ségek, melyekhez megfelel súllyal hozzá kell adni annak a valószín ségét, hogy az aktuális beszédjel-keret az adott akusztikai-fonetikai modellhez tartozik. Az MKBF egy valós idej beszédfelismer program, így a gyakorlat során megfigyelhet lesz a fent leírt keresési folyamat jellegzetes m ködése; az írott kimenet utolsó néhány szava ugyanis egy-egy újabb felismert szó függvényében visszamen leg is változik, tehát minden id pillanatban az éppen legvalószín bb szó-fa útvonalból képzett szóláncolatot láthatjuk. 7

7 A feladat az, hogy képessé tgyük az MKBF-et 0-tól 100-ig (-1000-ig, ig) az összes lehetséges magyar nyelven mondott egész szám felismerésére. A feladat ezen belül a felismer nyelvtani modelljének felépítése ehhez a speciális beszédfelismerési alkalmazáshoz. Az MKBF el feldolgozó és és dekódoló egysége tehát változatlan marad, a felismer akusztikai fonéma-modelljét pedig már korábban felépítettük a Magyar Referencia Beszéd-Adatbázis (MRBA) szegmentált hanganyagának segítségével, külön férfi és n i modellekkel (*.hmm kiterjesztés fájlok). A nyelvtani modellt egy betanító szövegb l nyerjük ki, a szöveget úgy kell megalkotni, hogy az ezzel betanított MKBF az adott feladatnál specifikált beszédfelismerési feladatot elláthassa. A program nyelvi modelljét a *.m_bgr kiterjesztés fájlok képviselik, ezeket a nyelvi modellépítést reprezentáló _TXT2BGR.exe program segítségével lehet el állítani a megfelel formátumú nyelvtani betanító szövegb l, egy üres kiinduló bigram-táblából (úgynevezett null-bigram, null.m_bgr), valamint egy liírt és kimondott szóalakokat tartalmazó szótárfájlból (jelenleg szimbólummal elválasztott *.csv kiterjesztés fájlokat használunk). A formátum-átalakítások és a nyelvtani betanítás sok id t is igénybe vehet, ezért a gyakorlat során el re elkészített nyelvtani modelleket is használunk (a nagyobb szövegekhez). A feladatok megoldásához rendelkezésre állnak a következ segédprogramok: szamgenerator.exe: képes a magyar nyelvben el forduló valamennyi számalak el állítására tetsz leges intervallumban és kombinációban. Lehet ség van különböz felismerési egységek (szót, szó, több szó egyben) megadására, valamint helyiérték-kötött vagy helyiértékekt l független számábrázolásra. Kijelzi a szótár és a betanítóanyag méretét, lehet vele bigram és unigram betanítóanyagokat is el állítani. Használata: GUI phonetisator.exe: SAMPA fonetikus átírást hoz létre a szöveges bemenetb l, figyelembe véve a magyar nyelv hasonulásainak teljes szabályrendszerét. Használata: GUI (ebben az esetben az [a] mappa tartalmába kell helyezni a szöveges bemenetet, és a program indítása után a make all nyomógombra kell kattintani), vagy: phonetisator.exe [bemenet.txt] [kimenet.dat] txt2csv.exe: a szamgenerátor által létrehozott szöveges fájlból és ennek SAMPA átiratából állít el egy *.csv kiterjesztés szótár-fájlt. Használata: txt2csv.exe [bemenet1.txt] [bemenet2.dat] [kimenet.csv] txt2bgr.exe: az el z programok kimeneteib l el állítja a bigram vagy unigram nyelvtani modellt. Használata: txt2bgr.exe null.m_bgr [bemenet1.txt] [kimenet.m_bgr] [bemenet2.csv] A beszédfelismer [BGR] mappábájába kell helyezni az el állított, egymáshoz tartozó (ugyanúgy elnevezett) *.m_bgr *.csv párokat. A felismer gyökérkönyvtárában található három users* elnevezés fájl közül az els ben soroljuk fel (ABC sorrendben!) 8

8 az egyes felhasznók megjelenített neveit, a másodikban (sorrendben) a felhasználókhoz tartozó nyelvtani modell-neveket (a [BGR] mappa tartalma, fájlkiterjesztés nélkül), a harmadikan pedig rendre a felhasználókhoz tartozó akusztikai fonémamodell-készletet (a [HMM] mappa tartalma). A beszédfelismer t a bszgy.exe-vel indíthatjuk el, majd a felhasználó (esetünkben a nyelvtani modell) kiválasztása és a mikrofon jelszintjének beállítása után a Felismerés nyomógomb hatására a program elkezdi megfigyelni a számítógép aktuálisan kijelölt hang-bemenetét. Amennyiben egy el re felvett anyaggal akarjuk lefuttatni az MKBF-et, a hangbemenetet (Hanger / Speciális / Felvételhez / ) Stereo Mix -re (egyes hangkártyákon What You hear ) kell állítani. Ha viszont él beszédet akarunk felismerni, válasszuk ki a mikrofon-bemenetet. Az utóbbi esetben célszer a gyakorlaton használt mikorofont még a Felismerés gombra való kattintás el tt bekapcsolni, hogy a bekapcsolással járó zörej ne befolyásolja a beszédfelismerés eredményét. A Lelet vége gomb megnyomása után a felismerés abbamarad, a Felismerés gomb ismételt megnyomásával pedig az eddig felismert szöveg törl dik, ezért ez el tt mindenképpen mentsük el az eddigi eredményt (pl a Vágólapra gomb segítségével). 5. ábra: Az MKBF program felülete 9

9 1. feladat: - Mi legyen a felismerés tárgya (pl. telefonszámokat, évszámokat stb.)? - Mi legyen a felismerés nyelvtani egysége (számok, szavak, szótövek stb.)? - Milyen szóelemekb l épüljön fel a számfelismer szótárkészlete? Készítsen listát a lehetséges szóelemekr l! 2. feladat: - Dolgozzon ki egy tesztet, amit a kés bbiekben elkészül beszédfelismer rendszerek min sítésére alkalmazhat! Rögzítse teszt-bemondás hanganyagát! A kiértékelés egysége legyen: {helyesen felismert egységek száma} / {összes felismerend egység száma}! A következ feladatoknál rendre számítsa ki ezt a paramétert! 3. feladat: - Tanítsa be a beszédfelismer t csak unigramot tartalmazó nyelvtani modellel! A betanítóanyagot megkaphatjuk az 1. feladatban elkészített lista alapján, a lexikonfájlt szükség esetén módosítsa! - Tesztelje az így kapott felismer rendszert! 4. feladat: - Tanítsa be beszédfelismer t az egymást követ szóátmenet-valószín ségekkel kib vített bigramot tartalmazó nyelvtani modellel (ehhez a betanítóanyagot a rendelkezésre bocsájtott programok segítségével állíthatjuk el )! - Tesztelje az így kapott felismer rendszert! 5. feladat: - Tanítsa be beszédfelismer t a helyiértékek szerinti sorba-rendezéssel kib vített bigramot tartalmazó nyelvtani modellel! - Tesztelje az így kapott felismer rendszert! 6. feladat: - Hasonlítsa össze a 3., 4. és 5. feladat teszteredményeit! - Ismételje meg a feladatokat más felismerési egységekkel! 7. feladat: - fakultatív: egy diplomázó diákunk által készített népdal-felismer rendszer kipróbálása, IKTA2004 orvosi leletez program kipróbálása 10

10 4.1. Az emberi beszéd A beszédfolyamat akusztikai jellemz i A beszéd variáltsága Beszél n belüli variálhatóság Beszél k közötti variáltság A beszédészlelési folyamat m ködése Akusztikai szint Fonetikai szint döntések Fonológiai szint döntések A gépi beszédfelismerés fejl dése A kezdet: az egyszer mintaillesztéses eljárások Betanított eljárások Adatbázisok jelent sége HMM ANN Összegzés Jelfeldolgozási módszerek a beszédfelismerésben Normálás Lényeges információ kisz rése Tulajdonságvektor el állítása Mintaillesztés Templétbázisú mintaillesztés Dinamikus Id vetemítés Statisztikus mintaillesztési módszerek Rejtett Markov-modell Szegmentálás Izoláltszavas beszédfelismerés HMM-alapú mintaillesztéssel Nyelvi modell integrálása Az emberi beszéd A beszédfolyamat akusztikai jellemz i A beszéd nyelvi jelentéssel bíró akusztikai produktum, számos nem nyelvi jelentést hordozó információval. Az érzelmek (harag, izgalom, öröm, panasz, csodálkozás, gyengédség, ijedtség, stb.) például jelent sen befolyásolják a hang fizikai paramétereit. A beszéd igen er sen redundáns, az információt több síkon hordozza: Beszédhang szint leírás szegmentális szerkezet Szó, mondat szint leirás szupraszegmentális szerkezet 11

11 A beszéd alapvet en mint minden biológiai folyamat rendelkezik egy jelent s nemdeterminisztikus, el re meg nem határozható módon változó összetev vel. Tudjuk azonban azt is, hogy valamilyen szinten mégis lehetséges a beszéd felismerése (akár emberi, akár gépi felismerésr l van szó), ami azt mutatja, hogy a beszédnek van egy el re meghatározható összetev je is. A beszédképzés során az artikuláció nagymértékben meghatározza a keletkezett színképet, vagyis egy konkrét hangképzési mód vagy hely meghatározott színképet eredményez A beszéd variáltsága A beszédet leíró paraméterek számos hatás következtében megváltozhatnak, variáltságuknak számos forrása van, amelyek a felismerést megnehezítik. Ezek a források lehetnek például a hangképz szervek biológiai tulajdonságai (személyenként változnak a hangképz szervek méretei, így azt általuk létrehozott fizikai produktum is változik). A hangképzés folyamatosan változó mozgások összessége, emiatt az egyik hang fizikai tulajdonságai befolyásolják az azt megel z és követ hangok fizikai tulajdonságait. Ezt nevezik koartikulációs hatásnak. A fizikai paraméterek variáltságát okozhatják a környezeti, akusztikai körülmények. Ilyenek például a zajos vagy zajtalan környezet, visszhangok, termek, telefonbeszéd stb. A variáltságot okozó tényez k számos módon csoportosíthatók, mégis talán a beszél kön belüli, és a beszél k közötti variáltság szerinti csoportosítás illik a legjobban a felismer k m ködési tulajdonságaihoz Beszél n belüli variálhatóság Az emberi beszéd beszél n belüli variáltságának okai a már említett koarticuláció, a ritmus, hanger, hangmagasság, hanglejtés, valamit a nyomatékbeli különbségek. A megfázás például igen nagymértékben megváltoztatja a hangok akusztikai paramétereit, környezeti hatások, izgalom, meglepetés stb. szintén er sen befolyásolják a létrehozott beszéd akusztikai tulajdonságait Beszél k közötti variáltság Az akusztikai paraméterek jelent s variáltságát okozzák a biológiai tényez k, így például a beszédképz szervek méretkülönbsége, ami n i, férfi, gyermekhangok esetében, de egy-egy csoporton belül is variáltságot hoz létrea beszél k között. A környezeti hatásokat két csoportra bonthatjuk: a statikus (teremakusztikai hatások, utózengési id, rögzít berendezések, stb.) és dinamikus (zaj, mikrofon pozíció stb.) hatások egyaránt er sen befolyásolják a beszéd akusztikai paramétereit. 12

12 Végül, de nem utolsó sorban a nyelvi különböz ségek is forrásai a beszéd variáltságának A beszédészlelési folyamat m ködése Az emberi beszédészlelési folyamat (Human Speech Perception, HSP) leírásakor sokszor használnak egy hierarchikus modellt, amely a következ szintekre bontja a beszédészlelés folyamatát: Akusztikai szint A beszédészlelés akusztikai szintjén a fizikai és a pszichikai (érzékelt) mennyiségek megfeleltetése történik, úgyis mint: energia hangosság, frekvencia hangmagasság színkép hangszín Ezek a megfeleltetések természetesen nem lineáris, még csak nem is függvénnyel explicit módon kifejezhet összefüggéseket takarnak, gondoljunk csak az egyenl hangosságszint-görbékre, vagy a különböz id - és frekvenciabeli elfedési jelenségekre Fonetikai szint döntések A fonetikai szinten az akusztikai szint kimenetének segítségével történik egy döntés, melynek végeredménye egy elemi beszédjel, vagyis fonéma. A színkép alapján például a következ paramétereket határozhatjuk meg: a magánhangzók hangmagasságérzetét az F 2 formáns határozza meg, a beszédhang típusáról az F 1 és F 2, formánsok alapján döntünk, az F 3 pedig inkább a beszél re jellemz. Az id tartam észlelése szintén fonetikai döntések alapja: a réshangok id tartam csökkentése (pl. CV kapcsolatban) azonos képzési helyen képzett affrikáták, majd zárhangok érzetét keltik (ld.: 6. ábra). 13

13 6. ábra A folyamatos beszédb l az egyes fonémák határainak kijelölését szegmentálásnak hívjuk. A szegmentálás nyelvspecifikus, m ködését befolyásolja a beszédészlelés és a beszéd megértésének funkciója is, készsége az anyanyelv elsajátítása során fejl dik ki Fonológiai szint döntések A fonológia a beszédhangokat funkciójuk (jelentésmegkülönböztet és érzelemkifejez szerepük) szempontjából vizsgálja. Például a következ mondat jelentését: Éva bátyja allergiás lett a [me:st2:l]. csak egy utólagos értelmezés határozza meg (gy.k. hogy mézr l vagy mészr l van-e szó) A gépi beszédfelismerés fejl dése A gépi beszédfelismerés feladata folyamatos változásból kvantált min ségi jellemz k elkülönítése és azonosítása. Amikor ezt a feladatot akarjuk megoldani, a következ problémákkal találkozunk: A beszédben nincsenek olyan határozottan szétválasztható jellegek, mint az írásban, a beszédjel a jelentést részben akusztikus, részben nyelvi szinten hordozza. 14

14 A már említett beszél n belüli és beszél k közötti variáltság miatt egy beszédfolyamat végtelenül sok akusztikai format ölthet, ez sem könnyíti meg a dolgunkat. De itt vannak még például a finom hangsúly, a dallam, a szünetek, a ritmus, a tempóváltások is, melyek szintén a felismerend üzenet lényegi elemei. Ezek is az értelmezést segítik, a közlend t árnyalják, a beszédet emberivé, széppé teszik, tehát ha a beszéd üzenetét kívánjuk felismerni ezek sem hagyhatók a folyamatból el. A problémák megoldására sokféle ötlet és érdekes megoldás született, különböz eredményekkel. A gépi beszéd és beszél felismerési eljárások lényegében két jól elkülöníthet elméleti alapra épülnek. Az egyik a szabálybázisú megközelítés (kognitív módszer), a másik a statisztikai elméleti alapú feldolgozás (információelméleti megközelítés). Szabálybázis alapon m ködnek a különböz szakért i rendszerek, statisztikai alapú feldolgozást használnak például a Rejtett Markov Modell ( Hidden Markov Modell: HMM ), vagy Neurális hálózatok (Neural Network NN) használatával megvalósuló felismer k. A mai beszédfeldolgozási tudásszinten a gyakorlatban megvalósuló sikeres beszél és beszédfelismer rendszerek statisztikai alapokon m ködnek, ezért a továbbiakban velük foglalkozunk: A kezdet: az egyszer mintaillesztéses eljárások A gépi beszédfelismerés látványos fejl désen ment keresztül az utóbbi évtizedekben. A 80-as évek elejéig túlnyomórészt csak néhány száz szavas személyfügg beszédfelismer k léteztek, melyeknek felismerési biztonsága is igen er sen ingadozott. A betanítási körülményekhez képest kis változás akár 20-30%-al is le tudta csökkenteni a felismerés biztonságát. Ezeknek a rendszereknek az alapja az úgynevezett mintaillesztési eljárás volt. Éppen ezért is reagáltak igen er sen az akusztikai körülmények kisebb változásaira is Betanított eljárások A beszéd természetére jellemz a fizikai paraméterek nagymérték variáltsága beszél k között, egy beszél n belül, továbbá az akusztikai környezet függvényében is. A beszéd statisztikai modelljének paraméterfelülete a beszéd nagyfokú variálhatóságát kell, hogy tükrözze, így sok dimenziójú kell legyen Adatbázisok jelent sége Egy pontos paraméterbecslési lépés végrehajtásához (betanítási lépés) nagyszámú minta alapján történ betanítás szükséges. E minták gy jteményei a szükséges jegyzetekkel, címkézésekkel és átírásokkal ellátva képezik az adatbázist. 15

15 Az adatbázisoknak tartalmazni kell azokat a megfigyeléseket, amelyek a paraméterbecsléshez szükségesek, tehát mindazokat a mintákat, amelyek egységesen lefedik a beszéd (és a környezeti zajok) variáltságát. Ha egy beszédhang nincs benne a betanításhoz használt adatbázisban, akkor azt a beszédhangot a gép értelemszer en soha nem fogja felismerni. Bár a számítástechnika fejl dése lehet vé tette a nagyobb komplexitású feladatok számítását is, a kapacitás korlátozottsága miatt a mai felismer ket csak egy meghatározott sz k felhasználási területre tudják tervezni. Ilyen például egy beszédfelismer, amely csak egy adott nyelven, telefonon keresztül bemondott számok, szavak felismerésére alkalmas, viszont nem ismer fel mondatokat. Egy másik példa a laborban fejlesztett orvosi (endoszkópos) leletez -beszédfelismer, melyet a labor során a hallgatók ki is próbálhatnak. Az un. diktáló rendszerek folyamatos beszédet képesek felismerni megadott nyelven, jól meghatározott témakörön belül, de kizárólag csak a felhasználó hangjára m ködnek elfogadható pontossággal. Ezek a felismer k csak csendes környezetben m ködnek jól. Azok a felismer k, amelyeket zajtalan környezetbe terveztek, nem m ködnek zajos körülmények között. Az utcazajban m köd felismer rosszul m ködik, ha személygépkocsiban kívánják használni. Vagyis csak azokat a mintákat képes felismerni, amelyeket el z leg már megtapasztalt, vagyis amelyre el z leg be lett tanítva. A betanítás adatbázisok segítségével hajtandó végre. Az utóbbi években ezért n tt meg az adatbázisok jelent sége, óriási pénzeket költ ma erre a világ. A soknyelv Európa igen nagy feladat el tt áll, hiszen minden nemzet a saját nyelvén akar bekapcsolódni a nemzetközi kommunikációba, tehát nyelvenként kell sokfajta feladatra alkalmas adatbázisokat létrehozni. A statisztikai felismer rendszerben egy véletlen folyamat (X) el állít egy diszkrét idej véletlen jelet (X n ), és meg kell becsülni azokat a paramétereket, amelyek a modellt jellemzik. A becslés pontossága arányos a rendelkezésre álló megvalósulások számával. Ha minden lehetséges realizáció rendelkezésünkre állna, akkor ismernénk az X véletlen folyamat együttes felületét. Ebben az esetben a modell teljesen pontos valódi paramétereit becsüljük meg. Megjegyzend azonban, hogy nincs értelme ugyanazon folyamat realizációit hosszú ideig gy jteni. Lényegében haszontalan ugyanazon beszél hangjának többszöri rögzítése, vagy több felvétel készítése, mint amennyi az együttes felület lefedéséhez szükséges. Ma már kísérleti tény, hogy 100 megfelel en kiválasztott beszél elégséges és hatékony egy beszél független betanításhoz. Tovább növelni számukat haszontalan, s t néha káros. A gyakorlatban az adatbázisok tervezésénél figyelembe kell venni, hogy az adatbázis létrehozása nem más, mint a véletlenszer folyamat egyes megvalósulásainak (realizációinak) összegy jtése. Bármelyik megvalósulás statisztikai tulajdonságai egybe esnek a folyamat sokfajta megvalósulásának együttes tulajdonságaival, egy adott id pillanatban (n). Jelöljük a beszédfolyamat együttes felületét {x(n, l)}-el! Itt n az id függést, l pedig a beszédfolyamat járulékos függéseit jelöli egyes speciális dimenzióktól,például amelyiket a beszél k kiejtésének azonosítására használunk. Az X beszédfolyamat együttes felületét befed adatbázis létrehozása megkívánja ezeknek a 16

16 különböz megvalósulásoknak az összegy jtését (x(n, l)), minden l járulékos függés esetében. Ez szükséges a megfelel en pontos becslés kialakításához. A fentiek alapján látható, hogy a paraméterbecslés pontossága, tehát a felismerés jósága lényegében a betanításhoz használt adatbázis jóságán múlik. Vagyis azon, hogy az adatbázis elemei helyesen legyenek kiválasztva, egy-egy elemb l megfelel darabszámú reprezentáns legyen, az elemek min sége megfeleljen az el írásoknak stb. Mind a HMM mind az NN alapú felismerés stacionárius folyamatok sorozataként tekinti a beszédet. Viszont a beszédképz szervünk folyamatosan állítja el a beszédet, a statisztikai tulajdonságok id függ k. A beszéd modellezhet, mint részeiben stacionárius folyamatok láncolata és HMM nagyon jól alkalmazható ilyen folyamatokra. Ez viszont megkívánja az adatbázis szegmentálását olyan hullámforma részekre, amelyeknek hasonlók a statisztikai tulajdonságaik. A HMM és NN felismerési algoritmusok egyaránt az adatbázis pontos fonetikai átírását igénylik HMM A statisztikai eljárások alkalmazása a beszédkutatásban robbanásszer fejl dést indított meg. A 70-es évek közepén az IBM-nél alkalmazták el ször sikerrel a rejtett Markov modell (HMM) elnevezés statisztikai eljárást, amely kisebb nagyobb változtatásokkal igen gyorsan elterjedt a beszédkutatók körében az egész világon. A 80-as évek végén már tömegesen mutatták be nagyobb kutatóhelyek, az angol, francia, olasz telefontársaságok a rejtett Markov modelleket használó, zajos körülmények között m köd, személyfüggetlen (el zetes betanítást nem igényl ), kisszótáras szavas beszédfelismer ket. Egy 1989-es konferencián állították ki el ször az IBM beszél adaptív (használat során a beszél höz illeszked ) nagyszótáras (1000-nél több szavas szótárkészlettel rendelkez ) diktáló rendszerét, melynél a szavak között szünetet kellett még tartani ANN A HMM módszer matematikai leírása korrekt, de nyilvánvalóak alkalmazásának korlátai is. Éppen ezért a kutatók figyelme a 80-as évek második felében a statisztikai eljárások egy másik csoportja, a neurális hálózatok (NN, ANN) alkalmazása felé fordult. A 90-es évek els felében azonban a neurális hálók betanítási nehézségei, a korrekt matematikai leírások hiánya a kutatók figyelmét újból a HMM módszer felé irányította, vagy a két statisztikai módszer hibridjét valósították meg Összegzés Az utóbbi évtizedek kutatásai és tapasztalatai alapján sokat tanultunk arról, hogy hogyan kell használható, praktikus felismer rendszereket írni, mégis messze vagyunk a 17

17 végs céltól, illetve folyamatosan tágul az elérend célok köre. Mindenesetre annak ellenére, hogy már kaphatóak az üzletekben beszédfelismerésen alapuló rendszerek, diktáló programok, még alapvet kérdésekben is sok feladat vár a kutatókra. A vezet kutatókat már rég nem a szépen kiejtett beszéd felismerése, hanem a természetes társalgási beszéd felismerése foglalkoztatja, amelynél el fordulnak különböz ejtési variációk, a szó, vagy mondat kétszeri indítása, fonémák elharapása stb. Sok megközelítés született a feladat különböz részeinek megoldására, melyek párhuzamosan fejl dnek, hisz egyel re nincs egyértelm en optimális megoldás. Bevált módszer a kutatásban, hogy vizsgáljuk az embernél az adott funkció m ködési mechanizmusát, és a kapott eredményeket felhasználjuk a technikai megoldásokban. Sajnos az emberi beszédfelismerés m ködési mechanizmusáról való ismereteink hézagosak: a periférikus hallásrendszer m ködésér l már elég sok információt gy jtöttünk össze, és ezt a tudást fel is használjuk az akusztikai el feldolgozásnál, de a további agyi feldolgozásról valójában még keveset tudunk Jelfeldolgozási módszerek a beszédfelismerésben Normálás A beszédfelismerés során nem a beszédhang abszolút tulajdonságai, mint magassága, ereje számítanak, hanem a hangok egymáshoz képesti relatív tulajdonságai. Izolált szavas felismerésnél például cél, hogy a szótárelemek és a felismerend szavak jobban összevethet k legyenek. Mi emberek megértjük, ha valaki lassabban vagy gyorsabban, hangosabban vagy halkabban beszél, s t még azt is, ha énekel. Ezen hatások némelyike jelfeldolgozási módszerekkel, a jelek normálásával kompenzálható Lényeges információ kisz rése A beszéd során egy véges értékkészlet jelsorozatot (pl. a bet k sorozatát) folyamatos id tartományi jellé alakítjuk, azonban ebben a jelben sok egyéb információ is kódolva van. Ilyenek a beszél személye, annak hangulata, s t a környez zajok is. A beszédfelismerés az inverz feladat, tehát ebb l a jelb l kinyerni a jelen feladat számára lényeges információt, azaz az elhangzott szöveget. Ennek alapjául szolgál a spektrumelemzés. További elemzések is végezhet ek a jelen, hogy értékes jellemz ket határozzunk meg, például az alapfrekvenciát vagy a formáns frekvenciákat. Jelenleg nem ismerünk olyan jellemz halmazt, ami egyértelm en jellemzi a beszédhangokat. S t, az egyes beszédhangok különböz reprezentációihoz tartozó tulajdonságvektorok által alkotott térrészek nem diszjunktak az eddig ismertetett paraméterek esetén. Az emberi fül sem tökéletes: rövid néhány hangból álló egységeket nehezen, néha hibásan értünk, mégsem jelent problémát a folyamatos szöveg megértése, mivel az agyban m köd komplex nyelvi feldolgozás korrigálja a hibákat. A cél tehát olyan jellemz k keresése, melyek minél hatékonyabb mintaillesztést tesznek 18

18 lehet vé. A korábban bemutatott spektrális jellemz k mellé a teljesség igénye nélkül felsorolunk még néhány jellemz t. Alapfrekvencia (pitch): formáns frekvenciák: a spektrumképen egyértelm en kiemelked frekvenciákat nevezzük formáns frekvenciáknak. A formánsstruktúra jellemz az egyes hangokra, azonban az értéke változik a beszél személye, a beszédtempó, és a környez hangok függvényében. Beszédjel beszédszünet: szavankénti felismerésnél a szóhatárok, folyamatos felismerésnél pedig a frázishatárok megállapítására szolgál. Legegyszer bben a jel energiájából határozható meg egy küszöbszint megadásával. A pontosságnak gátat szabnak a környezeti zajok, valamint a szavak elején és végén található szájzörejek. Zöngés zöngétlen részek elkülönítése is fontos jellemz lehet. Meghatározható a rövid idej energia függvényeként, ami kiemeli a nagy energiájú, többnyire zöngés részeket. Más módszer erre a nullátmenetek számolása, illetve az autókorrelációs függvény alkalmazása Tulajdonságvektor el állítása Miután a beszédjelet periodikusan felbontottuk egyenl méret (tipikusan ms), átlapolódó darabokra, majd minden ablakra kiszámítjuk a tulajdonságvektort, ami az el z fejezetben leírt tulajdonságok alapján jellemzi a beszédjel egy részét. A vektorban az egyes tulajdonságok adott id ablakra jellemz számértékei foglalnak helyet egymás alatt. Ez a vektorsorozat képezi a mintailleszt egység bemenetét. A paraméterek kiválasztása függ a feldolgozó rendszer képességeit l (sávszélesség, memória, sebesség), valamint a feladattól is. Minél komplexebb a feladat, annál pontosabb és komplexebb paraméterekre van szükség. Pl. beszéddetektor esetén akár egyetlen elem, az energia is elegend, de felismer kben tipikus a 20 elem kepsztrum, vagy Mel-kepsztrum vektor szükséges. Általában a parameter-vektorok mellett megadjuk azok változását (diszkrét deriváltját) is, ezek az úgynevezett delta (ritkábban: delta-delta) paraméterek. A mai hagyományos és célprocesszorokon sem jelent problémát a vektorok el állítása, a real-time jelfeldolgozás szempontjából a valós id töredéke, néhány százaléka szükséges csupán. A feldolgozási id nagyobb részét a következ szint, a mintaillesztés veszi el. Ezért is szükséges minél kompaktabb paraméterhalmaz el állítása. Amennyiben 20 ms-os ablakkal sé 22kHz-es mintavételi frekvenciával dolgozunk, akkor egyetlen keretben 440 beszédminta van, míg egy meghatározott frekvencia-sávonként számított spektrum-jellemz kb l (és ezek deriváltjaiból) álló tulajdonság-vektor a fentiek szerint kb. 60 elemet tartalmaz (MFCC-t, vagyis Mel-sz r bankos kepsztrális együtthatókat alkalmazva), ami jelent s adatmennyiség csökkenést is jelent. 19

19 Mintaillesztés A mintailleszt feladata a bemenetként kapott tulajdonságvektor-sorozat leképzése felismert szimbólumok nyelvi elemek sorozatává. A bementi jel tehát még akusztikus információkat tartalmazó folytonos jelfolyam, míg a kimenet a már sokkal absztraktabb nyelvi egységek diszkrét sorozata. Vagyis a kritikus lépés, az akusztikus/nyelvi konverzió azaz felismerés itt történik meg. A mintailleszt tehát a beszédfelismer k kulcsfontosságú része, ezért ez a témakör alaposabb tanulmányozást igényel. Történetileg az els módszer a templétbázisú mintaillesztés (pl. DTW Dynamic Time Warping, azaz dinamikus id vetemítés alapú eljárások). A korszer felismer k túlnyomó többsége azonban a másik, statisztikus (adatbázis alapú) típusú mintaillesztést (HMM és ANN) alkalmazza. A gyakorlatban a leghasználhatóbbnak a tisztán rejtett markovmodelles felismer k bizonyultak, a gyakorlat során is ilyen felismer vel kell majd megoldani a feladatokat Templétbázisú mintaillesztés A templét (vagy referencia) alapú mintaillesztés feladata, hogy el re tárolt mintákhoz hasonlítsa (illessze) a mért tulajdonság vektor-sorozat egyes elemeit. A beszédfelismer nek meg kell adni az összes felismerend szimbólumot, valamint az ezekhez tartozó jellemz vektorokat. A feladattól függ en egy vagy több embert l gy jtött minták átlagolásával áll el a referencia minta egy betanítási folyamat eredményeként. A szimbólumoktól és a felismer algoritmustól is függ, hogy egy referencia minta egy betanítási folyamat eredményeként. A szimbólumoktól és a felismer algoritmustól is függ, hogy egy referencia szimbólumhoz milyen hosszú vektorsorozat tartozik. Nyilván egy szóhoz tartozó referencia több vektort tartalmaz, mint egy hanghoz tartozó. Egy-egy szimbólumhoz akár több különböz referencia is megadható az esetleges nagy különbségek esetén, amennyiben a felismer algoritmus nem képes ezt kezelni. Például ugyanazt a hangot néha hosszabban máskor rövidebben ejtjük, ezt akár különböz referenciával is ábrázolhatjuk, ugyanígy kezelhet a tájszólás is. A mintailleszt a beérkez vektor-sorozat minden elemét sorban összehasonlítja az összes tárolt referenciával és meghatározza, hogy melyikt l milyen távol van. A vektoronkénti távolságszámításnak különböz módjai vannak. Alapvet és egyben a legelterjedtebb módszer a térben a legközelebbi elemre döntés. A távolságszámítást koordinátánkénti paramétersúlyozással lehet kombinálni, így optimális esetben jobb döntést kapunk, azonban nagyon nagy mennyiség mintára van szükség ennek a betanításához, így viszonylag ritkán alkalmazzák. Statisztikus módszerek esetén a jellemz vektoroknak statisztikus jellemz it (pl. átlagát, szórását) számítjuk ki, és ilyenkor valószín ségekkel dolgozunk, minden referencia teszt vektor összehasonlítás eredménye egy valószín ség, mely megadja, hogy az adott teszt vektor milyen valószín séggel tartozik az adott referenciához. 20

20 Mindkét esetben lehet ség van kiválasztani a legközelebbi, vagy legvalószín bb értéket, azonban tipikusan az els néhány legjobb jelöltet (hipotézist) is megadja a mintailleszt, hogy a következ szinten a nyelvi modul ezek közül válassza ki a megfelel t Dinamikus Id vetemítés A mintaillesztés egy klasszikus módszere a dinamikus id vetemítés. Ez a módszer kisszótáras, izolált szavas, beszél függ feladatoknál nyújt kézenfekv megoldást. Az els alapvet feladat két mintasorozat egymáshoz viszonyított távolságának meghatározása. Adott egy felismerend teszt mintasorozat és sok tárolt referencia sorozat. Meg kell mondani, hogy melyikhez illeszthet legjobban a teszt. Nagy valószín séggel a referenciák hossza különböz, és a teszt is különbözhet ezekt l, mivel ugyanazt a szót különböz sebességgel mondhatjuk ki. A teszt és a referencia mintákat azonban valahogy párba kell állítani a távolság méréséhez. Erre a legegyszer bb, bár önmagában nem használható módszer a lineáris id vetemítés. Egyszer en valamelyik id tengelyt a másikhoz nyújtjuk lineárisan. Az így párba állított minták távolságát összegezzük, és a legkisebb távolságra, azaz a leghasonlóbb referenciára döntünk. Ezen algoritmus alkalmazhatóságának az szab határt, hogy a szavakat nem arányosan mondjuk gyorsabban, vagy lassabban, hanem a szavakon belül is lehetnek sebességkülönbségek. Erre használható a dinamikus id vetemítés (DTW). Ez egy nemlineáris transzformációt hajt végre az id tengelyeken, és ezek mentén hasonlítja össze a mintasorozatokat (ld.: 7. ábra). 7. ábra: LTW DTW 21

21 A referencia mintasorozat: a = a[0] a[r], a teszt mintasorozat: b = b[0] b[t], és a vetemít függvények az F a (i), és F b (i) függvények; ezek közül keressük az optimálist. A vetemít út az (a[0],b[0]) pontból indul ki, és (a[r],b[t]) pontba érkezik; monoton n (hisz nem beszélünk visszafelé) és nem lehet akármekkorát ugrani (hisz nem beszélhetünk tetsz legesen lassan vagy gyorsan). A konkrét implementációban lokális feltételeket lehet megadni a továbblépésre, így az F függvény által megadott út nem lehet tetsz leges. Nagy el nye ennek a rendszernek, hogy igen gyorsan akár egyetlen mintával is hatékonyan tanítható. Robosztusabbá tehet a felismer több tanító minta alkalmazásával., ezek a vetemít út mentén átlagolhatóak. Amennyiben elegend mennyiség tanító minta áll rendelkezésre, akkor már általában statisztikus módszereket alkalmaznak, pl. a rejtett Markov modelleken alapuló felismer t, mely gyakorlatilag magában foglalja a DTW algoritmust is Statisztikus mintaillesztési módszerek A statisztikus eljárások közös tulajdonsága, hogy valamilyen akusztikus modellt használnak, melyekben akusztikus információ tárolása és felhasználása hatékonyabban valósul meg, mint a templét alapú módszernél. Az ár a modellparaméterek becsléséhez szükséges nagyobb adatbázis és számítási id. Fontos megjegyezni, hogy statisztikus jelsz nem magára a mintaillesztési folyamatra vonatkozik, hanem a modell-paraméterek kiszámítására, becslési módjára. A következ kben megpróbálunk a templétbázisú (DTW) módszerb l kiindulva eljutni a rejtett Markov-modell (HMM) alapú mintaillesztésig. A templétt l a rejtett Markov-modellig Induljunk ki a legegyszer bb izoláltszavas felismerésb l. Ilyenkor minden szót, azaz felismerési szimbólumot egy referencia tulajdonságvektor-sorozat reprezentál ezt hívjuk templétnek-, ehhez hasonlítjuk az aktuális bemondás tulajdonságvektorait. Felfoghatjuk úgy is, hogy a lexikonban szerepl minden szónak van egy modellje, ami adott esetben úgy keletkezett, hogy a szó egyetlen realizációjának tulajdonságvektorsorozatát egyszer en eltároltuk. Ennek a modellezési eljárásnak azonban több gyengéje is van. El ször is, egyetlen beszél egyetlen bemondása nyilvánvalóan nem tudja visszaadni azt a nagymérv akusztikai változatosságot, ami a beszéd minden szavára jellemz. Másodszor, a templétmodell er sen redundáns. A vektorok általában 10 ms-onként érkeznek, a beszédben pedig egyes hangzók ms ideig is tarthatnak, következésképpen nagyon sok egymáshoz nagymértékben hasonló tulajdonságvektort kell eltárolnunk. Egy lehet ség a redundancia csökkentésére, hogy az egy hangrészlethez tartozó, hasonló vektorokat egybevonjuk, és egyetlen állapottal modellezzük a szórészletet. A szó egésze pedig nyilvánvalóan állapotsorozatként áll el. 22

22 Kérdés, hogy az egyetlen állapot hogyan adja vissza az elnyelt nagyobb számú tulajdonságvektort. A válaszhoz tisztáznunk kell, mit várunk a modellt l: képes legyen egy teszt tulajdonságvektorra minden állapotban egy hasonlósági mér számot adni, hasonlóan a DTW-hez, ahol azt minden keretben az euklideszi távolság adta meg. Járható út lenne, hogy az állapotot a középs vektorral, vagy egy átlagvektorral képviseljük és továbbra is euklideszi-távolságot számolunk. Több el nnyel jár viszont az a megközelítés, hogy minden állapothoz egy eloszlásfüggvényt rendelünk, melynek bemen mennyisége a tulajdonságvektor, a kimenete pedig a hasonlósági mér szám, mely megmutatja, mennyire illeszkedik az adott vektor a modellezett hangrészlethez. Így az els ként említett, a beszédhangok akusztikai változatosságából ered probléma kezeléséhez is közelebb kerültünk. Az adott állapotra jellemz eloszlásfüggvényt természetesen az állapotba elnyelt tulajdonságvektorok statisztikai feldolgozásával alakítjuk ki. Minél több vektor áll rendelkezésre egy állapothoz, minél több beszél minél többször mondta ki ugyanazt a szót vagy szórészletet, annál jobb lehet az eloszlásfüggvényünk és így a modellünk is. A gyakorlatban megkötéseket tesznek az eloszlásfüggvényre, pl. legyen Gauss függvények lineáris kombinációja így csak az átlagértékeket és szórásokat (kovarianciát) kell eltárolni. Egyetlen probléma van csak a modellünkkel: nincs semmilyen információnk arról, hogy az egyes állapotok milyen sokáig (hány keretnyi ideig) tartanak. Bár az egy állapothoz tartozó vektorok megszámlálása és az átlag eltárolása kézenfekv nek t nik, el nyösebb, ha az állapothossz-információt állapotátmeneti valószín ségek bevezetésével reprezentáljuk. Alapesetben csak a következ állapotba jutás, illetve helyben maradás valószín ségét érdemes 0-nál nagyobbra választani (minden ütemben lépni kell egyet, legfeljebb az addigi állapotba lépünk). Ekkor világos, hogy a hosszabb állapotoknál a saját állapotba való jutás (azaz helyben maradás) valószín sége nagy lesz, a következ be jutásé kisebb. Rövidebb állapotoknál a különbség kisebb lesz ezen valószín ségek között, tehát a két átmeneti valószín ség aránya jelzi az állapot hosszát. Itt megállhatunk, hiszen eljutottunk a beszédelismerésben oly sikerrel alkalmazott folytonos megfigyelési-s r ségfüggvény rejtett markov-modellig. A következ kben egy egzaktabb matematikai definíciót adunk meg, majd a mintaillesztési-felismerési folyamatot mutatjuk be Rejtett Markov-modell A Markov-modell (használatos a Markov-lánc elnevezés is) diszkrét állapottok és az állapotok közötti átmenetekre értelmezett valószín ségek összessége. Az állapotokat q- val jelöljük (az i-ik állapotot q i -val), az ún. állapotátmeneti valószín ségeket pedig a-val. A ij jelenti az i-edikb l a j-edik állapotba való kerülés valószín ségét, formálisan: a ij =P(q i q j ). Grafikus reprezentációnál az állapotokat ellipszisekkel jelöljük, a lehetséges állapotátmeneteket pedig (ahol a ij >0) nyillal. 23

23 A Markov láncokat gyakran használják valamilyen fizikai folyamat modellezésére, ahol különböz megfigyelések alapján kell szimulálni modellezni a folyamatot. Ha a megfigyelés egyértelm en azonosítja, hogy a folyamat milyen állapotban van, akkor a használt modellt megfigyelhet Markov-modellnek vagy egyszer en Markov-láncnak nevezzük. Ilyen eset pl. a kockadobálás, hiszen összesen 6 állapot lehetséges, a dobás végrehajtása után végzett megfigyelés pedig egyértelm en azonosítja az állapotot (tulajdonképpen az állapot - megfigyelés szétválasztására itt nincs is szükség). Számos folyamat létezik viszont, melyekre ugyan az állapotok jól definiálhatók, rájuk a megfigyelések alapján mégsem következtethetünk egyértelm en. Vegyük a következ egyszer példát: Van három dobozunk, mindegyikben 6db labda. Az els ben 3 fehér, 2 piros, 1 fekete, a másodikban 3 piros, 2 fehér, 1 fekete, a harmadikban 4 fekete, 1 piros, 1 fehér. Legyen a megfigyelésünk az, hogy egy dobozból kihúzunk egy labdát. A megfigyelés alapján el szeretnénk dönteni, melyik állapotban vagyunk, vagyis, hogy mi a sorszáma a doboznak, amelyikb l húztunk. Világos, hogy bár az els dobozban f leg pirosak vannak, a másodikban f leg fehérek, a harmadikban meg feketék, a megfigyelés nem determinálja az állapotot. Csak valószín ségeket tudunk mondani el zetes ismereteink birtokában. Legyen például a gondolatkísérletben a megfigyelésünk a piros labda. A következ megállapításokat tehetjük: feltéve, hogy az 1. dobozból húztuk, az eseményvalószín sége 1/3. Feltéve, hogy a 2. dobozból húztuk, a valószín ség 1/2, míg ha azt tesszük fel, hogy a 3. dobozból húztuk, akkor 1/6. Valószín síthetjük, hogy a 2. dobozból húztuk a piros labdát, de nem lehetünk biztosak benne. Az ilyen és ehhez hasonló folyamatok modellezésére alkalmasak a rejtett Markovmodellek. A rejtett szó arra utal, hogy a megfigyel nem látja az állapotokat, azok mintegy rejtve maradnak. Minden állapothoz tartozik egy diszkrét vagy folytonos eloszlásfüggvény, ami azt mutatja meg, hogy az állapotban értelmezett egyes (diszkrét vagy folytonos) megfigyeléseknek mi a valószín sége. A j-ik állapotban az o esemény (megfigyelés) valószín ségét b j (o)-al jelöljük. A fenti példán keresztül szemléltetve: Az els doboz (állapot) eseményeinek valószín ség-eloszlása: B l (piros)=1/3, B l (fehér)=1/2, B l (fekete)=1/6 Hasonlóan, a többi állapot eloszlása is könnyen számolható, ezt az olvasóra bízzuk. Természetesen a megfigyelésnek nem kell diszkrétnek lennie. Lehet például valós szám N-es azaz vektor-, ilyenkor bj(o) egy vektor-skalás függvény, egy N-dimenziós eloszlás s r ségfüggvénye. Lényegében ugyanarról van szó, mint korábban, a megfigyeléshez egy valószín ségi mértéket rendelünk. Az utóbbi típusú modelleket folytonos megfigyelésis r ségfüggvény rejtett Markov-modellekenek hívjuk, ilyeneket használnak a korszer beszédfelismer kben is. 24

24 Szegmentálás Beszédadatbázisoknak a beszéd digitális tárolása mellett annak nyelvi információ tartalmát is rögzíteniük kell. Ezért a hullámforma tárolása mellett a hozzátartozó ortografikus karaktereket is rögzítik. Különböz zajok, embert l származóak,- (ilyen a köhögés, nyelés, különböz szájmozgásból adódó zajok), vagy környezetiek (járm vek, motorok zaja, székcsikorgás stb.) bejelölésre kerülnek a legtöbb adatbázisban, vagy a szöveganyagban, vagy magában az id függvényben (és ekkor beszélhetünk szegmentálásról). Szegmentálás során a beszéd id függvényében bejelölik a beszédhangok, vagy egyéb fonetikai egységek határait, és beírják a megfelel fonetikai szimbólumokat. Kézi vagy automatikus szegmentálást szokás használni. A kézi szegmentálás pontos, de fárasztó és id igényes. Az automatikus, vagy félautomatikus szegmentálás gépi felismerésekkel (ld.: 8. ábra) hajtható végre, ez gyors eljárás, de mindenképpen pontatlanabb, mint ha kézzel csinálnánk, ezért ilyenkor mindig kézi korrekciót kell végezni. 8. ábra: egy ANN alapú automatikus szegmentáló blokkvázlata 25

Mély neuronhálók alkalmazása és optimalizálása

Mély neuronhálók alkalmazása és optimalizálása magyar nyelv beszédfelismerési feladatokhoz 2015. január 10. Konzulens: Dr. Mihajlik Péter A megvalósítandó feladatok Irodalomkutatás Nyílt kutatási eszközök keresése, beszédfelismer rendszerek tervezése

Részletesebben

BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA

BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA BESZÉDTUDOMÁNY Az emberi kommunikáció egyik leggyakrabban használt eszköze a nyelv. A nyelv hangzó változta, a beszéd a nyelvi kommunikáció

Részletesebben

Beszédadatbázisok a gépi beszédfelismerés segítésére

Beszédadatbázisok a gépi beszédfelismerés segítésére Beszédadatbázisok a gépi beszédfelismerés segítésére Vicsi Klára 1 Adatbázisok jelentősége A gépi beszéd és beszélő felismerési eljárások lényegében két jól elkülöníthető elméleti alapra épülnek. Az egyik

Részletesebben

Képfeldolgozás. 1. el adás. A képfeldolgozás m veletei. Mechatronikai mérnök szak BME, 2008

Képfeldolgozás. 1. el adás. A képfeldolgozás m veletei. Mechatronikai mérnök szak BME, 2008 Képfeldolgozás 1. el adás. A képfeldolgozás m veletei Mechatronikai mérnök szak BME, 2008 1 / 61 Alapfogalmak transzformációk Deníció Deníció Geometriai korrekciókra akkor van szükség, ha a képr l valódi

Részletesebben

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011. BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011. 1 Mérési hibák súlya és szerepe a mérési eredményben A mérési hibák csoportosítása A hiba rendűsége Mérési bizonytalanság Standard és kiterjesztett

Részletesebben

Gépi tanulás és Mintafelismerés

Gépi tanulás és Mintafelismerés Gépi tanulás és Mintafelismerés jegyzet Csató Lehel Matematika-Informatika Tanszék BabesBolyai Tudományegyetem, Kolozsvár 2007 Aug. 20 2 1. fejezet Bevezet A mesterséges intelligencia azon módszereit,

Részletesebben

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben 1 feladatsor 1 Egy dobozban 20 fehér golyó van Egy szabályos dobókockával dobunk, majd a következ t tesszük: ha a dobott szám 1,2 vagy 3, akkor tíz golyót cserélünk ki pirosra; ha a dobott szám 4 vagy

Részletesebben

Online algoritmusok. Algoritmusok és bonyolultságuk. Horváth Bálint március 30. Horváth Bálint Online algoritmusok március 30.

Online algoritmusok. Algoritmusok és bonyolultságuk. Horváth Bálint március 30. Horváth Bálint Online algoritmusok március 30. Online algoritmusok Algoritmusok és bonyolultságuk Horváth Bálint 2018. március 30. Horváth Bálint Online algoritmusok 2018. március 30. 1 / 28 Motiváció Gyakran el fordul, hogy a bemenetet csak részenként

Részletesebben

Képfeldolgozás. 1. el adás. A képfeldolgozás alapfogalmai. Mechatronikai mérnök szak BME, 2008

Képfeldolgozás. 1. el adás. A képfeldolgozás alapfogalmai. Mechatronikai mérnök szak BME, 2008 Képfeldolgozás 1. el adás. A képfeldolgozás alapfogalmai BME, 2008 A digitális képfeldolgozás alapfeladata Deníció A digitális képfeldolgozás során arra törekszünk, hogy a természetes képek elemzése révén

Részletesebben

Általános statisztika II. Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László

Általános statisztika II. Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László Általános statisztika II Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László Általános statisztika II Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László Publication

Részletesebben

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus. Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza

Részletesebben

Akusztikai mérések SztahóDávid

Akusztikai mérések SztahóDávid Akusztikai mérések SztahóDávid sztaho@tmit.bme.hu http://alpha.tmit.bme.hu/speech http://berber.tmit.bme.hu/oktatas/gyak02.ppt Tartalom Akusztikai produktum Gerjesztés típus Vokális traktus Sugárzási ellenállás

Részletesebben

Beszédfelismerés, beszédmegértés

Beszédfelismerés, beszédmegértés Beszédfelismerés, beszédmegértés Werner Ágnes Beszéd, ember-gép kapcsolat A beszéd az emberek közötti legtermészetesebb információátviteli forma. Az ember és a gép kapcsolatában is ez lehetne talán a legcélravezetőbb,

Részletesebben

Ellátási lánc optimalizálás P-gráf módszertan alkalmazásával mennyiségi és min ségi paraméterek gyelembevételével

Ellátási lánc optimalizálás P-gráf módszertan alkalmazásával mennyiségi és min ségi paraméterek gyelembevételével Ellátási lánc optimalizálás P-gráf módszertan alkalmazásával mennyiségi és min ségi paraméterek gyelembevételével Pekárdy Milán, Baumgartner János, Süle Zoltán Pannon Egyetem, Veszprém XXXII. Magyar Operációkutatási

Részletesebben

0,424 0,576. f) P (X 2 = 3) g) P (X 3 = 1) h) P (X 4 = 1 vagy 2 X 2 = 2) i) P (X 7 = 3, X 4 = 1, X 2 = 2 X 0 = 2) j) P (X 7 = 3, X 4 = 1, X 2 = 2)

0,424 0,576. f) P (X 2 = 3) g) P (X 3 = 1) h) P (X 4 = 1 vagy 2 X 2 = 2) i) P (X 7 = 3, X 4 = 1, X 2 = 2 X 0 = 2) j) P (X 7 = 3, X 4 = 1, X 2 = 2) Legyen adott a P átmenetvalószín ség mátrix és a ϕ 0 kezdeti eloszlás Kérdés, hogy miként lehetne meghatározni az egyes állapotokban való tartózkodás valószín ségét az n-edik lépés múlva Deniáljuk az n-lépéses

Részletesebben

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI MÉRÉSI EREDMÉYEK POTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI. A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk

Részletesebben

L'Hospital-szabály. 2015. március 15. ln(x 2) x 2. ln(x 2) = ln(3 2) = ln 1 = 0. A nevez határértéke: lim. (x 2 9) = 3 2 9 = 0.

L'Hospital-szabály. 2015. március 15. ln(x 2) x 2. ln(x 2) = ln(3 2) = ln 1 = 0. A nevez határértéke: lim. (x 2 9) = 3 2 9 = 0. L'Hospital-szabály 25. március 5.. Alapfeladatok ln 2. Feladat: Határozzuk meg a határértéket! 3 2 9 Megoldás: Amint a korábbi határértékes feladatokban, els ként most is a határérték típusát kell megvizsgálnunk.

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,

Részletesebben

Matematikai és matematikai statisztikai alapismeretek

Matematikai és matematikai statisztikai alapismeretek Kézirat a Matematikai és matematikai statisztikai alapismeretek című előadáshoz Dr. Győri István NEVELÉSTUDOMÁNYI PH.D. PROGRM 1999/2000 1 1. MTEMTIKI LPOGLMK 1.1. Halmazok Halmazon mindig bizonyos dolgok

Részletesebben

Hibadetektáló rendszer légtechnikai berendezések számára

Hibadetektáló rendszer légtechnikai berendezések számára Hibadetektáló rendszer légtechnikai berendezések számára Tudományos Diákköri Konferencia A feladatunk Légtechnikai berendezések Monitorozás Hibadetektálás Újrataníthatóság A megvalósítás Mozgásérzékelő

Részletesebben

A beszéd. Segédlet a Kommunikáció-akusztika tanulásához

A beszéd. Segédlet a Kommunikáció-akusztika tanulásához A beszéd Segédlet a Kommunikáció-akusztika tanulásához Bevezetés Nyelv: az emberi társadalom egyedei közötti kommunikáció az egyed gondolkodásának legfőbb eszköze Beszéd: a nyelv elsődleges megnyilvánulása

Részletesebben

Taylor-polinomok. 1. Alapfeladatok. 2015. április 11. 1. Feladat: Írjuk fel az f(x) = e 2x függvény másodfokú Maclaurinpolinomját!

Taylor-polinomok. 1. Alapfeladatok. 2015. április 11. 1. Feladat: Írjuk fel az f(x) = e 2x függvény másodfokú Maclaurinpolinomját! Taylor-polinomok 205. április.. Alapfeladatok. Feladat: Írjuk fel az fx) = e 2x függvény másodfokú Maclaurinpolinomját! Megoldás: A feladatot kétféle úton is megoldjuk. Az els megoldásban induljunk el

Részletesebben

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

Elméleti összefoglaló a Valószín ségszámítás kurzushoz Elméleti összefoglaló a Valószín ségszámítás kurzushoz Véletlen kísérletek, események valószín sége Deníció. Egy véletlen kísérlet lehetséges eredményeit kimeneteleknek nevezzük. A kísérlet kimeneteleinek

Részletesebben

Érdekes informatika feladatok

Érdekes informatika feladatok A keres,kkel és adatbázissal ellátott lengyel honlap számos díjat kapott: Spirit of Delphi '98, Delphi Community Award, Poland on the Internet, Golden Bagel Award stb. Az itt megtalálható komponenseket

Részletesebben

Az 5-2. ábra két folyamatos jel (A és B) azonos gyakoriságú mintavételezését mutatja. 5-2. ábra

Az 5-2. ábra két folyamatos jel (A és B) azonos gyakoriságú mintavételezését mutatja. 5-2. ábra Az analóg folyamatjeleken - mielőtt azok további feldolgozás (hasznosítás) céljából bekerülnének a rendszer adatbázisába - az alábbi műveleteket kell elvégezni: mintavételezés, átkódolás, méréskorrekció,

Részletesebben

AZ ÉPÍTÉSI MUNKÁK IDŐTERVEZÉSE

AZ ÉPÍTÉSI MUNKÁK IDŐTERVEZÉSE UDPESTI MŰSZKI ÉS GZDSÁGTUDOMÁNYI EGYETEM ÉPÍTÉSZMÉRNÖKI KR ÉPÍTÉSKIVITELEZÉSI és SZERVEZÉSI TNSZÉK dr. Neszmélyi László Z ÉPÍTÉSI MUNKÁK IDŐTERVEZÉSE - 2015. - Tartalom 1. EVEZETÉS... 4 2. Z ÉPÍTÉSEN

Részletesebben

A.26. Hagyományos és korszerű tervezési eljárások

A.26. Hagyományos és korszerű tervezési eljárások A.26. Hagyományos és korszerű tervezési eljárások A.26.1. Hagyományos tervezési eljárások A.26.1.1. Csuklós és merev kapcsolatú keretek tervezése Napjainkig a magasépítési tartószerkezetek tervezése a

Részletesebben

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31. Regresszió Csorba János Nagyméretű adathalmazok kezelése 2010. március 31. A feladat X magyarázó attribútumok halmaza Y magyarázandó attribútumok) Kérdés: f : X -> Y a kapcsolat pár tanítópontban ismert

Részletesebben

MATEMATIKA. 5 8. évfolyam

MATEMATIKA. 5 8. évfolyam MATEMATIKA 5 8. évfolyam Célok és feladatok A matematikatanítás célja és ennek kapcsán feladata: megismertetni a tanulókat az őket körülvevő konkrét környezet mennyiségi és térbeli viszonyaival, megalapozni

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,

Részletesebben

rank(a) == rank([a b])

rank(a) == rank([a b]) Lineáris algebrai egyenletrendszerek megoldása a Matlabban Lineáris algebrai egyenletrendszerek a Matlabban igen egyszer en oldhatók meg. Legyen A az egyenletrendszer m-szer n-es együtthatómátrixa, és

Részletesebben

Bevezetés a programozásba I.

Bevezetés a programozásba I. Bevezetés a programozásba I. 3. gyakorlat Tömbök, programozási tételek Surányi Márton PPKE-ITK 2010.09.21. ZH! PlanG-ból papír alapú zárthelyit írunk el reláthatólag október 5-én! Tömbök Tömbök Eddig egy-egy

Részletesebben

Biomatematika 2 Orvosi biometria

Biomatematika 2 Orvosi biometria Biomatematika 2 Orvosi biometria 2017.02.13. Populáció és minta jellemző adatai Hibaszámítás Valószínűség 1 Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza)

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen

Részletesebben

Gazdasági matematika II. tanmenet

Gazdasági matematika II. tanmenet Gazdasági matematika II. tanmenet Mádi-Nagy Gergely A hivatkozásokban az alábbi tankönyvekre utalunk: T: Tóth Irén (szerk.): Operációkutatás I., Nemzeti Tankönyvkiadó 1987. Cs: Csernyák László (szerk.):

Részletesebben

Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017.

Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017. Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017. Vizuális feldolgozórendszerek feladatai Mesterséges intelligencia és idegtudomány Mesterséges intelligencia és idegtudomány Párhuzamos problémák

Részletesebben

Mérési hibák 2006.10.04. 1

Mérési hibák 2006.10.04. 1 Mérési hibák 2006.10.04. 1 Mérés jel- és rendszerelméleti modellje Mérési hibák_labor/2 Mérési hibák mérési hiba: a meghatározandó értékre a mérés során kapott eredmény és ideális értéke közötti különbség

Részletesebben

Mérési adatok illesztése, korreláció, regresszió

Mérési adatok illesztése, korreláció, regresszió Mérési adatok illesztése, korreláció, regresszió Korreláció, regresszió Két változó mennyiség közötti kapcsolatot vizsgálunk. Kérdés: van-e kapcsolat két, ugyanabban az egyénben, állatban, kísérleti mintában,

Részletesebben

Struktúra nélküli adatszerkezetek

Struktúra nélküli adatszerkezetek Struktúra nélküli adatszerkezetek Homogén adatszerkezetek (minden adatelem azonos típusú) osztályozása Struktúra nélküli (Nincs kapcsolat az adatelemek között.) Halmaz Multihalmaz Asszociatív 20:24 1 A

Részletesebben

Matematikai geodéziai számítások 6.

Matematikai geodéziai számítások 6. Matematikai geodéziai számítások 6. Lineáris regresszió számítás elektronikus távmérőkre Dr. Bácsatyai, László Matematikai geodéziai számítások 6.: Lineáris regresszió számítás elektronikus távmérőkre

Részletesebben

Megoldott feladatok november 30. n+3 szigorúan monoton csökken, 5. n+3. lim a n = lim. n+3 = 2n+3 n+4 2n+1

Megoldott feladatok november 30. n+3 szigorúan monoton csökken, 5. n+3. lim a n = lim. n+3 = 2n+3 n+4 2n+1 Megoldott feladatok 00. november 0.. Feladat: Vizsgáljuk az a n = n+ n+ sorozat monotonitását, korlátosságát és konvergenciáját. Konvergencia esetén számítsuk ki a határértéket! : a n = n+ n+ = n+ n+ =

Részletesebben

Akusztikai tervezés a geometriai akusztika módszereivel

Akusztikai tervezés a geometriai akusztika módszereivel Akusztikai tervezés a geometriai akusztika módszereivel Fürjes Andor Tamás BME Híradástechnikai Tanszék Kép- és Hangtechnikai Laborcsoport, Rezgésakusztika Laboratórium 1 Tartalom A geometriai akusztika

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.15. Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza) alkotja az eseményteret. Esemény: az eseménytér részhalmazai.

Részletesebben

Jelek és rendszerek 1. 10/9/2011 Dr. Buchman Attila Informatikai Rendszerek és Hálózatok Tanszék

Jelek és rendszerek 1. 10/9/2011 Dr. Buchman Attila Informatikai Rendszerek és Hálózatok Tanszék Jelek és rendszerek 1 10/9/2011 Dr. Buchman Attila Informatikai Rendszerek és Hálózatok Tanszék 1 Ajánlott irodalom: FODOR GYÖRGY : JELEK ÉS RENDSZEREK EGYETEMI TANKÖNYV Műegyetemi Kiadó, Budapest, 2006

Részletesebben

Függvények határértéke, folytonossága

Függvények határértéke, folytonossága Függvények határértéke, folytonossága 25. február 22.. Alapfeladatok. Feladat: Határozzuk meg az f() = 23 4 5 3 + 9 a végtelenben és a mínusz végtelenben! függvény határértékét Megoldás: Vizsgáljuk el

Részletesebben

Kalibrálás és mérési bizonytalanság. Drégelyi-Kiss Ágota I

Kalibrálás és mérési bizonytalanság. Drégelyi-Kiss Ágota I Kalibrálás és mérési bizonytalanság Drégelyi-Kiss Ágota I. 120. dregelyi.agota@bgk.uni-obuda.hu Kalibrálás Azoknak a mőveleteknek az összessége, amelyekkel meghatározott feltételek mellett megállapítható

Részletesebben

Matematikai geodéziai számítások 6.

Matematikai geodéziai számítások 6. Nyugat-magyarországi Egyetem Geoinformatikai Kara Dr. Bácsatyai László Matematikai geodéziai számítások 6. MGS6 modul Lineáris regresszió számítás elektronikus távmérőkre SZÉKESFEHÉRVÁR 2010 Jelen szellemi

Részletesebben

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( ) Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel: 463-6-80 Fa: 463-30-9 http://www.vizgep.bme.hu Alap-ötlet:

Részletesebben

Sztöchiometriai egyenletrendszerek minimális számú aktív változót tartalmazó megoldásainak meghatározása a P-gráf módszertan alkalmazásával

Sztöchiometriai egyenletrendszerek minimális számú aktív változót tartalmazó megoldásainak meghatározása a P-gráf módszertan alkalmazásával Sztöchiometriai egyenletrendszerek minimális számú aktív változót tartalmazó megoldásainak meghatározása a P-gráf módszertan alkalmazásával * Pannon Egyetem, M szaki Informatikai Kar, Számítástudomány

Részletesebben

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem agy számok törvényei Statisztikai mintavétel Várható érték becslése Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem A mérés mint statisztikai mintavétel A méréssel az eloszlásfüggvénnyel

Részletesebben

Függvények növekedési korlátainak jellemzése

Függvények növekedési korlátainak jellemzése 17 Függvények növekedési korlátainak jellemzése A jellemzés jól bevált eszközei az Ω, O, Θ, o és ω jelölések. Mivel az igények általában nemnegatívak, ezért az alábbi meghatározásokban mindenütt feltesszük,

Részletesebben

7. gyakorlat. Lineáris algebrai egyenletrendszerek megoldhatósága

7. gyakorlat. Lineáris algebrai egyenletrendszerek megoldhatósága 7. gyakorlat Lineáris algebrai egyenletrendszerek megoldhatósága Egy lineáris algebrai egyenletrendszerrel kapcsolatban a következ kérdések merülnek fel: 1. Létezik-e megoldása? 2. Ha igen, hány megoldása

Részletesebben

Kibernetika korábbi vizsga zárthelyi dolgozatokból válogatott tesztkérdések Figyelem! Az alábbi tesztek csak mintául szolgálnak a tesztkérdések megoldásához, azaz a bemagolásuk nem jelenti a tananyag elsajátítását

Részletesebben

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése 4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól

Részletesebben

Beszédfelismerő szoftver adaptálása C# programozási nyelvre

Beszédfelismerő szoftver adaptálása C# programozási nyelvre Beszédfelismerő szoftver adaptálása C# programozási nyelvre Készítette: Sztahó Dávid A szoftver leírása A szoftver által megvalósított funkciók blokkvázlatát az 1. ábra mutatja. A szoftver valós idejű

Részletesebben

Méréselmélet és mérőrendszerek 2. ELŐADÁS (1. RÉSZ)

Méréselmélet és mérőrendszerek 2. ELŐADÁS (1. RÉSZ) Méréselmélet és mérőrendszerek 2. ELŐADÁS (1. RÉSZ) KÉSZÍTETTE: DR. FÜVESI VIKTOR 2016. 10. Mai témáink o A hiba fogalma o Méréshatár és mérési tartomány M é r é s i h i b a o A hiba megadása o A hiba

Részletesebben

A mérések általános és alapvető metrológiai fogalmai és definíciói. Mérések, mérési eredmények, mérési bizonytalanság. mérés. mérési elv

A mérések általános és alapvető metrológiai fogalmai és definíciói. Mérések, mérési eredmények, mérési bizonytalanság. mérés. mérési elv Mérések, mérési eredmények, mérési bizonytalanság A mérések általános és alapvető metrológiai fogalmai és definíciói mérés Műveletek összessége, amelyek célja egy mennyiség értékének meghatározása. mérési

Részletesebben

7. gyakorlat. Lineáris algebrai egyenletrendszerek megoldhatósága

7. gyakorlat. Lineáris algebrai egyenletrendszerek megoldhatósága 7. gyakorlat Lineáris algebrai egyenletrendszerek megoldhatósága Egy lineáris algebrai egyenletrendszerrel kapcsolatban a következ kérdések merülnek fel: 1. Létezik-e megoldása? 2. Ha igen, hány megoldása

Részletesebben

Méréselmélet MI BSc 1

Méréselmélet MI BSc 1 Mérés és s modellezés 2008.02.15. 1 Méréselmélet - bevezetés a mérnöki problémamegoldás menete 1. A probléma kitűzése 2. A hipotézis felállítása 3. Kísérlettervezés 4. Megfigyelések elvégzése 5. Adatok

Részletesebben

Szintetizált beszéd természetesebbé tétele

Szintetizált beszéd természetesebbé tétele Csapó Tamás Gábor IV. évf. Szintetizált beszéd természetesebbé tétele Konzulensek: Dr. Németh Géza, Dr. Fék Márk Budapesti Mőszaki és Gazdaságtudományi Egyetem Távközlési és Médiainformatikai Tanszék OTDK

Részletesebben

Méréselmélet és mérőrendszerek

Méréselmélet és mérőrendszerek Méréselmélet és mérőrendszerek 6. ELŐADÁS KÉSZÍTETTE: DR. FÜVESI VIKTOR 2016. 10. Mai témáink o A hiba fogalma o Méréshatár és mérési tartomány M é r é s i h i b a o A hiba megadása o A hiba eredete o

Részletesebben

ZH feladatok megoldásai

ZH feladatok megoldásai ZH feladatok megoldásai A CSOPORT 5. Írja le, hogy milyen szabályokat tartalmazhatnak az egyes Chomskynyelvosztályok (03 típusú nyelvek)! (4 pont) 3. típusú, vagy reguláris nyelvek szabályai A ab, A a

Részletesebben

Mérési struktúrák

Mérési struktúrák Mérési struktúrák 2007.02.19. 1 Mérési struktúrák A mérés művelete: a mérendő jellemző és a szimbólum halmaz közötti leképezés megvalósítása jel- és rendszerelméleti aspektus mérési folyamat: a leképezést

Részletesebben

2006. szeptember 28. A BESZÉDPERCEPCI DPERCEPCIÓ. Fonetikai Osztály

2006. szeptember 28. A BESZÉDPERCEPCI DPERCEPCIÓ. Fonetikai Osztály 2006. szeptember 28. ÖNÁLLÓSULÓ FOLYAMATOK A BESZÉDPERCEPCI DPERCEPCIÓ FEJLŐDÉSÉBEN Gósy MáriaM Fonetikai Osztály AZ ANYANYELV-ELSAJ ELSAJÁTÍTÁSRÓL Fő jellemzői: univerzális, relatíve gyors, biológiai

Részletesebben

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem. Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem. Elemi esemény: a kísérlet egyes lehetséges egyes lehetséges kimenetelei.

Részletesebben

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás Matematikai alapok és valószínőségszámítás Valószínőségi eloszlások Binomiális eloszlás Bevezetés A tudományos életben megfigyeléseket teszünk, kísérleteket végzünk. Ezek többféle különbözı eredményre

Részletesebben

Ütemezési modellek. Az ütemezési problémák osztályozása

Ütemezési modellek. Az ütemezési problémák osztályozása Ütemezési modellek Az ütemezési problémák osztályozása Az ütemezési problémákban adott m darab gép és n számú munka, amelyeket az 1,..., n számokkal fogunk sorszámozni. A feladat az, hogy ütemezzük az

Részletesebben

Neurális hálózatok bemutató

Neurális hálózatok bemutató Neurális hálózatok bemutató Füvesi Viktor Miskolci Egyetem Alkalmazott Földtudományi Kutatóintézet Miért? Vannak feladatok amelyeket az agy gyorsabban hajt végre mint a konvencionális számítógépek. Pl.:

Részletesebben

4. Használati útmutatás

4. Használati útmutatás megbízható(másnéven: robusztus): mert a programozási hibák egy részét megakadályozza,a másik részét pedig futás közben kisz ri és támogatja a fejleszt t azok professzionális kezelésében. biztonságos: megakadályozza

Részletesebben

6. Függvények. Legyen függvény és nem üreshalmaz. A függvényt az f K-ra való kiterjesztésének

6. Függvények. Legyen függvény és nem üreshalmaz. A függvényt az f K-ra való kiterjesztésének 6. Függvények I. Elméleti összefoglaló A függvény fogalma, értelmezési tartomány, képhalmaz, értékkészlet Legyen az A és B halmaz egyike sem üreshalmaz. Ha az A halmaz minden egyes eleméhez hozzárendeljük

Részletesebben

Határozott integrál és alkalmazásai

Határozott integrál és alkalmazásai Határozott integrál és alkalmazásai 5. május 5.. Alapfeladatok. Feladat: + d = Megoldás: Egy határozott integrál kiszámolása a feladat. Ilyenkor a Newton-Leibniz-tételt használhatjuk, mely azt mondja ki,

Részletesebben

A HANGOK TANÁTÓL A BESZÉDTECHNOLÓGIÁIG. Gósy Mária. MTA Nyelvtudományi Intézet, Kempelen Farkas Beszédkutató Laboratórium

A HANGOK TANÁTÓL A BESZÉDTECHNOLÓGIÁIG. Gósy Mária. MTA Nyelvtudományi Intézet, Kempelen Farkas Beszédkutató Laboratórium A HANGOK TANÁTÓL A BESZÉDTECHNOLÓGIÁIG Gósy Mária MTA Nyelvtudományi Intézet, Kempelen Farkas Beszédkutató Laboratórium beszédzavarok beszédtechnika beszélő felismerése fonológia fonetika alkalmazott fonetika

Részletesebben

9. Tétel Els - és másodfokú egyenl tlenségek. Pozitív számok nevezetes közepei, ezek felhasználása széls érték-feladatok megoldásában

9. Tétel Els - és másodfokú egyenl tlenségek. Pozitív számok nevezetes közepei, ezek felhasználása széls érték-feladatok megoldásában 9. Tétel Els - és másodfokú egyenl tlenségek. Pozitív számok nevezetes közepei, ezek felhasználása széls érték-feladatok megoldásában Bevezet : A témakörben els - és másodfokú egyenl tlenségek megoldásának

Részletesebben

Első egyéni feladat (Minta)

Első egyéni feladat (Minta) Első egyéni feladat (Minta) 1. Készítsen olyan programot, amely segítségével a felhasználó 3 különböző jelet tud generálni, amelyeknek bemenő adatait egyedileg lehet változtatni. Legyen mód a jelgenerátorok

Részletesebben

Soros felépítésű folytonos PID szabályozó

Soros felépítésű folytonos PID szabályozó Soros felépítésű folytonos PID szabályozó Főbb funkciók: A program egy PID szabályozót és egy ez által szabályozott folyamatot szimulál, a kimeneti és a beavatkozó jel grafikonon való ábrázolásával. A

Részletesebben

Véletlen bolyongás. Márkus László március 17. Márkus László Véletlen bolyongás március / 31

Véletlen bolyongás. Márkus László március 17. Márkus László Véletlen bolyongás március / 31 Márkus László Véletlen bolyongás 2015. március 17. 1 / 31 Véletlen bolyongás Márkus László 2015. március 17. Modell Deníció Márkus László Véletlen bolyongás 2015. március 17. 2 / 31 Modell: Egy egyenesen

Részletesebben

Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék Keresés képi jellemzők alapján Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék Lusta gépi tanulási algoritmusok Osztályozás: k=1: piros k=5: kék k-legközelebbi szomszéd (k=1,3,5,7)

Részletesebben

Fegyó Tibor Mihajlik Péter BUDAPESTI MŰSZAKI ÉS GAZDASÁGTUDOMÁNYI EGYETEM. oktatási segédanyag. 31-1 oldal

Fegyó Tibor Mihajlik Péter BUDAPESTI MŰSZAKI ÉS GAZDASÁGTUDOMÁNYI EGYETEM. oktatási segédanyag. 31-1 oldal Gépi beszédfelismerés oktatási segédanyag BUDAPESTI MŰSZAKI ÉS GAZDASÁGTUDOMÁNYI EGYETEM Fegyó Tibor Mihajlik Péter Gépi beszédfelismerés oktatási segédanyag 31-1 oldal Tartalomjegyzék 1 BESZÉDFELISMERŐ

Részletesebben

Valószín ségszámítás. Survey statisztika mesterszak és földtudomány alapszak Backhausz Ágnes 2018/2019.

Valószín ségszámítás. Survey statisztika mesterszak és földtudomány alapszak Backhausz Ágnes 2018/2019. Valószín ségszámítás Survey statisztika mesterszak és földtudomány alapszak Backhausz Ágnes agnes@cs.elte.hu 2018/2019. szi félév A valószín ségszámítás kurzus céljai a statisztika megalapozása: a véletlen

Részletesebben

Gépi tanulás a gyakorlatban. Bevezetés

Gépi tanulás a gyakorlatban. Bevezetés Gépi tanulás a gyakorlatban Bevezetés Motiváció Nagyon gyakran találkozunk gépi tanuló alkalmazásokkal Spam detekció Karakter felismerés Fotó címkézés Szociális háló elemzés Piaci szegmentáció analízis

Részletesebben

Követelmény a 7. évfolyamon félévkor matematikából

Követelmény a 7. évfolyamon félévkor matematikából Követelmény a 7. évfolyamon félévkor matematikából Gondolkodási és megismerési módszerek Elemek halmazba rendezése több szempont alapján. Halmazok ábrázolása. A nyelv logikai elemeinek helyes használata.

Részletesebben

Intelligens Rendszerek Elmélete. Versengéses és önszervező tanulás neurális hálózatokban

Intelligens Rendszerek Elmélete. Versengéses és önszervező tanulás neurális hálózatokban Intelligens Rendszerek Elmélete : dr. Kutor László Versengéses és önszervező tanulás neurális hálózatokban http://mobil.nik.bmf.hu/tantargyak/ire.html Login név: ire jelszó: IRE07 IRE 9/1 Processzor Versengéses

Részletesebben

Folyadékszcintillációs spektroszkópia jegyz könyv

Folyadékszcintillációs spektroszkópia jegyz könyv Folyadékszcintillációs spektroszkópia jegyz könyv Zsigmond Anna Julia Fizika MSc I. Mérés vezet je: Horváth Ákos Mérés dátuma: 2010. október 21. Leadás dátuma: 2010. november 8. 1 1. Bevezetés A mérés

Részletesebben

Bevezetés. Párhuzamos vetítés és tulajdonságai

Bevezetés. Párhuzamos vetítés és tulajdonságai Bevezetés Az ábrázoló geometria célja a háromdimenziós térben elhelyezkedő alakzatok helyzeti és metrikus viszonyainak egyértelműen és egyértelműen visszaállítható (rekonstruálható) módon történő való

Részletesebben

12. előadás. Egyenletrendszerek, mátrixok. Dr. Szörényi Miklós, Dr. Kallós Gábor

12. előadás. Egyenletrendszerek, mátrixok. Dr. Szörényi Miklós, Dr. Kallós Gábor 12. előadás Egyenletrendszerek, mátrixok Dr. Szörényi Miklós, Dr. Kallós Gábor 2015 2016 1 Tartalom Matematikai alapok Vektorok és mátrixok megadása Tömbkonstansok Lineáris műveletek Mátrixok szorzása

Részletesebben

Infobionika ROBOTIKA. X. Előadás. Robot manipulátorok II. Direkt és inverz kinematika. Készült a HEFOP P /1.0 projekt keretében

Infobionika ROBOTIKA. X. Előadás. Robot manipulátorok II. Direkt és inverz kinematika. Készült a HEFOP P /1.0 projekt keretében Infobionika ROBOTIKA X. Előadás Robot manipulátorok II. Direkt és inverz kinematika Készült a HEFOP-3.3.1-P.-2004-06-0018/1.0 projekt keretében Tartalom Direkt kinematikai probléma Denavit-Hartenberg konvenció

Részletesebben

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás

Részletesebben

1. A k-szerver probléma

1. A k-szerver probléma 1. A k-szerver probléma Az egyik legismertebb on-line probléma a k-szerver probléma. A probléma általános deníciójának megadásához szükség van a metrikus tér fogalmára. Egy (M, d) párost, ahol M a metrikus

Részletesebben

INFORMATIKA Emelt szint 11-12.

INFORMATIKA Emelt szint 11-12. INFORMATIKA Emelt szint 11-12. Az informatika tantárgy ismeretkörei, fejlesztési területei hozzájárulnak ahhoz, hogy a tanuló az információs társadalom aktív tagjává válhasson. Az informatikai eszközök

Részletesebben

Mérés és modellezés 1

Mérés és modellezés 1 Mérés és modellezés 1 Mérés és modellezés A mérnöki tevékenység alapeleme a mérés. A mérés célja valamely jelenség megismerése, vizsgálata. A mérés tervszerűen végzett tevékenység: azaz rögzíteni kell

Részletesebben

Számítógépes képelemzés 7. előadás. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Számítógépes képelemzés 7. előadás. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék Számítógépes képelemzés 7. előadás Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék Momentumok Momentum-alapú jellemzők Tömegközéppont Irányultáság 1 2 tan 2 1 2,0 1,1 0, 2 Befoglaló

Részletesebben

Vasúti infrastruktúragazdálkodás kontrolling bázisú döntéselőkészítő rendszerek alkalmazásával

Vasúti infrastruktúragazdálkodás kontrolling bázisú döntéselőkészítő rendszerek alkalmazásával Budapesti Műszaki és Gazdaságtudományi Egyetem Közlekedésmérnöki és Járműmérnöki Kar Közlekedésüzemi és Közlekedésgazdasági Tanszék Vasúti infrastruktúragazdálkodás kontrolling bázisú döntéselőkészítő

Részletesebben

Adaptív dinamikus szegmentálás idősorok indexeléséhez

Adaptív dinamikus szegmentálás idősorok indexeléséhez Adaptív dinamikus szegmentálás idősorok indexeléséhez IPM-08irAREAE kurzus cikkfeldolgozás Balassi Márton 1 Englert Péter 1 Tömösy Péter 1 1 Eötvös Loránd Tudományegyetem Informatikai Kar 2013. november

Részletesebben

Mesterséges Intelligencia MI

Mesterséges Intelligencia MI Mesterséges Intelligencia MI Valószínűségi hálók - következtetés Dobrowiecki Tadeusz Eredics Péter, és mások BME I.E. 437, 463-28-99 dobrowiecki@mit.bme.hu, http://www.mit.bme.hu/general/staff/tade Következtetés

Részletesebben

4. LECKE: DÖNTÉSI FÁK - OSZTÁLYOZÁS II. -- Előadás. 4.1. Döntési fák [Concepts Chapter 11]

4. LECKE: DÖNTÉSI FÁK - OSZTÁLYOZÁS II. -- Előadás. 4.1. Döntési fák [Concepts Chapter 11] 1 4. LECKE: DÖNTÉSI FÁK - OSZTÁLYOZÁS II. -- Előadás 4.1. Döntési fák [Concepts Chapter 11] A döntési fákon alapuló klasszifikációs eljárás nagy előnye, hogy az alkalmazása révén nemcsak egyedenkénti előrejelzést

Részletesebben

Beszédfeldolgozási zavarok és a tanulási nehézségek összefüggései. Gósy Mária MTA Nyelvtudományi Intézete

Beszédfeldolgozási zavarok és a tanulási nehézségek összefüggései. Gósy Mária MTA Nyelvtudományi Intézete Beszédfeldolgozási zavarok és a tanulási nehézségek összefüggései Gósy Mária MTA Nyelvtudományi Intézete Kutatás, alkalmazás, gyakorlat A tudományos kutatás célja: kérdések megfogalmazása és válaszok keresése

Részletesebben

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision

Részletesebben

KOVÁCS BÉLA, MATEMATIKA I.

KOVÁCS BÉLA, MATEMATIKA I. KOVÁCS BÉLA, MATEmATIkA I. 4 IV. FÜGGVÉNYEk 1. LEkÉPEZÉSEk, függvények Definíció Legyen és két halmaz. Egy függvény -ből -ba egy olyan szabály, amely minden elemhez pontosan egy elemet rendel hozzá. Az

Részletesebben

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA A VALÓSZÍNŰSÉGI SZEMLÉLET ALAPOZÁSA 1-6. OSZTÁLY A biztos, a lehetetlen és a lehet, de nem biztos események megkülünböztetése Valószínűségi játékok, kísérletek események

Részletesebben