Beszédfelismerés. Benk Erika



Hasonló dokumentumok
Beszédfelismerés, beszédmegértés

A beszéd. Segédlet a Kommunikáció-akusztika tanulásához

Beszédfelismerés. Izolált szavas, zárt szótáras beszédfelismerők A dinamikus idővetemítés

Rejtett Markov Modell

A HANGOK TANÁTÓL A BESZÉDTECHNOLÓGIÁIG. Gósy Mária. MTA Nyelvtudományi Intézet, Kempelen Farkas Beszédkutató Laboratórium

Intelligens Rendszerek Elmélete. Versengéses és önszervező tanulás neurális hálózatokban

BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA

Mérési struktúrák

Beszédfelismerés alapú megoldások. AITIA International Zrt. Fegyó Tibor

Akusztikai mérések SztahóDávid

2006. szeptember 28. A BESZÉDPERCEPCI DPERCEPCIÓ. Fonetikai Osztály

Grafikonok automatikus elemzése

Idősorok elemzése. Salánki Ágnes

Beszédészlelés 1: Beszédpercepció. A beszédpercepció helye a beszédmegértési folyamatban

Infobionika ROBOTIKA. X. Előadás. Robot manipulátorok II. Direkt és inverz kinematika. Készült a HEFOP P /1.0 projekt keretében

V. Kétszemélyes játékok

Méréselmélet MI BSc 1

Beszédfeldolgozási zavarok és a tanulási nehézségek összefüggései. Gósy Mária MTA Nyelvtudományi Intézete

Mély neuronhálók alkalmazása és optimalizálása

Információ / kommunikáció

Beszédfelismerés. Bálint Enikő

1. Nagy betűk - először a magánhangzók: A E U Ú I Í O Ó É Á Ü Ű Ö Ő - utána a mássalhangzók: M L H T S K R N B Z G V D SZ P C GY J CS NY F TY ZS LY

Vizuális nyelv. Olvasás és írás. Ellis, W. (2004) Olvasás, írás és diszlexia október

Beszédadatbázisok a gépi beszédfelismerés segítésére

Navigáci. stervezés. Algoritmusok és alkalmazásaik. Osváth Róbert Sorbán Sámuel

Gépi tanulás a gyakorlatban. Bevezetés

Nyelvtan. Most lássuk lépésről lépésre, hogy hogyan tanítunk meg valakit olvasni!

ÉS S NYELVI REPREZENTÁCI CIÓ. MTA Nyelvtudományi Intézet

Tartalomjegyzék. Rövidítések jegyzéke... EMBER, NYELV, BESZÉD. 1. A beszéd és az információs társadalom... 3

book 2010/9/9 14:36 page v #5

Számítógépes döntéstámogatás. Genetikus algoritmusok

Távérzékelés a precíziós gazdálkodás szolgálatában : látvány vagy tudomány. Verőné Dr. Wojtaszek Malgorzata

Lőre Vendel- Csigó Györbiró Alpár Üzleti szimulációk az oktatásban

Mesterséges intelligencia, 7. előadás október 13. Készítette: Masa Tibor (KPM V.)

A beszédpercepció és az anyanyelv fonotaxisa. Bevezetés a társas-kognitív nyelvészetbe Fehér Krisztina március 21.

Idő és tér. Idő és tér. Tartalom. Megjegyzés

EMELT SZINT ÍRÁSKÉSZSÉG ÉRTÉKELÉSI ÚTMUTATÓ. Minta. Értékelési szempontok

Az éghajlati modellek eredményeinek alkalmazhatósága hatásvizsgálatokban

Beszédinformációs rendszerek. 3. gyakorlat - Elemi jelfeldolgozás (a beszédjel feldolgozásának lépései)

TDK-dolgozat. Kis szótáras beszédfelismerő hatékonyságának vizsgálata különböző jel-zaj viszonyokkal

Beszédfelismerés és szintézis tételek:

AZ ORSZÁGOS KOMPETENCIA MÉRÉS EREDMÉNYEINEK ÉRTELMEZÉSE 4. osztály AZ OLVASÁSKÉSZSÉG KIÉPÜLÉSE

Algoritmusok és Adatszerkezetek II. utolsó előadás Beszédtechnológiai algoritmusok. (csak egy kis felszínkapargatás)

ÉRZÉKELŐK ÉS BEAVATKOZÓK I. 3. MÉRÉSFELDOLGOZÁS

Rekurzió. Dr. Iványi Péter

Megerősítéses tanulás 7. előadás

A hálózattervezés alapvető ismeretei

Számítógép felépítése

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

társadalomtudományokban

Kémiai reakciók mechanizmusa számítógépes szimulációval

Erdő generálása a BVEPreproc programmal

Beszédfelismerés hatékonyságának vizsgálata különböző nyelvtanokkal

Szimuláció RICHARD M. KARP és AVI WIGDERSON. (Készítette: Domoszlai László)

Szójegyzék/műszaki lexikon

Információ megjelenítés Alapok

Automaták és formális nyelvek

Populációbecslések és monitoring

Nyerni jó évfolyam

sallang avagy Fordítótervezés dióhéjban Sallai Gyula

Statisztikai eljárások a mintafelismerésben és a gépi tanulásban

A középszintű szóbeli vizsga értékelési útmutatója. Orosz nyelv. Általános útmutató

Hidraulikus hálózatok robusztusságának növelése

Mesterséges neurális hálózatok II. - A felügyelt tanítás paraméterei, gyorsító megoldásai - Versengéses tanulás

A beszédstílus meghatározó tényezői és temporális jellemzői

Értékelési útmutató a középszintű szóbeli vizsgához. Angol nyelv

Digitális mérőműszerek

Felvételi tematika INFORMATIKA

Modell alapú tesztelés mobil környezetben

Az énekelt magánhangzók észlelése réshangkörnyezetben

Mesterséges Intelligencia MI


N É Z D - H A L L D - ÉREZD- M O N D D! A Z É S Z L E L É S n o v e m b e r 1 4.

Beszédadatbázis irodai számítógép-felhasználói környezetben

dimeb Dinet Logisztika Kft Technológia munkavédelmi szakembereknek és szolgáltatóknak. Hatékonyság - Minőség - Innováció.

Bevezetés a nyelvtudományba. Számítógépes nyelvészet

AUTOMATIKUS FONETIKUS ÁTÍRÁS MAGYAR NYELVŰ BESZÉDFELISMERÉSHEZ. Mihajlik Péter Tatai Péter

Gépi tanulás és Mintafelismerés

KÖZÉPSZINT BESZÉDKÉSZSÉG ÉRTÉKELÉSI ÚTMUTATÓ

S0-02 Típusmodellek (Programozás elmélet)

Kontrollcsoport-generálási lehetőségek retrospektív egészségügyi vizsgálatokhoz

Rendszer szekvencia diagram

NÉGYESI IMRE 1. A mesterséges intelligencia és a hadsereg II. (Beszédfelismerő rendszerek I.)

A napsugárzás mérések szerepe a napenergia előrejelzésében

TT elősegítő eszközök

Soros felépítésű folytonos PID szabályozó

Digitális mérőműszerek. Kaltenecker Zsolt Hiradástechnikai Villamosmérnök Szinusz Hullám Bt.

1 Rendszer alapok. 1.1 Alapfogalmak

Újfajta, automatikus, döntési fa alapú adatbányászati módszer idősorok osztályozására

Terület- és térségmarketing. /Elméleti jegyzet/

ÁLLAPOTFÜGGŐ KARBANTARTÁST SEGÍTŐ INTEGRÁLT DIAGNOSZTIKAI RENDSZER. Dr. Nagy István, Kungl István. OKAMBIK Pécs, április

Bevezetés Standard 1 vállalatos feladatok Standard több vállalatos feladatok 2017/ Szegedi Tudományegyetem Informatikai Intézet

Sztöchiometriai egyenletrendszerek minimális számú aktív változót tartalmazó megoldásainak meghatározása a P-gráf módszertan alkalmazásával

Területi elemzések. Budapest, április

Webanalitika a mindennapokban

Mesterséges intelligencia 3. laborgyakorlat

Informatika Rendszerek Alapjai

Adatszerkezetek Adatszerkezet fogalma. Az értékhalmaz struktúrája

Új típusú döntési fa építés és annak alkalmazása többtényezős döntés területén

Neurális hálózatok bemutató

Átírás:

Beszédfelismerés Benk Erika

Tartalom Történelmi áttekintő Miért nehéz a beszédfelismerés? A felismerők képességeinek csoportosítási szempontjai Jelenlegi alkalmazások Felismerési megközelítések Előfeldolgozási módszerek Alakfelismerésen alapuló felismerési módszerek Dinamikus idővetemítés Rejtett Markov modellek Ismeretalapú beszédfelismerő rendszerek Dialógusrendszerek

Történelmi áttekintő - célkitűzések olyan szoftver/hardver készítése, amely a beszédjelet írott alakra konvertálja írott gép, amelynek diktálni lehet a század első felében - a távközlés motiválta a beszéd vizsgálatát a feldolgozási eljárások legtöbbje a beszédkódolásból származó módszereken alapszik

ötvenes hatvanas évek - digitális technológiai fejlődése a területen zajló kutatásnak újabb lökést adott rövid beszédszeleteket próbáltak fonémaként besorolni hosszabb egységeket esetében az időbeli változatosságot (rövidülés, nyúlás) még nem képesek kezelni

Hosszabb egységek esetén két megoldási javaslat: a beszédet fonémákra kell szegmentálni, majd pedig a szegmenseket kell felismerni nagyobb egységeket (pl. szavakat) kell venni és az időtengely menti lehetséges torzulásokat ún. dinamikus idővetemítéssel kell kezelni a hetvenes éveket az utóbbi megoldás letisztulása és elterjedése jellemzi

hetvenes évek - megpróbálják a felismerés során felhasználni a magasabb szintű (lexikális, szintaktikai, szemantikai) információkat beszédfelismerés helyett beszédmegértés célkitűzésük - a rendszer helyesen reagáljon az elhangzott utasításra - a mondanivaló lényegét kellett megérteni

nyolcvanas évek: az ismeretalapú rendszerek iránti érdeklődés megcsappant folyamatos beszédfelismerésre a dinamikus idővetemítési módszert ún. kapcsolt szavas felismeréssé egészítették ki rejtett Markov-modell alapú felismerés - alapja, hogy minden felismerendő egységhez tartozik egy valószínűségi modell, amely egy adott megfigyelést valamilyen valószínűséggel generál, kimeneteként a legnagyobb valószínűséget adó modellt választjuk

90-es évek: HMM alapú rendszerek dominálnak óriási adatbázisok készültek, melyek segítségével a felismerők rejtett Markov modelljei egyre több tanítandó paramétert tartalmazhatnak utóbbi évek multimédia elterjedése a személyi számítógépek is képesek beszédfelismerésen alapuló alkalmazások futtatására - fejlődés miatt

Tartalom Történelmi áttekintő Miért nehéz a beszédfelismerés? A felismerők képességeinek csoportosítási szempontjai Jelenlegi alkalmazások Felismerési megközelítések Előfeldolgozási módszerek Alakfelismerésen alapuló felismerési módszerek Dinamikus idővetemítés Rejtett Markov modellek Ismeretalapú beszédfelismerő rendszerek Dialógusrendszerek

Miért nehéz a beszédfelismerés? a beszéd legkisebb egysége - fonéma (ez általában a betű) a beszéd változatos - mert nemcsak az általunk kivonni próbált mondandót kódolja, hanem számtalan egyébb információt is

Kihívások Fonetikai változatosság a beszédkeltés során nem rögzített alakú fonémákat fűzünk egymás után, hanem folytonosan változtatjuk hangkeltő szerveink alakját, amiből következően a szomszédos hangoktól függően a beszédhang megváltozhat

Akusztikai változatosság a beszédjelbe bekerülhet a környezetbőlbeszűrődő zaj, vagy a jel torzulhat a mikrofon vagy az átviteli csatorna paramétereitől függően Beszélők közti változatosság különböző beszélők hangmagassága, szájüregmérete, beszédsebessége, dialektusa stb. meglehetősen különbözhet

Adott beszélő esetén fennálló változatosság még ha rögzítjük is a beszélőt, akkor is meglehetős eltéréseket mutat a beszéd, hisz a beszélő fizikai és lelkiállapota is belekódolódik a beszéd sebességébe, a hang minőségébe, hanglejtésbe

Tartalom Történelmi áttekintő Miért nehéz a beszédfelismerés? A felismerők képességeinek csoportosítási szempontjai Jelenlegi alkalmazások Felismerési megközelítések Előfeldolgozási módszerek Alakfelismerésen alapuló felismerési módszerek Dinamikus idővetemítés Rejtett Markov modellek Ismeretalapú beszédfelismerő rendszerek Dialógusrendszerek

A felismerők képességeinek csoportosítási szempontjai A beszédjel minősége ezt befolyásolja a zajszint, a zaj típusa (stacionárius vagy gyorsan változó), a mikrofon ill az átviteli csatorna minősége. 3 kategóriára lehet egyszerűsíteni: stúdióminőség, irodai minőség, telefonminőség A beszéd módja lehet izolált szavas (egyetlen szót kell csak felismerni, ill a szavak között rövid szünetet kell tartani), ill. folyamatos beszéd

Beszélőfüggőség egyetlenbeszélő hangjára kell csak figyelni, beszélőfüggetlenség esetén bárkiére. A kettő között képez átmenetet az adaptív felismerő, amely fokozatosan megtanulja a beszélő hangját, azaz beszélőfüggetlenségből beszélőfüggővé alakul

A szótár mérete hány szó fordulhat elő a beszédben. Kis szótáras felismerő 10-100, közepes 1-2 ezer, nagyszótáras pedig több tízezer szót képes felismerni A nyelvi kötöttség foka egy speciális szituációban (vonatjegy rendelése) a lehetséges mondatok mind szintaktikailag, mind szemantikailag rendkívül kötöttek, sőt a párbeszéd is modellezhető

Tartalom Történelmi áttekintő Miért nehéz a beszédfelismerés? A felismerők képességeinek csoportosítási szempontjai Jelenlegi alkalmazások Felismerési megközelítések Előfeldolgozási módszerek Alakfelismerésen alapuló felismerési módszerek Dinamikus idővetemítés Rejtett Markov modellek Ismeretalapú beszédfelismerő rendszerek Dialógusrendszerek

Jelenlegi alkalmazások Irányítás csupán néhány tucat vezényszót kell felismerni (olyan rádiótelefon, mely betanítható hogy utasításra tárcsázzon) többnyire csak izolált szavakat kell felismerni egyszerű esetekben a szókincs is olyan kicsi hogy az összeset be lehet mondatni a felhasználóval ha a vezényszavak elég különbözőek, megbízható felismerés érhető el

Jelenlegi alkalmazások Diktálóprogramok a feladat - hangról hangra leírni az elhangzott szöveget, bármiről legyen is szó, és bármilyen szavakat használjon is a beszélő a nyelvtan a lehető legszabadabb, és a szótár a lehető legnagyobb - ezért az akusztikai-fonetikai szintű felismerésnek kell nagyon erősnek lennie a szintaktika és szemantika kezelésére - sztochasztikus nyelvi modellek - becslést adnak arra, hogy egy szó milyen valószínüséggel fordulhat elő nagyon tiszta beszédet igényelnek, továbbá erősen beszélőfüggőek

Jelenlegi alkalmazások Dialógusrendszerek legtöbbször telefonos alkalmazások, amikor a gép és a felhasználó párbeszédet folytat a párbeszéd célja lehet valamely adat lekérdezése adott adatbázisból, vonatjegy rendelése stb. A beszéd szükségszerűen zajos és folyamatos, beszélőfüggetlen felismerőre van szükség, vagyis az akusztikai-fonetikai szint megbízhatatlanul működik

a szókincs kicsi (1-2ezer szó), a mondatok felépítése könnyen leírható, sőt a párbeszéd is megtervezhető dialógus modellezés egy kérdés válasz kör a köv. lépésekből épül fel: beszédfelismerés, nyelvi elemzés, szemantikai elemzés, adatbázis lekérdezés, válaszgenerálás

Tartalom Történelmi áttekintő Miért nehéz a beszédfelismerés? A felismerők képességeinek csoportosítási szempontjai Jelenlegi alkalmazások Felismerési megközelítések Előfeldolgozási módszerek Alakfelismerésen alapuló felismerési módszerek Dinamikus idővetemítés Rejtett Markov modellek Ismeretalapú beszédfelismerő rendszerek Dialógusrendszerek

Felismerési megközelítések és felismerőrendszer arhitektúrák a leghagyományosabb előfeldolgozási technika a spektrogram kiszámítása a felismerés a változatosságot okozó tényezők miatt (zaj, beszédsebesség) hipotézisek folyamatos felállítása, finomítása és elvetése a környezet és nyelvi információk mérlegelése és összevetése alapján - ezt a folyamatot szimulálják az ismeretalapú beszédfelismerők

ismeretalapú felismerők módszerei bottom up módszer: a jel először valamilyen jelfeldolgozó transzformáción esik át ebből különféle jellemzők kerülnek detektálásra ezt követi a jel szegmentálása, majd a szegmensek azonosítása. Ez a módszer azonban nem elég hatékony

ismeretalapú felismerők módszerei top down arhitektúra: a nyelvi rész kezdi a hipotézisek generálását, melyek köre lefelé haladva szűkül Ez a megközelítés akkor jó, ha kicsi a szókincs és a mondatok kötöttek, a fonetikai rész viszont megbízhatatlan (zaj, folyamatos beszéd)

Előfeldolgozási módszerek célja a felismerés szempontjából fontos jellemzők kiszűrése (lényegkiemelés) és ennek az információnak a tömör reprezentálása arról ad információt, hogy az energia hogyan oszlik el az idő és a frekvencia függvényében (energiatérkép)

Alakfelismerésen alapuló felismerési módszerek Dinamikus idővetemítés (DTW, Dynamic Time Warping) Rejtett Markov modellek

Dinamikus idővetemítés célja a nagyobb egységek, tipikusan szavak összemérhetőségének biztosítása ezeken az egységeken (szó) értelmezett távolságfüggvényt ad A módszer lényege: kiválasztjuk az előfeldolgozó módszert, illetve a módszer vektoraihoz tartozó távolságfüggvényt, majd definiálni kell a távolságot két szó között

tételezzük fel, hogy a szavak végpontjait valamilyen módszerrel megtaláltuk a referenciaszóból kaptunk egy R(1),...,R(N) vektorsorozatot, a tesztszóból pedig egy T(1),...,T(M) vektorsorozatot, és ezek távolságát szeretnénk definiálni rendeljük össze R és T vektorait minden lehetséges módon, és minden ilyen összerendelésre számoljuk ki az össztávolságot A két szó távolságát ezen távolságok minimumaként definiáljuk

Az idővetemítés feladata azon útvonal megtalálása, amely mentén az össztávolság minimális, ezt az értéket tekintjük a két szó távolságának Megkötések a keresési tér csökkentésére: a szavak eleje és vége pontosan egymáshoz legyen rendelve az útvonal értéke mindkét tengely mentén monotonon nőjön (a beszéd időben nem fordul vissza) minden szóhoz több bemondás alapján kell egy referenciamintát előállítani

Rejtett Markov modellek A modell definiálása: a modellnek van N darab lehetséges állapota, amelyet 1-től N-ig terjedő egész számokkal jelölünk q t az az állapot, amelyben a modell a t időpillanatban van a modell az adott állapotban megfigyeléseket bocsát ki, a megfigyelések a V=(v 1,...v M ) halmazból kerülnek ki, ahol M a lehetséges megfigyelések száma

a megfigyelések kibocsátásának valószínűsége csakis attól függ hogy melyik állapotban van éppen a modell. A j állapotban a k indexű megfigyelés kibocsátásának valószínűsége b j (k) = P(o t = v k q t = j ), 1<=k<=M, 1<=j<=N, ahol o t az általunk érzékelt megfigyelés a t-edik időpillanatban minden egyes megfigyelés kibocsátása után a modell átmegy egy másik állapotba, ennek valószínűsége: a ij = P(q t+1 =j q t = i), 1 <= i,j <=N

hogy melyik állapotból indulunk az elején, azt a п-vel jelölt kezdőállapoteloszlás határozza meg, п i annak a valószínűsége hogy az i állapot kezdőállapot A modell működése: t=1, a modell q1 kezdőállapotba kerül, amelynek kiválasztása a п valószínűségének megfelelően történik A model kibocsájtja az o t megfigyelést, amely az adott állapotban érvényes b j (k) valószínűségeknek megfelelően kerül kiválasztásra

átmegyünk t+1 állapotba, amelynek kiválasztása a vonatkozó a ij valószínűségek alapján történik t=t+1, ha t=t, készen vagyunk, különben ismét a második lépés következik gyakorlatban - minden szóhoz tartozik egyegy modell

Folyamatos beszéd rejtett Markov-modellel

Folyamatos beszéd felismerése rejtett Markov-modellekkel A HMM előnye, hogy elég egyszerűen kiterjeszthető nagyszótáras, folyamatos beszéd felismerésére Nagy szótár esetén a szó nem használható felismerési alapegységként - fonémákból kell építkezni A fonémák összekapcsolásából kapjuk meg a szavak modelljeit, végül ezeket körbekapcsolva kapunk egyetlen nagy modellt

Minden fonémához egy háromállapotú modellt rendelnek középső állapot a fonéma viszonylag stabil magja a két szélső a szomszédos hangokhoz igazodó kezdő és záró szakasz Az ilyen, ún monofón modellezés előnye, hogy kb 45-50 elemi HMM-re van szükség, így viszonylag kevés tanítóadattal is betaníthatók.

különböző környezetben a fonémák két szélsőállapotának eltérő spektrális vektorokat kell kibocsátania Megoldás hogy a környezetfüggetlen monofónokat kiterjesztették környezetfüggő trifónokká - egy adott fonémához minden lehetséges környezetben külön modellt rendelünk (a: b-a-b, b-a-c...) óriási számuk miatt képtelenség betanítani - paramétesimítás

Ismeretalapú beszédfelismerő rendszerek akusztikai-fonetikai, fonológiai ismereteikre alapozzák a felismerést ha...akkor... típusú szabályok formályában A fonémák néhány kategóriába sorolhatók: magánhangzók - felpattanóhangok nazálisok - réshangok affrikáták

magánhangzók mivel ezek hosszan ejthető hangok, ezek vizsgálata a legkönnyebb. A beszéd legnagyobb energiájú részei, időfüggvényük periodicitást mutat, amely a spektrogrammon jellegzetes csíkozás formályában jelentkezik. Sajnos eléggé érzékenyek a környező hangokra, így a gyors beszédben még a középső részük is erősen eltérhet izolált ejtésükről.

Felpattanóhangok (p,b,t,k) csendrészből állnak, majd egy hirtelen, erőteljes energiakitörés következik. Sajnos ez a hirtelen energiakitörés alig található meg a spektrogrammon Nazálisok (m,n,ny) kisebb az energiájuk mint a magánhangzóknak. A spektrogrammon amolyan behorpadt magánhangzóknak néznek ki

Réshangok (s, sz, z, zs, v, f) egy magas frekvenciás energiafelhőként jelennek meg a spektrogrammon. A v és f könnyen elnézhetők, főleg szó elején teljesen el tudnak tűnni. Ha meg is találjuk őket, az f felpattanónak tűnhet, a v pedig nazálisokkal téveszthető össze Affrikáták (cs, dzs, dz) olyanok mint egy felpattanó és egy réshang egymás után, csak a felpattanás kevésbé jelenik meg

Egy spekrogramm kiértékelése: Először a biztos információkat értékeljük ki, a bizonytalanokra pedig csak akkor térünk vissza, ha szükséges. Ha valamiféle megoldásunk van, érdemes szótárral ellenőrizni, ez nagymértékben csökkenti a jelöltek számát. Első lépésben a szegmentálásnál nem kell tökéletességre törekedni. Inkább vegyük be az összes szegmenst, minthogy fonémát veszítsünk. Később lehet korrigálni a szegmentálást

Egy spekrogramm kiértékelése: A fonológiai tudás is segíthet (zöngés mássalhangzó az előtte álló mássalhangzót zöngéssé teszi) Spontán beszédben erős a koartikuláció, így sokszor csak a szomszédok legalább részleges beazonosítása után tudjuk azonosítani a fonémát

Tartalom Történelmi áttekintő Miért nehéz a beszédfelismerés? A felismerők képességeinek csoportosítási szempontjai Jelenlegi alkalmazások Felismerési megközelítések Előfeldolgozási módszerek Alakfelismerésen alapuló felismerési módszerek Dinamikus idővetemítés Rejtett Markov modellek Ismeretalapú beszédfelismerő rendszerek Dialógusrendszerek

Dialógusrendszerek 60-70-es években jelentek meg a kevés számú ide sorolható rendszer problémáit mindig egyedi módon, azaz elméletek helyett a józan észre hallgatva oldották meg a felhasználótól érkező kérés a beszédfelismerés után szintaktikai és szemantikai elemzésen esik át válasz - szintetizált beszéd formájában

elemzésénél nehézséget okoz, hogy az egymás után következő mondatok utalhatnak egymásra - ilyen mondatok közötti kapcsolatok kezelését célozza az ún párbeszéd-reprezentációs elmélet párbeszédek felépítését magyarázó elméletek : a párbeszéd struktúrája az azt felépítő mondatok jelentése alapján alakul ki a párbeszéd menetének fő vezérlője az, hogy a beszélőnk célja van a párbeszéddel

George W. Bush, a csevegőpartner A legemberibb mesterséges intelligenciának járó Loebner-díjat 2002-ben elnyert Ella továbbfejlesztett változata AI Bush A jelenlegi 1.0, kísérleti változat további finomításokra szorul, hiszen a virtuális elnök válaszai egyelőre nem elégítenek ki minden igényt a nyelv funkcionális aspektusaira helyezik a hangsúlyt

Sokoldalú, de dühíthető partner Grammatikailag hibátlan, teljes mondatokban válaszol Nem szereti, ha idegen nyelven (nem amerikai angolul) közelítünk hozzá, értelmetlen, zavaros kérdésekkel bombázzák, vagy káromkodunk Egyes szavakra, nevekre Bill Clinton, Oszama bin Laden szintén zavarba jön, s elveszíti a fonalat drogokról, abortuszról, alkoholizmusról, halálbüntetésről egyaránt szívesen, s nagy kedvvel elbeszélget.

A lexikális adatbázis kidolgozásához a Princeton Egyetem WordNet-jére támaszkodtak Használatukat osztályokba rendezett beszélgetési egységek, ill a virtuális könyvtárban tárolt mintegy százhúsz klasszikus és modern irodalmi mű segítik. AI Bush nagyszerű fejszámoló sakkozik, tanácsokat ad a huszonegyhez, sőt, a csomaghoz az elnök újraválasztása körül bonyolódó stratégiai játék (Reelect Bush?) is tartozik.

Újraválasztják, vagy sem? - játék A játékos George W. Bush tanácsadója a választási kampány során különböző forgatókönyvek - a legegyszerűbb kérdésektől a legsúlyosabbakig a játékos kezében a döntés közben felmérések is készülnek AI Bush nyomon követi népszerűségét, mi meg az ő lelkiállapotát Húsz stádium után tudjuk meg, ismét ő az Egyesült Államok elnöke, vagy sem