A beszédtechnológia jelene és jövıje



Hasonló dokumentumok
Beszédtechnológia az információs esélyegyenlőség szolgálatában

Beszédfelismerés alapú megoldások. AITIA International Zrt. Fegyó Tibor

Szerkesztők és szerzők:

Információs társadalom

Human-Computer Interaction

I formá m ció i s s t ársa s da d lo l m Ált l a t lá l nos s t u t dniva v ló l k B F D. B a B kon o yi P é P t é er c Fıi ı sk s ol o a l i tanár

Kitekintés a jövőbe: új technológiák és modellek a fogyatékkal élők szolgálatában

Personal Assistant to Enhance the Social Life of the Seniors. Szociális életet támogató személyes eszköz időseknek (AAL )

Jövő Internet Nemzeti Technológiai Platform

A Jövő Internet Nemzeti Kutatási Program bemutatása

Európa e-gazdaságának fejlıdése. Bakonyi Péter c. docens

Definiciók. Definiciók. Európa e-gazdaságának fejlıdése. Szélessávú hozzáférés-ezer. Web felhasználók- Európa-fejlett része

SZTE Nyílt Forrású Szoftverfejlesztő és Minősítő Kompetencia Központ

AZ INFORMÁCIÓS TÁRSADALOM TECHNOLÓGIAI TÁVLATAI. Detrekői Ákos a Nemzeti Hírközlési és Informatikai Tanács elnöke Székesfehérvár,

IPv6 A jövő Internet alaptechnológiája

Mobil Üzleti Intelligencia

Üzleti lehetőségek a nyílt forráskódú fejlesztésben

Szintetizált beszéd természetesebbé tétele

A kezdeményezés célkitűzése

IKT trendek és tapasztalatok a BME szemszögéből

MÉRNÖK-SZÓTÁR. számítógépes program rendszer. magyar-angol-német-orosz és más nyelvek. Mérnökök által összeállított szakmai szótárak, szakembereknek!

JövőInternet kísérleti rendszerek. Vattay Gábor ELTE Komplex Rendszerek Fizikája Tanszék

Kompetenciák fejlesztése a pedagógusképzésben. IKT kompetenciák. Farkas András f_andras@bdf.hu

Broadband Barométer - Magyarország

- átfogó cél: munkaerı-piaci aktivitás növelése a humán erıforrás minıségének, foglalkoztathatóságának javításán keresztül

DIGITÁLIS KOMPETENCIA FEJLESZTÉSE TANÍTÁSI ÓRÁKON

A kreatív iparág és az új média összefonódása

Szolgáltatási szint és performancia menedzsment a PerformanceVisor alkalmazással. HOUG konferencia, 2007 április 19.

A JÖVŐ INTERNET KUTATÁSKOORDINÁCIÓS KÖZPONT SZERVEZETI ÉS MŰKÖDÉSI SZABÁLYZATA

A VIRTUÁLIS IRODA szolgáltatás ismertetése

Sulinet + projekt. Mohácsi János Hálózati igh. NIIF Intézet október 21. Sulinet + projekt mérföldkő Budapest

Az OpenScape Business rendszerek egységes architektúrára épülnek: Rugalmas, skálázható és megbízható

A magánhangzó-formánsok és a szubglottális rezonanciák összefüggése a spontán beszédben

Elektronikus kereskedelem

Biztonság az FP7-ben. Az Együttmőködés program SECURITY témaköre. SZELES Ágnes NKTH, SEC NCP

Az NIIF Intézet és a ÚMFT TÁMOP programok bemutatása

KOPI. KOPI A fordítási plágiumok keresője MTA SZTAKI DSD. Pataki Máté Kovács László. Department of Distributed Systems

Az információs társadalom európai jövőképe. Dr. Bakonyi Péter c. Főiskolai tanár

és s mobil kommunikáci Learning Konferencia

A Web-alapú tudásbázis a logisztika és kereskedelem területén (WebLogTrade) projekt bemutatása

Nyelv-ész-gép Új technológiák az információs társadalomban

FELHŐ és a MAINFRAME. Irmes Sándor

A világ legkisebb bankfiókja

Új generációs hálózatok. Bakonyi Péter c.docens

Takács Árpád K+F irányok

Mesterséges Intelligencia Elektronikus Almanach. Megnyit. MI Almanach projektismertetı rendezvény április 29., BME, I. ép., IB.017., 9h-12h.

Együttmőködési rendszerek, csoporttevékenység támogatása 2. rész

2009. június 18. TUDÁSMENEDZSMENT STRATÉGIÁN ALAPULÓ SZAKKÖNYVTÁRI SZOLGÁLTATÁS AZ NHH-NÁL

Beszerelési és használati útmutató. Tartalomjegyzék

Arculat fontossága & Akadálymentesítés

stratégiai kutatási terve

A JÖVİ IT SZERVEZETE. Technológia által vezérelt változó környezet, dr.antal Erzsébet managing partner Nobel Management Consulting

Az e-learning-től az u-learning-ig


Zsiday Krisztina Európai szintő Képzés Képzıknek

Google App Engine az Oktatásban 1.0. ügyvezető MattaKis Consulting

Hogyan tudom soros eszközeimet pillanatok alatt hálózatba kötni?

Miért olyan fontos a minıségi pont?

NetWare 6. bemutató. Szittya Tamás. ügyvezető igazgató. The Power to Change

20 éves a Térinformatika Tanszék

Informatikai kommunikációs technikák a beszállító iparban

ekörnyezetvédelmi szolgáltatások az INSPIRE keretében Márkus Béla Giorgio Saio

KISKÖRE VÁROS ÖNKORMÁNYZATA POLGÁRMESTERI HIVATAL. Szervezetfejlesztés Kisköre Város Polgármesteri Hivatalában ÁROP-1.A.2.

Üzleti és Közszolgálati informatika szakirányok. Tanszék

InfoVista újdonságok. Sándor Tamás. fımérnök. SCI-Network Távközlési és Hálózatintegrációs zrt. T.: F.:

TAKARNET24 szolgáltatásai

FEJLESZTÉSEK A SZÁMÍTÁSTECHNIKA ALKALMAZÁSA TERÉN

WEB2GRID: Desktop Grid a Web 2.0 szolgálatában

BME IPAR 4.0 TECHNOLÓGIAI KÖZPONT. Kovács László

e-aláírás és az e-fizetés bevezetése a földhivatali szolgáltatásoknál

Magyarország első borturisztikai applikációja

Dr. Bakonyi Péter c. docens

A cloud szolgáltatási modell a közigazgatásban

OZEKI Phone System. 4 elengedhetetlen szolgáltatás a jövőbeli vállalati telefonos rendszerek számára. A jövő üzleti telefon rendszere SMS

Új ipari forradalom a térinformatikában

Cloud Computing a gyakorlatban. Szabó Gyula (GDF) Benczúr András (ELTE) Molnár Bálint (ELTE)

Nehézségek és lehetőségek a magyar információs társadalom építésében

APPLE MAGYARORSZÁGI KÉPVISELET

AZ INFORMÁCIÓS TÁRSADALOM INFORMÁCIÓ- BIZTONSÁGA

Infokommunikáció a közlekedésben (VITMJV27)

c. Fıiskolai tanár IT fogalma, kialakulása 1

SmartActive Squash - IoT sportanalitika a felhőben

Korszerű oktatási környezet kialakítása az eenvplus projektben. Márkus Béla

Intelligens biztonsági megoldások. Távfelügyelet

XI. Az EEM informatikai támogatása

20 éves Szombathely város térinformatikai rendszere

JABRA MOVE WIRELESS. Használati útmutató. jabra.com/movewireless

Informatikai ellenırzések, az informatika szerepe az ellenırzések támogatásában

IV.4. FELHŐ ALAPÚ BIZTONSÁGOS ADATTÁROLÁSI MÓDSZER ÉS TESZTKÖRNYEZET KIDOLGOZÁSA

E mail titkosítás az üzleti életben ma már követelmény! Ön szerint ki tudja elolvasni bizalmas leveleinket?

A Jövő Internet Nemzeti Kutatási Program és eredményei

SDL Trados szervermegoldások. Szekeres Csaba SDL Trados partner M-Prospect Kft.

Önkormányzati és. kistérségi infokommunikációs kihívások. Lengyel György projekt igazgató. SCI-Network Távközlési és Hálózatintegrációs Rt.

Nemzetközi és hazai fejlemények az információ és hálózatbiztonság terén

Alter Róbert Báró Csaba Sensor Technologies Kft

Tarts lépést a fogyasztói igényekkel!

INTELLIGENCE ON YOUR SIDE

Oracle9i Alkalmazás Szerver Üzleti folyamat integráció. Molnár Balázs Vezető értékesítési konzultáns Oracle Hungary

Alacsony fogyasztású IoT rádiós technológiák

nyzati igazgatásban szeptember 09. KESZTHELY Pajna SándorS vezérigazgat rigazgató

Átírás:

A beszédtechnológia jelene és jövıje Németh Géza BME Távközlési és Médiainformatikai Tanszék Beszédtechnológiai Laboratórium nemeth@tmit.bme.hu Nyelv- és Beszédtechnológiai Nemzeti Technológiai Platform Szakmai Fórum 2010. március 18. BME TMIT 1

Tartalom Miért fontos? Hazai helyzetkép nemzetközi kontextusban Kihívások BME TMIT 2

Miért fontos? Mit mond? Nyelvi tartalom felismerése, szöveglejegyzés Ki beszél? Beszélı felismerés Ideges? Bánatos? Érzelem felismerés Milyen nyelven beszél? Nyelvfelismerés Meg van fázva? Egészségi állapot felismerés BME TMIT 3 BME TMIT

Miért fontos? Várható forradalmi változások az ICT (Information & Communication Technologies) területen (2005-15) Hálózatok (networking) Számítástechnika (computing) Mobilitás (mobility) Felhasználói felületek (human interface) Alkalmazások (applications) [Gartner symp. 2002. nov.] BME TMIT 4

Miért fontos? Hype Cycle 2002-2006 VISIBILITY Natural Language Search 2002 Web services Legend: Time to plateau Less than two years Two to five years Five to ten years Beyond ten years Nanocomputing Technology trigger Natural Language Search 2006 Wireless Web Peak of inflated expectations PDA phones Speech Recognition in Call Centers 2002, 2006 VoIP PKI Bluetooth E-payment Speech Recognition on Desktop 2002, 2006 Trough of Disillusionment [Gartner Hype Cycle 2002, 2006] Slope of Enlightenment Text-to-speech 2002, 2006 Wireless LAN 802.11 MATURITY Plateau of Productivity BME TMIT 5

Miért fontos? Az interaktív információs rendszerek felhasználói köre hazánkban Internetes számítógép tényleges használó a lakosság 51.6%-a (KSH, 2007) ténylegesen interneten vásárló a lakosság 6.9%-a Mobiltelefon SMS-írásra képes kb. 60% hangkapcsolatra képes közel 100% Vezetékes telefon Hangkapcsolatra képes közel 100% Mindenkit elérı automatizált interaktív információ-szolgáltatást csak a beszédtechnológia eredményeinek felhasználásával lehet nyújtani. BME TMIT 6

Hazai helyzetkép (1) Ahogy egy cég vizuális arculatát szakértık csapata alakítja ki, egy beszédinformációs rendszereket alkalmazó cégnél szakértıknek kéne az akusztikus arculattal is foglalkozni. Furcsa, hogy olyan cégek, amelyek elsıdlegesen beszédkapcsolatból élnek, a saját beszédminıségük, -beleértve annak nyelvi színvonalát- fontosságát lassan ismerik fel BME TMIT 7

Hazai helyzetkép (2) Az áttörés megtörtént a beszédtechnológia használható! Használható: kisebb költséggel, többet tud a gép, mint az ember?! Igen! Ki tudja 200 óra hangzó híranyagban megtalálni a megadott 1000 kulcsszó ~50%-át 24 óra alatt (pl. www.mindroom.hu )? 2 db (4 magos) CPU képes rá! (RTF<1 /mag) 2 ember, > 2 hét csak lehallgatás (RTF>1 /fı) 12 ember, > 2 hét teljes lejegyzés (RTF>6 /fı) Áramdíj < 2 eft Munkadíj > 200 eft / 1.2 MFt BME TMIT 8

Hazai helyzetkép (3) Az áttörés megtörtént a beszédtechnológia használható! Használható: többet tud a gép, mint az ember?! Igen! Ki képes egy nagyváros összes lakosának ~250.000 fı nevét és lakcímét elsı hallásra 10 esetbıl min. 9-szer hibátlanul leírni? 1 db CPU képes rá (+ beszédtechnológia)! 0 sec válaszidı!! Áramdíj, válaszidı: ~ 0 visszakérdezések, hibák BME TMIT 9

Hazai helyzetkép (3) Az áttörés megtörtént a beszédtechnológia használható! Használható: kisebb költséggel, többet tud a gép, mint az ember?! Igen, igen! A beszédszintetizátor bármit kimond Nem fárad el, nem reked be Ha kérik, gyorsabban beszél, ha kérik, lassabban Nem sértıdik meg, ha a felmenıit emlegetik pl. www.metnet.hu BME TMIT 10

Hazai helyzetkép (4) Név szerinti kapcsolás név-visszamondással (100-3000 név, izolált szavas) egy biztosítónál kísérleti rendszer Gyógyszervonal (5000 gyógyszernév, izolált szavas) Pozíció alapú hangos keresı (ATM, étterem, stb címe) Beszéd alapú híradó tartalom keresı (www.mindroom.hu) Lehetséges lenne: földhivatali ingatlan nyilvántartás helyrajzi szám, cégnyilvántartás lekérése adószám, gépkocsi nyilvántartás rendszám, tulajdonos neve, címe adótartozás adószám alapján történı automatikus elérése telefonon BME TMIT 11

Hazai helyzetkép (5) Gyógyszervonal információs rendszer (www.gyogyszervonal.hu, tel: 886 94 90) Gyógyszerek betegtájékoztatójának gépi felolvasása 5500 adatrekord feldolgozása alapján 2005-7 között a GVOP Program projekt keretében kifejlesztve Üzemelteti az Országos Gyógyszerészeti Intézet Nagyszótárú telefonos, személyfüggetlen, magyar nyelvő beszédfelismerı és gyógyszertájékoztatásra adaptált szövegfelolvasó + Web és Wap Világszerte egyedülálló megoldás (EU szerint minta projekt) Hasonló témákban ilyen jellegő információs rendszerek létrehozására partnereket keresünk BME TMIT 12

Jelentısen eltérı kategóriák létezı szolgáltatás (személyes ismerıs) automatizálása részben (ismeretlen emberi kezelı) teljesen (csak gépi hang) új szolgáltatás létrehozása (testreszabott információk, pl. tömeges egységes üzenetkezelés, egyéni út- és hójelentés, Google voice search, MS project Natal ) multik nyelvi sorozatfejlesztése <-> használhatóság pl. Google nyomulás magyar média tájékozatlansága A minıségi beszédtechnológia NEM VÁSÁROLHATÓ KÉSZTERMÉK, a jó integráció a siker kulcsa. Kihívások (1) BME TMIT 13

Kihívások (2) Kulcsterületek Infrastruktúrák Adatbázisok Eszközrendszerek Zajos környezet (pl. gépjármő) Távoli mikrofon (pl. környezeti intelligencia) Természetes (spontán) beszéd feldolgozása (felismerés és szintézis) Nyelvcsaládokra alkalmazható módszerek Skálázható technológiák (kis fogyasztású, szenzor jellegő mobiltelefon telepített számítógép) BME TMIT 14

Kihívások (3) Szakpolitikai és politikai tényezık közbeszerzéseknél elıírhatná a kormány bizonyos nyelv- és beszédtechnológiai erıforrások használatát, illetve ezek folyamatos karbantartását a kormányzat sokat tehetne (ha ismerné a technológiai lehetıségeket) szabályozással, illetve a kormányzati projektek (pl. portál, esélyegyenlıség) szolgáltatásainak és folyamatainak a fejlesztésével Nemzetközi kutatási projektekhez, hazai interdiszciplináris együttmőködésekhez való kapcsolódás támogatása az ingyenes (de rosszabb minıségő) megoldások eltéríthetik a kormányzati figyelmet tipikus (ál)hír: az adott problémához tartozó erıforrást már létrehozta valamelyik nagy multi (Google, MS stb.) közbeszerzési szempontrendszer normatív kialakítása BME TMIT 15

Nyelvi példa Angol, német és magyar korpuszok fedési tulajdonságai fedési % 100% 95% 90% 85% 80% 75% 70% 65% 60% 55% 50% 45% 40% 35% 30% 25% 20% 15% 10% 5% 0% 1 10 100 1000 10000 100000 1000000 Leggyakoribb alakok sorba rendezve English German Hungarian Hungarian2 BME TMIT 16

Következtetés Mindenkit elérı felhasználóbarát automatizált interaktív információ-szolgáltatást már ma is lehet hazánkban nyújtani a beszédtechnológia eredményeinek felhasználásával!!! Ma a kritikus kérdés a köztudatba és a hétköznapi életbe bevinni az itthon létrejött eredményeket ill. biztosítani a K+F infrastruktúra folyamatosságát! BME TMIT 17

Érdeklıdéssel várom javaslataikat, kérdéseiket, megjegyzéseiket itt (hozzászólás idıben) valamint a nemeth@tmit.bme.hu emil (drótposta,...) címen Hozzászólások Köszönjük az NKTH támogatását. BME TMIT 18