Beszédfelismerés és videó keresés web2 módra



Hasonló dokumentumok
Tevékenység: Lakossági igényfelmérés szolgáltatás eredményeinek a hasznosítása, második felmérés, november. Dokumentum: Tanácsadói dokumentum

Jelszó megjegyzése jelölınégyzet kiválasztásával automatikusan bejelentkezik, valahányszor elindítja a. My Instant Communicator alkalmazást.

Beszédtechnológia a médiában. Tibor Fegyó SpeechTex Kft.

NUUO Mainconsole Felhasználói útmutató

Könnyedén. és természetesen OPTEAMUS

LEGYEN A VÁLTOZÁS- KEZELÉS HŐSE!

Nekünk ebben a hónapban jött el a VAKÁCIÓ, ahogy ezt már megszokhatták az elmúlt években.

Tervezni pedig muszáj esettanulmány egy online piactérről

3C / DIY DVR H.264 Multiplex 4CH/8CH Network DVR Mobiltelefon/PDA/Egér támogatás ET-DVR / ET-DVR-08200

BME Menedzsment és Vállalatgazdaságtan Tanszék. Kérdőívszerkesztés. Kovács István

A Gyorstelepítés rövid leírását lásd a hátsó borítón.

Divar 2 - Vezérlőközpont. Kezelési útmutató

QUAD PROCESSZOR FIGYELMEZTETÉS! AVC703/713/704/ oldal, összesen: 19. Használati útmutató. Modell szám: AVC713 AVC714 AVC703 AVC704

HP Roar Plus hangszóró. További funkciók

I. sz. 220 körül Origenész összeállítja Hexapla címen az Ószövetség hat különbözı fordítását

Bosch Video Management System. Kezelési útmutató

hp photosmart 850 digitális fényképezôgép kezelési útmutató

Click to edit headline title style

*Ne használja a készüléket a következő esetekben: túl hideg vagy túl meleg helyen, nedves, poros

A t-method szoftver és szoftvermodulok bemutatása

A Gyorstelepítés rövid leírását lásd a hátsó borítón.

ECP. Site Administration System. Felhasználói kézikönyv. v (1. kiadás a és újabb verziójú ECP SAS rendszerekhez)

Felhasználói útmutató

BÁN JÓZSEF FERTİSZÉPLAK SZÉKESFEHÉRVÁR - BUDAPEST. VISZK Bt. Székesfehérvár. Felhasználói Kézikönyv

BÁN JÓZSEF FERTİSZÉPLAK SZÉKESFEHÉRVÁR - BUDAPEST. VISZK Bt. Székesfehérvár. Felhasználói Kézikönyv

Az Ön kézikönyve SONY ERICSSON ASPEN

Beszédfelismerés, beszédmegértés

A MAGYAR POLITIKAI FOGLYOK SZÖVETSÉGE os HAGYOMÁNYŐRZŐI

Multimédia Felhasználói útmutató

Budapesti Műszaki és Gazdaságtudományi Egyetem Villamosmérnöki és Informatikai Kar Irányítástechnika és Informatika Tanszék DARU IRÁNYÍTÁSA

Általános használati útmutató Videosec rögzítőkhöz

A rendszerek folyamatlogikai rendje

Általános Szerződési Feltételek VNTV Fesztivál

2011. évi CXC. törvény

BUDAPESTI MŰSZAKI ÉS GAZDASÁGTUDOMÁNYI EGYETEM ÉPÍTÉSZMÉRNÖKI KAR ÉPÍTÉSKIVITELEZÉSI TANSZÉK

Általános Szerződési és Felhasználási feltételek

Közbeszerzési Értesítő száma: 2015/108

TÁJÉKOZTATÓ A FIZETÉSI KÉSEDELEM KÖVETKEZMÉNYEIRŐL HITELKÁRTYA ÜGYLETEK ESETÉN

zlekedésben Dr.-habil egyetemi tanár PTE MIK

Az Ön kézikönyve PANASONIC NVSJ50EU

LOGalyze Telepítési és Frissítési Dokumentáció Verzió 3.0

KONYHABÚTOR FELSŐK ELEMJEGYZÉKE

Stratégiai Fttx hálózat tervező. Smart Strategic Planner

SZERZŐDÉS K&H Széchenyi Pihenő Kártya kibocsátásáról

WIFI ajtócsengő HASZNÁLATI ÚTMUTATÓ

eopass Termék és szolgáltatás bemutató

Általános tudnivalók. Üzemeltetői adatok. A megrendelések feldolgozása

AMELYEK A MUNKAHELYI ZAJRÓL SZÓLÓ 2003/10/EK IRÁNYELV ALKALMAZÁSÁRA SZOLGÁ

Tájékoztató és nyomtatványok másik önkéntes nyugdíjpénztárba történő átlépéshez

Felhasználói kézikönyv. Audio Baby monitor PNI B7000 wireless

A 92. sorszámú Stúdióvezető megnevezésű szakképesítés-ráépülés szakmai és vizsgakövetelménye 1. AZ ORSZÁGOS KÉPZÉSI JEGYZÉKBEN SZEREPLŐ ADATOK

MULTIMÉDIA-ALKALMAZÁS FEJLESZTŐ SZAKKÉPESÍTÉS SZAKMAI ÉS VIZSGAKÖVETELMÉNYEI

A katonaság természetvédelemben játszott szerepének ismertsége a civil lakosság körében. Országos kérdőíves felmérés Eredmények

Új VAIO Fit notebook Elképesztő hang- és képminőség a zene és a filmek szerelmeseinek saját stúdióval

SZÜLŐI ELÉGEDETTSÉGMÉRÉS 2010.

2500 Series multifunkciós készülék

2,4GHz Vezeték nélküli csatlakozófejes AV jeltovábbító Használati útmutató (Használatba helyezés előtt kérjük olvassa el)

ÁLTALÁNOS SZERZŐDÉSI ÉS FELHASZNÁLÁSI FELTÉTELEK

Felhasználói Megállapodás

Megjegyzés: A levágott képek elkerülése érdekében ellenőrizze, hogy az eredeti dokumentum és a másolat ugyanolyan papírméretű-e.

A Szekszárdi I. Béla Gimnázium Helyi Tanterve

Kézikönyv. SOFiSTiK SOFiCAD-B (Vasalásszerkesztő modul) 16.5 és 17.1 verzió

Andorkó Mária: Apró lépésekkel a TIOP rögös útján - Egy nyertes pályázat története

COOSPACE. Kurzusszínterek 15 perc alatt

Felhasználói Kézikönyv

Mérlegjegy nyomtatása külső nyomógombbal indítva

Kezdje itt Gyors üzembe helyezési útmutató

Diákönkormányzatot segítő pedagógusok 40 órás akkreditált továbbképzési programja

Rövidített felhasználói kézikönyv. H.264 ( 4/8/16 csatornás) Digitális video rögzítő

A BENCHMARKING AZ. - a legjobb gyakorlatról - Dr. Farkas Katalin december 16.

NETLOCK SIGN szolgáltatás Rendelkezésre állási Szabályzata

Listázó Munkahelyen letöltés SQL naplóból

Bosch Video Client. Kezelési útmutató

hp pro webkamera felhasználói útmutató

A felmérési egység kódja:

A 29. cikk alapján létrehozott adatvédelmi munkacsoport

A legjobb fájlok projektjéhez

ELŐADÁS SZÁMÍTÓGÉP MŰKÖDÉSE FIZIKA ÉS INFORMATIKA

Termék leírás. On-Board-Diagnosztikai (OBD) modul

A playertise.com oldal használatának általános szerződési feltételei

A Nemzeti Média- és Hírközlési Hatóság Médiatanácsának. 790/2012. (IV.25.) sz. HATÁROZATA

Az Ön kézikönyve ONEFORALL URC

Hirdetmény. Lakossági betétek kondíciói. Takarékszámlabetét éven túli lejáratra lekötött betét (177 típus) 36 hónapos 48 hónapos 60 hónapos

Útmutató a hálózati és internetes kommunikációhoz

A Gyorstelepítés rövid leírását lásd a hátsó borítón.

Mély neuronhálók alkalmazása és optimalizálása

Modem és helyi hálózat Felhasználói kézikönyv

SZERKEZETI ELEMEK ÉS FUNKCIÓJUK. Vezeték nélküli FM sztereo fejhallgató HA-W500 RF (EG) FONTOS

ÉPÜLETVILLAMOSSÁGI GYENGEÁRAMÚ MUNKARÉSZ ENGEDÉLYEZÉSI TERVDOKUMENTÁCIÓJÁHOZ

Fio-broker lépésrıl lépésre

Gépjármű fekete doboz az útvonalrekonstrukció új eszközei

A SMART FARMING KFT. ÁLTALÁNOS SZERZŐDÉSI FELTÉTELEI /a továbbiakban: ÁSZF/

OEP Betegéletút lekérdezés háziorvosok és vénytörténet lekérdezés patikák számára. API dokumentáció. verzió: 2.01

Jelentésváltozás nélküli interkulturális üzenetváltások a neten

SEA-TOUCH Használati utasítás

NETFIT modul Tanári felület Felhasználói útmutató. Magyar Diáksport Szövetség

A gyermek egyéni fejlődésének nyomon követési dokumentuma 3-7 éves korig

10. K ÖZMŰ SZERŰ IT-SZOLGÁLTATÁS

Átírás:

Beszédfelismerés és videó keresés web2 módra Web 2 Symposium, 2009. március 3. Tompa Tamás tamas.tompa@digitalnatives.hu

Ki mit tud? Ki hallott már beszédfelismerésről? Ki tudja hogyan működik a beszédfelismerés? Ki tudja mire lehet használni? Ki szeretné valamire használni? Ki tudja mi az a mindroom?

Miről lesz szó Beszédfelismerés röviden Tények: hol tartunk ma Tanítható / öntanuló rendszer mindroom szolgáltatás mindroom search videókeresés

Miről nem lesz szó Hallás folyamata, hangrezgés Beszédakusztika Fourier transzformáció Részletek...

Star Trek A beszédfelismerés első felhasználója: Captain James T. Kirk (1966)

Beszédfelismerés Múlt Jelen Jövő Hangvezérlés - Kis nyelvi modell, beszélőfüggő (Speciális felhasználás: orvosi és katonai) Nincs még leirat Beszélőfüggetlen felismerés, de témára és beszélőre tanítva 80-90%-os szópontosság Hangazonosítás, téma- és beszélőfüggetlen felismerés 100%-os pontosságú leirat készítés, központozással

Beszédfelismerés Magyarul eddig jellemzően vezérlésre használták, kis szótáras (40-5000 szavas) megoldások voltak Vagy speciális felhasználási témára készült: egészségügyi, jogi szakszöveghez

Beszédfelismerő rendszer

Nyelvi modell Közéleti és Gazdasági modellek 1,2 millió szavas korpusz (kb. 4000 A4-es oldal) 92 ezer szóalak Háború és Béke ~ 1950 oldal ~ 400 000 szó Összesen mintegy 600 egyénített szereplőt, 200 történelmi személyt és 20 nagyobb csatajelenetet ábrázol monumentális művében az író. 3 milliós korpusz - tesztelés alatt További témák - összeállítás alatt

Akusztikus modell Studio és Telefonos modellek Több száz beszélő hanganyagából és szöveg leiratából készült Ezt adaptáljuk rövid 5 perces egyedi hanganyagokkal Real time factor: 0,8 Hardver (processzor) függő Modell függő: akusztikai adaptáció után 0,6 körül is lehet

Tanítás A rendszerbe bekerült tartalmakkal tovább javítjuk a nyelvi és akusztikus modelleket Nyelvi tanítás: Min. 500e szavas korpusz 1. Meglévő modell továbbfejlesztése 2. Teljesen új modell kialakítása - kellően nagy korpusz esetén Akusztikus (Beszélőre) tanítás: Mindig csak adaptálunk, de már 5 perc is számít Pontos leirat: Jó ha van, de nem szükséges Tanítás / Öntanulás Hogyan kapcsolódhat be a közösség?

Felismerési pontosság Témára és beszélőre tanított: 80-95% Csak témára, beszélőre nem tanított: 65-90% Témára és beszélőre sem tanított: 20-50% 100 80 60 40 20 0

Felismerési pontosság Témára és beszélőre tanított Szópontosság: 83,1% Karakterpontosság: 94,7% Példa: nagyon röviden tehát két témával folytatnám ha már uniós pályázatokról van szó akkor nagyon tenni a témánál és hamarosan elérhetők egy pályázati lehetőség az új magyarország fejlesztési program vidékfejlesztéshez kapcsolódó programjának keretében is mégpedig szombattól egészen novemberxxxáig adhatsága be a pályázataikat a vidéki illetve a helyi közösségek összesen csaknem száznegyven százötven milliárd forintról van szó ennyi fejlesztési forrást lehet majd felhasználni az öt ezer fő alatti településeken megalakult kilencvenhat helyi vidékfejlesztési közösség az

Persze vannak érdekes hibák Vereséget szenvedett tegnap este Nyereséget szenvedett tegnap este a fejbőrbetegségekről kevesen tudják hogy érintéssel is terjednek és talán az is meglepő a tengerbetegségekkel kevesen tudják hogy térítésnrlek is terjednek és talán az is meglepő

mindroom Eddig az audio/video tartalmak cím, esetleg kulcsszavak, címkék alapján voltak kereshetőek Mostantól minden tartalom ugyanúgy kereshetővé válik, mint egy szöveges dokumentum A felismert szöveg (szó) időpillanathoz van rendelve, milliszekundumos pontossággal 00:02:06,962 --> 00:02:08,012 a 00:02:08,012 --> 00:02:08,352 válság 00:02:08,352 --> 00:02:09,982 következményeként 00:02:09,982 --> 00:02:10,122 az 00:02:10,122 --> 00:02:10,342 állam

mindroom K+F-ből piacképes termék Infrastruktúra Szolgáltatás: minden ami beszédfelismerés Széles körben hozzáférhető és használható >> mindroom API

mindroom integrate Tényleg kereshető médiatár Rengeteg bemeneti formátum, automatikus konvertálás Leiratból szófelhő generálás Keresési találatok szövegkörnyezettel Azonnali lejátszás a megtalált szótól Keresés a videóban

Szófelhő

mindroom integrate Tartalom szerinti ajánlók szófelhő (szóegyezés) alapján Embed (szófelhővel és kereséssel) Tartalom szerinti (releváns) hirdetések API Search API

Embed

mindroom - kinek, mire? Média tulajdonosok, Cégek: Audio / video tartalmak (médiatárak) indexelése, kereshetőség Kulcsszó alapú hirdetés Call-centerek: Beszélgetések elemzése, kiértékelése intelligens IVR Fejlesztő cégek: API használat, SEO, automatikus címkézés

Ti mire használnátok?

mindroom search Keressen az elmúlt egy hét híradóiban! Beta minden észrevételt szívesen látunk! Miért TV híradók? Ez nem egy specifikus terület - bármiről beszélhetnek... Akusztikailag jó minőségű Szlengtől és szakkifejezésektől mentes Hozzáférhető (napi több órányi anyag) Sok embert érdekel, sokan keresik Mi derült ki eddig belőle? Minden TV híradó ugyanarról szól Jó felismerési eredmények, morfémák használata bevált (új szavak felismerése)

Demo

Fejlesztés alatt mindroom search Akár az összes magyar TV csatornára folyamatosan, témára szűkítve Beszélőfelismerés, beszélő váltás érzékelés A beszéd és beszélő összekapcsolása Dictate (gépírás hangvezérléssel)

Ellenőrző kérdések ;-) Ki tudja hogyan működik a beszédfelismerés? Ki tudja mire lehet használni? Ki szeretné valamire használni? (Mire?) Van kérdés? tamas.tompa@digitalnatives.hu