Beszédtechnológia. élő sportközvetítések gépi feliratozása. Tibor Fegyó SpeechTex Kft.

Hasonló dokumentumok
Beszédfelismerés. mit jelent, hogyan működik, kinek éri meg. Tibor Fegyó SpeechTex Kft.

Beszédtechnológia a médiában. Tibor Fegyó SpeechTex Kft.

Beszédfelismerés alapú megoldások. AITIA International Zrt. Fegyó Tibor

Médiafelügyeleti főosztály

Angol C nyelvi programkövetelmény

program 1. nap / 1st day (április 15. / 15 april)

A modern e-learning lehetőségei a tűzoltók oktatásának fejlesztésében. Dicse Jenő üzletfejlesztési igazgató

A hallási fogyatékkal élők befogadását segítő feliratozással kapcsolatos kívánalmak ellenőrzése (2014. II. negyedév)

ELO Digital Office ERP integráció

A többképernyős médiafogyasztás - Változó médiafogyasztási szokások, közösségi média





Az adatelemző felelőssége tapasztalatok a biztosítási analitikában

VÁLTOZÓ VIDEÓ VILÁG: MILYEN KÉPERNYŐN NÉZNEK? ELŐADÓ: VÖRÖS CSILLA. Digitalia szeptember 10.

Tavaszi Sporttábor / Spring Sports Camp május (péntek vasárnap) May 2016 (Friday Sunday)

Vállalatirányítási rendszerek

Angol C nyelvi programkövetelmény

INTELLIGENT ENERGY EUROPE PROGRAMME BUILD UP SKILLS TRAINBUD. Quality label system

Kognitív Infokommunikáció: egy ébredő interdiszciplína. Baranyi Péter DSc

Component Soft és tovább

Használati útmutató Az online példatárhoz

Copyright 2012, Oracle and/or its affiliates. All rights reserved.

Adatelemzés SAS Enterprise Guide használatával. Soltész Gábor solteszgabee[at]gmail.com

DIGITALIZÁCIÓ KINEK MI? AVAGY A KIKERÜLHETETLEN ÖSVÉNY A SIKERES VERSENYKÉPESSÉG ÉRDEKÉBEN.

Eladni könnyedén? Oracle Sales Cloud. Horváth Tünde Principal Sales Consultant március 23.

évi 6. Hírlevél

Gépi tanulás a gyakorlatban. Bevezetés

I. KEZDETI BEÁLLÍTÁSOK II. AZ ONLINE NEVEZÉS LÉPÉSEI. Segédlet a felület kezdeti használatához. Online adatnyilvántartó rendszer

A Magyar Nemzeti Szövegtár új változatáról Váradi Tamás

OLYMPICS! SUMMER CAMP

ANGOL MAGYAR PARBESZEDEK ES PDF

PARADIGMAVÁLTÁS A KÖZOKTATÁSBAN MOST VAGY SOHA?!

aklatott Sas István GENERÁCIÓ űrös MÉDIA

FOSS4G-CEE Prágra, 2012 május. Márta Gergely Sándor Csaba

Főnévi csoportok azonosítása szabályalapú és hibrid módszerekkel

ANGOL NYELV, MINT ELSŐ IDEGEN NYELV

API-MÁGIA MILLIÓ SORNYI ADAT ÚJRARENDEZÉSE. Előadó: Jaksa Zsombor, drungli.com

Angol Középfokú Nyelvvizsgázók Bibliája: Nyelvtani összefoglalás, 30 kidolgozott szóbeli tétel, esszé és minta levelek + rendhagyó igék jelentéssel

A gép az ember tükre, avagy hogyan (ne) adjuk át saját előítéleteinket a mesterséges értelemnek

47M. Megérkezett!!! A legnagyobb. AZ EGÉSZ VILÁGON!

ANGOL NYELV KÖZÉPSZINT SZÓBELI VIZSGA I. VIZSGÁZTATÓI PÉLDÁNY

Technológia-semlegesség a szabályozásban

BOOKING GUIDE. itbroadcast - INFOTÉKA

Ön a megfelelő mennyiségű és minőségű információk alapján hozza meg döntéseit? Stratis Kft. / Autonomy üzleti reggeli /

KOPI. KOPI A fordítási plágiumok keresője MTA SZTAKI DSD. Pataki Máté Kovács László. Department of Distributed Systems

KÉPI INFORMÁCIÓK KEZELHETŐSÉGE. Forczek Erzsébet SZTE ÁOK Orvosi Informatikai Intézet. Összefoglaló

Márkaépítés a YouTube-on

47M. Megérkezett!!! A legnagyobb. AZ EGÉSZ VILÁGON!

Rámpát a honlapokra úton az akadálymentes honlapok felé Pataki Máté

Olympic Agenda elfogadva a NOB 127.Közgyűlésén december 8-9., Monaco

Intézményi IKI Gazdasági Nyelvi Vizsga

A jogszabályi változások értelmezésének nehézségei és annak számviteli kihatásai

HÍRFOGYASZTÓI PROFILOK

Élettartam teszteknél alkalmazott programstruktúra egy váltóvezérlő példáján keresztül

Versenyben a munkavállalókért

Emelt szint SZÓBELI VIZSGA VIZSGÁZTATÓI PÉLDÁNY VIZSGÁZTATÓI. (A részfeladat tanulmányozására a vizsgázónak fél perc áll a rendelkezésére.

Sebastián Sáez Senior Trade Economist INTERNATIONAL TRADE DEPARTMENT WORLD BANK

Érje el hatékonyan a technikai újdonságokra nyitott, fizetőképes fiatalokat! MÉDIAAJÁNLAT

Számlakezelés az ELO DocXtraktor modullal

Vakáció végi akció Ukrajnában

OTT tartalomszolgáltatások hazai is nemzetközi jogi útvesztője

VÁLTOZÓ TV2, VÁLTOZATLAN PROGRAM

Searching in an Unsorted Database

Hogyan használja az OROS online pótalkatrész jegyzéket?

General information for the participants of the GTG Budapest, 2017 meeting

Payment Center. Rövid útmutató. Verzió 1.0.1

Az alkalmazás minőségbiztosítás folyamata Fókuszban a teszt-automatizálás

VÁLLALKOZÓI SZERZŐDÉS STÚDIÓVEZETŐI FELADATOK ELLÁTÁSÁRA

Data Vault 2.0 és az Oracle DW/BD referencia architektúra. Gollnhofer Gábor Meta Consulting Kft.

Mesterséges Intelligencia Elektronikus Almanach

digisport.hu Mindenünk a sport!

Beszédfelismerés és videó keresés web2 módra

Alternatív zártláncú tartalomtovábbítás értékesítőhelyek számára

Rendszermodellezés: házi feladat bemutatás

IBM Datacap Taskmaster. Bejövő Számlák feldolgozása Accounts Payable Taskmaster (APT) Előadó: Csendes Balázs / IBM Industry Solutions Brand Executive

MASTERCARD BUSINESS, VISA BUSINESS

Sas István

Szoftverminőségbiztosítás

REAL az MTA Könyvtárának repozitóriuma

Correlation & Linear Regression in SPSS

ISMÉTLÉS 4. (MÓDBELI) SEGÉDIGÉK

Multimédia mintarendszerek a Sulinet + hálózatban

Weboldalkészítés sablonok segítségével Nyitrai Erika. Miről lesz szó? WEBOLDALKÉSZÍTÉS SABLONOK SEGÍTSÉGÉVEL. Saját honlapot szeretnék

USA Befektetési Útmutató

A Hunglish Korpusz és szótár

A KLUBTÓL A KANAPÉIG KONCERT, KOMMUNIKÁCIÓ, KÖZÖSSÉG Az A38 Hajó zenei csatornái a YouTube-on

H A T Á R O Z A T ,- Ft, azaz kétmillió-hétszázezer forint összegű bírság megfizetésére kötelezi.

Egységesítés felsőfokon

A jövő Internetje. HTE Közgyűlés május 20. Dr. Szabó Róbert, e. docens.

INTERNETES KERESÉS. Szórád László Óbudai Egyetem TMPK

A VÁLLALATOK FELELŐSSÉGE A KLÍMAVÁLTOZÁSBAN

AZ ÜGYFÉL KOMMUNIKÁCIÓ ÚJ FORMÁI POZITÍV ÜGYFÉLÉLMÉNY SZÖVEGBÁNYÁSZATI MEGOLDÁSOK

Tudományos Ismeretterjesztő Társulat

Az egészségügyi munkaerő toborzása és megtartása Európában

MOBIL TÉRKÉPEZŐ RENDSZER PROJEKT TAPASZTALATOK

1 Copyright 2012, Oracle and/or its affiliates. All rights reserved. Insert Information Protection Policy Classification from Slide 7

2. 3. Keresés az Interneten. Navigáció az Interneten: Megoldások. Internetes keresés buktatói. 1. Keresőmotorok. Webes keresési lehetőségek

8380 Hévíz, Rákóczi u Tel.: Fax: Hévíz.hu médiaajánlat

Átírás:

Beszédtechnológia élő sportközvetítések gépi feliratozása Tibor Fegyó SpeechTex Kft.

Előzmények TV műsor feliratozás 2014 K+F együttműködés 2016 szolgáltatás A megvalósítás fő kihívásai nagy mennyiségű releváns tanító adat összegyűjtése feldolgozása valósidejű integráció Mindroom projekt 2008 tematikus reklámelhelyezés Beszédtechnológia 2

Motiváció Az elsődleges cél megfelelés a törvényi kötelezettségnek JBE szolgáltatók 24 órában kötelesek felirattal ellátni a műsoraikat A kezdeti rendszer a sportműsorokat még nem kezelte elég hatékonyan Magyarországon ma nincs olyan publikus kereső, ahol az elhangzott műsorokban tartalmilag lehetne keresni Beszédtechnológia 3

Kitekintés IBM (ustream) headlines (2017) How AI will change live sports broadcasting Contextual video advertising: why it matters and how AI can help To win in streaming media services, get clever with data How advances in cognitive awareness promise to redefine video industry economics How Watson Video Enrichment can provide better decisionmaking data and unlock new business possibilities in the media industry Beszédtechnológia 4

IBM (ustream) motivation AI & sport The real game-changer for live sports broadcasting is artificial intelligence. AI will not only affect viewers, but also advertisers, broadcasters, and even the athletes and coaches. It will enrich video content with better insights and better recommendations. Soon, we may not recognize a sporting event without it. Beszédtechnológia 5

Sport labdarúgás feliratozás Miért labdarúgó-mérkőzések? nagyon népszerűek sok az élő adás Nehezebb feladat, mint a közéleti műsorok Zajos környezet Nagyrészt spontán, töredezett, kontextus nélküli beszéd Sok személynév (akár minden 7. szó!) Kézi feliratozás: nagyon hiányos és sokat késik Cél: minél hatékonyabban kiváltani a kézi módszereket Beszédtechnológia 6

Élő TV műsor feliratozás Élőmunka igény Kézi feliratozás (gépelés) késik, hiányos, drága, de pontos Szószerinti újrabeszélés élő, hiányos, drága, kevésbé pontos Élő gépi feliratozás élő, teljes, olcsó, kevésbé pontos (~5-30% WER) Újrabeszélés + élő szerkesztés késik (~5 sec), hiányos (60-80%), drága, de pontos (1-5% WER) Gépi feliratozás + utófeldolgozás Élő felirat Adás késleltetés Késleltetett felirat Rendelkezés re álló idő Beszédtechnológia 7

Kézi valósidejű feliratozás Sport műsor kézi felirat Az ipari sztenderd : képzett leiratozók 4-6 óra alatt készítenek 99% pontosságú leiratot a hangminőség függvényében (3 USD / min) Sztenográf alkalmazása (US) Gyakorlott bírósági jegyzőkönyv írók 3-6 hónapos képzés: élő adások leiratozása további 12-18 havi képzés után: élő sportközvetítések leiratozása Beszédtechnológia 8

Gépi feliratozás: kihívások - válaszok Témához illeszkedő tanító korpusz Releváns forrásokból gyűjtött szöveg 100m+ szó / 1.6m szó Zajos környezet Valós környezetben rögzített hangfelvételek 500+ óra Gyorsan változó, rövid ideig érvényes, de fontos névelemek Bővíthető nyelvi modell szükséges Olvashatóság központozás Beszédtechnológia 9

A kiindulási modell Releváns tanító korpusz Sportműsor kézi leiratok Sporthír feliratok Élő közvetítések utólag javított feliratai Sport témájú webkorpusz Hírműsorok kézi leiratok Hír témájú webkorpusz Parlament webkorpusz 3-gram szóalapú modellek Részmodellek lineáris interpolációja Számításigény 24 óra / 128Gbyte memória Beszédtechnológia 10

Modell bővítési mintafeladat: EB 2016 2016-os labdarúgó EB bírói, edzői, játékosai Alanyesetű személynevek listája 595 személy pl: Wayne Rooney 2 alakban: Rooney, Wayne_Rooney (összesen 1190 névalak) Főnévi esetragokkal ellátott lista 6 féle esetrag: részes, tárgy, eszközh., ablativus, delativus, allativus (~85%-os lefedettség) Összesen 7 x 1190 névalak Beszédtechnológia 11

Környezetfüggetlen szótárbővítés Névalakok izolált elhelyezése a nyelvi modellben Nem igényel tanítószöveg előkészítést! Elhelyezés tanítószövegben Szélsőségesen egyszerű Névalakok felsorolása a tanítószövegben Interpoláció unigram modellel Unigram nyelvi modell a névalakokból Interpoláció a többi nyelvi modellel Beszédtechnológia 12

Környezetfüggő szótárbővítés Tanítószöveg előkészítés szükséges! Releváns kontextus keresése Személynév felismerés a kézi leiratokon (NER) Kiindulás: hiányosan címkézett tanítószöveg Címkézés SzegedNE-vel (nagy pontosság) Stanford-NER tanítása: kézi címkék + SzegedNE címkék Eredmény: ~95% pontosság, ~88% felidézés Osztály n-gram tanítása Névelemek behelyettesítése a személynév címkék helyére Beszédtechnológia 13

Szótárbővítés hatása Szótárbővítés Tanító szövegben felsorolt nevek 3% Interpolált névlista 6% N-gramm modellek 10% Maximum 0,5% szótár bővítés Relatív hiba csökkenés Modell újratanítás minden esetben szükséges Az N-gramm modellek további jelentős befektetést igényelnek A közvetítés előtt közvetlenül a modell ezen módszerekkel nem módosítható Beszédtechnológia 14

Szótárbővítés demó Bővített modell Kezdeti nyelvi modell Beszédtechnológia 15

Környezetfüggetlen szótárbővítés Futásidejű modell interpoláció a motorban A nagy modell és a névlista önálló modellként kerül betöltésre Több modell is betölthető Minden modell súlyozható Modellek átjárhatóak Elveszítjük az N-gramm modell előnyeit Percek alatt bővíthető a modell Beszédtechnológia 16

Eredmény Sportoló nevekkel bővített, Központozott, Kereshető (Webvtt html5 szabvány) Feliratozott élő sportközvetítések Beszédtechnológia 17

Köszönöm a figyelmet! A projekt részben az EUREKA DANSPLAT projekt támogatásával került megvalósításra, szerződésszám: EUREKA_15_1_2016-0019