Multimédia az audiovizuális beszédfeldolgozásban. dr. Czap László



Hasonló dokumentumok
Multimédia az audiovizuális beszédfeldolgozásban. dr. Czap László

PXOWLPpGLiVHODGiVpV IHODGDWODSV]HUNHV]W-NLpUWpNHOSURJUDPFVRPDJ

$IHOQ WWNRULWDQXOiVPRWLYiFLyL )HOQ WWNRULWDQXOiVLNpSHVVpJHN. (O DGiVRPEDQ NpW D IHOQ WWNRUL WDQXOiVVDO NDSFVRODWRV NpUGpVN UW D IHOQ WWNRUL

GEORGIKON MÉDIA 99 KONFERENCIA

ROMÁNIA HIVATALOS KÖZLÖNYE

DOKTORI (Ph.D.) ÉRTEKEZÉS TÉZISEI VESZPRÉMI EGYETEM. Gazdálkodás- és Szervezés Tudományok Doktori Iskolája. DR. SOMOGYI SÁNDOR Ph.D.

AZ AKUSZTIKUS ÉS VIZUÁLIS JEL ASZINKRONITÁSA A BESZÉDBEN

Egyezmény. a Németországi Szövetségi Köztársaság Kormánya. a Magyar Köztársaság Kormánya között. az audiovizuális kapcsolatokról

PARAMÉTERES GÖRBÉK ALKALMAZÁSA VALÓSIDE- JŰ DIGITÁLIS HANGFELDOLGOZÁS SORÁN

NYILVÁNOS VÉTELI AJÁNLATA A KARTONPACK DOBOZIPARI RT. ÁLTAL KIBOCSÁTOTT ÖSSZES SZAVAZATI JOGOT BIZTOSÍTÓ RÉSZVÉNYRE

OLAJOS Péter Európai parlamenti képviselõ (EPP-ED / MDF) Uniós Energiapolitika, közvetlen támogatások a geotermikus energia

Diagnosztikai szemléletű talajtérképek szerkesztése korrelált talajtani adatrendszerek alapján

PIC16F877 KÍSÉRLETI PANEL

$N ]P YHO GpVD]LVNRODLIHOQ WWRNWDWiVNDSFVRODWDLpVOHKHW VpJHL

NOE Egészségközpont Katona Erzsébet dr

AZ EURÓPAI KÖZPONTI BANK KORMÁNYZÓTANÁCSÁNAK IRÁNYMUTATÓ ÁLLÁSFOGLALÁSA

Mérési eljárások kidolgozása látók és látássérültek lokalizációs képességeinek összehasonlítására

SAR AUTOFÓKUSZ ALGORITMUSOK VIZSGÁLATA ÉS GYAKORLATI ALKALMAZÁSA 2

HI-SHARP. Felhasználói és üzembe helyezési útmutató

7DQXOMRQRODV]XO)LUHQ]pEHQ

HJ\V]HU&WLV]WiQWDUWiVDpVIHOW OWpVHN QQ\HGpQYpJUHKDMWKDWó.

Információtartalmú elemzések a közlekedéseredetű szennyezőanyagok hatásvizsgálatánál

Laboratóriumi gyakorlatok

KIP THORNE INTERSTELLAR ÉS A TUDOMÁNY

A modern e-learning lehetőségei a tűzoltók oktatásának fejlesztésében. Dicse Jenő üzletfejlesztési igazgató

Hol hallod a sz hangot?

KÖSZÖNJÜK A Jabra BT3030-ról További segítségre van szüksége? Jabra BT3030 Bluetooth headset

PRÓBAMÉRÉSEK TEREPI KÖRÜLMÉNYEK KÖZÖTT KÖNNYŰ EJTŐSÚLYOS DINAMIKUS TERHELŐTÁRCSÁVAL

mobil rádióhálózatokban

(11) Lajstromszám: E (13) T2 EURÓPAI SZABADALOM SZÖVEGÉNEK FORDÍTÁSA

JELENTÉS. $](8WDJiOODPRNpVD](8IHQQWDUWKDWyIHMOGpVVHONDSFVRODWRV stratégiáinak, illetve programjainak vizsgálata, elemzése c.

20 éves a Térinformatika Tanszék

E X P O R T Á R J E G Y Z É K

SZOFTVEREK A SORBANÁLLÁSI ELMÉLET OKTATÁSÁBAN

IT KOCKÁZATOK, ELEMZÉSÜK, KEZELÉSÜK

2. Local communities involved in landscape architecture in Óbuda

A Margit híd pillérszobrának 3D-s digitális alakzatrekonstrukciója Nagy Zoltán 1 Túri Zoltán 2

INVARIANCIAELVEK A SZOCIOLÓGIAELMÉLETBEN ÉS AZ EMPIRIKUS KUTATÁSBAN

A telefon alközpont használati útmutatója

Angol Középfokú Nyelvvizsgázók Bibliája: Nyelvtani összefoglalás, 30 kidolgozott szóbeli tétel, esszé és minta levelek + rendhagyó igék jelentéssel

Bluetooth Car Kit BT Drive Free

$]RNWDWiVWHFKQROyJLD27MHOHQHpVM YMH

BT Drive Free

100% BIO Natur/Bio kozmetikumok és testápolás

CIAS - ERMO 482 Mikrohullámú sorompó kültéri védelemhez Szerelési útmutató

TECHNIKAI RENDSZEREK ÁLLAPOTLEÍRÁSÁNAK KÉRDÉSEI QUESTIONS REGARDING THE DESCRIPTION OF THE STATE OF TECHNICAL SYSTEMS

BT HS

A BRITTON CAPITAL & CONSULTING B()(.7(7, TANÁCSADÓ ÉS SZOLGÁLTATÓ KFT. Részvényenként forint ellenérték ellenében.

Using the CW-Net in a user defined IP network

A controlling és az értékelemzés összekapcsolása, különös tekintettel a felsőoktatási és a gyakorlati alkalmazhatóságra

Az INTEL D-2920 analóg mikroprocesszor alkalmazása

Néhány folyóiratkereső rendszer felsorolása és példa segítségével vázlatos bemutatása Sasvári Péter

DIPLOMATERV. Siketek beszédértését segítő taktilis kijelző készítéséhez zajtűrő beszédfelismerő algoritmusok áttekintése, fejlesztése

Szabó Gábor tantárgyprogramjai

A CAN mint ipari kommunikációs protokoll CAN as industrial communication protocol

FIR SZŰRŐK TELJESÍTMÉNYÉNEK JAVÍTÁSA C/C++-BAN

FEJMOZGÁS MÉRTÉKEK HANGANYAGBÓL TÖRTÉNŐ MEGÁLLAPÍTÁSÁNAK KEZDETI EREDMÉNYEI

TÁJÉKOZÓDÁS. normák szerinti cselekvés nem lehet része a racionális döntések elméletének. 1 A

STATISZTIKUS TÖRVÉNYSZERŰSÉGEK EGYSZERŰ DEMONSTRÁLÁSA GALTON-DESZKÁVAL SIMPLE DEMONSTRATION OF STATISTICAL LAWS WITH GALTON-BOARD

KÉPI INFORMÁCIÓK KEZELHETŐSÉGE. Forczek Erzsébet SZTE ÁOK Orvosi Informatikai Intézet. Összefoglaló

GÉPI ÉS EMBERI POZICIONÁLÁSI, ÉRINTÉSI MŰVELETEK DINAMIKÁJA

Cloud computing. Cloud computing. Dr. Bakonyi Péter.

A forrás pontos megnevezésének elmulasztása valamennyi hivatkozásban szerzői jogsértés (plágium).

VAS MEGYE ÖNKORMÁNYZATÁNAK e57(6ë7-(

SZABAD ÉS VIRTUÁLIS HANGTERŰ LOKALIZÁCIÓS FELADATOK: LÁTÓK ÉS LÁTÁSSÉRÜLTEK KÉPESSÉGEINEK ÖSSZEHASONLÍTÓ VIZSGÁLATA

A ROBBANÓANYAGOK KEZELÉSBIZTOSSÁGÁRÓL

DR. MAGYAR MIKLÓS: A TANULÁS = ÉLETTEVÉKENYSÉG (Tanuló és/vagy médiaközpontú dominancia )

EEA, Eionet and Country visits. Bernt Röndell - SES

EEG mérések hardveres és szoftveres validációja

AZ AUTOMATIZÁLT MIG/MAG HEGESZTÉS VALÓS IDEJŰ MINŐSÉGBIZTOSÍTÁSI LEHETŐSÉGEI

Kognitív Infokommunikáció: egy ébredő interdiszciplína. Baranyi Péter DSc

Vizsgáztatás multimédia eszközökkel

NÉHÁNY MEGJEGYZÉS A BURKOLÓFELÜLETEK VIZSGÁLATÁHOZ

TANULMÁNYOK A KICSI SZÉP. A DETERMINÁCIÓS EGYÜTTHATÓ ÉRTELMEZÉSE ÉS HASZNÁLATA A SZOCIOLÓGIAI KUTATÁSBAN *

A TÉRINFORMATIKA OKTATÁSA ÉS ALKALMAZÁSI LEHETÕSÉGEI

A beszédpercepció tényezői, fejlesztésének lehetősége óvodás és kisiskolás korban

Laboratóriumi gyakorlatok

A PÁLYÁZAT LEFOLYÁSA, SZEMÉLYI, TARTALMI VÁLTOZÁSAI

TELEFIRE - ADR - 4OOO. 0&V]DNL.p]LN Q\Y9(5=,Ï2

A fafeldolgozás energiaszerkezetének vizsgálata és energiafelhasználási összefüggései

Eladni könnyedén? Oracle Sales Cloud. Horváth Tünde Principal Sales Consultant március 23.

Beszédadatbázis irodai számítógép-felhasználói környezetben

Plena VAS configuration

Jelölje meg (aláhúzással vagy keretezéssel) Gyakorlatvezetőjét! Hőközlés. Munkaidő: 90 perc. Értékelés: Feladat elérhető elért

Hálózati és Szolgáltatási Architektúrák

Térbeli folyamatok elemzése WiFi alapú virtuális szenzor hálózattal

IV. Évfolyam 2. szám június. László Zsuzsanna Budapesti Műszaki Főiskola laszlozsuzsu@gmail.com REJTJELBIZTONSÁG.

On The Number Of Slim Semimodular Lattices

Egységes európai megközelítés kialakítása közlekedési projektek értékelésében 1

Műholdas kommunikációs rendszerek támadhatósága Szűcs Péter

Az Ön kézikönyve BLAUPUNKT ODA SURROUND

Veszprémi Egyetem. PhD tézisek. Papp István. A neuromuzikológia alapkérdései neurolingvisztikai aspektusból


Software Engineering Babeş-Bolyai Tudományegyetem Kolozsvár

A KÖZÚTI ÁRUSZÁLLÍTÁS KÁROSANYAG- KIBOCSÁTÁSA, MINT NEGATÍV EXTERNÁLIA

Kezelési Útmutató. Japan Cash Raktáros programhoz

Márkaépítés a YouTube-on

Informatika Rendszerek Alapjai

± ± ± ƒ ± ± ± ± ± ± ± ƒ. ± ± ƒ ± ± ± ± ƒ. ± ± ± ± ƒ

1. Fejezet: Számítógép rendszerek

Átírás:

Multimédia az audiovizuális beszédfeldolgozásban dr. Czap László Miskolci Egyetem Villamosmérnöki Intézet Automatizálási Tanszék Miskolc, Egyetemváros e-mail: czap@mazsola.iit.uni-miskolc.hu Abstract Audio-visual speech processing takes into consideration not only the voice but also the lip movements and gestures of the speaker. Software and hardware multimedia tools enable joint processing of voices and images. Human lip-reading experiments can improve the efficiency of speech reading by machines as well. Talking heads can support the speech recognition of hearing impaired people. Bevezetés +D D EHV]pOQHN QHP FVDN D KDQJMiW KDQHP D V]iMPR]JiViW pv JHV]WXVDLW LV ILJ\HOHPEH vesszük a beszéd felismerése vagy szintézise során, audiovizuális beszédfeldolgozásról beszélünk. A kép és a hang kezelése kínálja a multimédia eszközök alkalmazását. Az emberi NRPPXQLNiFLyEDQQDJ\VHJtWVpJ QNUHYDQKDOiWMXNDEHV]pOW(]EiWRUtWiVWDGDUUDKRJ\D jelenséget felhasználjuk a gépi beszédfeldolgozásban is. Egyrészt a vizuális jel javíthatja a EHV]pGIHOLVPHU IHOLVPHUpVL DUiQ\iW PiVUpV]W KD D JpSL EHV]pGHW JUDILNXVDQ V]LQWHWL]iOW EHV]pO IHM NpSpYHO NtVpUM N VRNDW MDYtWKDWXQN SO D QDJ\RWKDOOyN EHV]pGIHOLVPHUpVpQ $] audiovizuális beszédfelismerés és a videó beszédszintézis szorosan kapcsolódik a NpSIHOGROJR]iVIHMOGpVpKH]DPRGHUQV]iPtWiVWHFKQLNiKR] 1. Audiovizuális beszédszintézis $ ]DMRV EHV]pGUH ILJ\HO HPEHU KDVRQOy KHO\]HWEHQ OHKHW PLQW D EHV]pG IHOLVPHUpVében NRUOiWR]RWWQDJ\RWKDOOy. ]LVPHUWKRJ\DVLNHWHNNpSHVHNV]iMUyOROYDVQL1DJ\MHOHQWVpJH van az olyan kutatásoknak, amelyek szintetizált képpel próbálják utánozni a természetes EHV]pO KDQJNpS]pVpW DXGLRYL]XiOLV HV]N ] NNHO VHJtWYH D EHV]pG PHJpUtését. Egyes UHQGV]HUHN P&IHMHW ieui]roqdn >1] Az arc mimikáját háromdimenziós modell alapján XWiQR]]iN$YL]VJiODWRNV]HULQWDWHUPpV]HWHVHPEHULDUFRWPHJN ]HOtWPpUWpNEHQMDYtWMDD P&IHMDEHV]pGPHJpUWpVpW]DMRVN UQ\H]HWEHQpVKDOOiVVpU OWHNQpO$grafikusan szintetizált YL]XiOLV EHV]pG RO\DQ HOQ\ NHW LV NtQiO DPHO\HN D YDOyViJRV EHV]pOQpO MREEDQ PHJN QQ\tWLNDV]iMUyOROYDViVW3ODIRJDNpVDQ\HOYPR]JiVDOiWKDWyYiWHKHWIpOLJiWOiWV]y szintetizált arcon keresztül. A szintetizált mozgás kódolása rendkívül tömör, mindössze néhány száz bit másodpercenként. $YL]XiOLVV]LQWHWL]iWRURNPiVLNUpV]H>@YDOyViJRVEHV]pODGDWDLQDNIHOYpWHOpEODODNXOW NL (EEHQ D] HVHWEHQ D EHV]pO IHOLVPHUKHW XJ\DQ~J\ PLQW D] HPEHUL KDQJIRV]OiQ\RNEyO építkez DNXV]WLNXV V]LQWHWL]iWRU HVHWpQ eughnhv NXWDWiV HUHGPpQ\H D KiURPGLPHQ]LyV modell megalkotása a kétdimenziós képek alapján. Ennek látványos demonstrációja volt, DPLNRUHJ\PR]LILOPHJ\LNNRFNiMiWyONH]GYHDIKVDUFiWDNXWDWyDVDMiWDUFiUDFVHUpOWH[4]

2. Audiovizuális beszédfelismerés 5pJyWDLVPHUWKRJ\KDOiWMXNLVDEHV]pOWQHPFVDNDKDQJMiWKDOOMXNMREEDQIHOLVPHUM ND beszédet különösen zajos környezetben. [5] Annak vizsgálatához, hogy mit várhatunk az DXGLRYL]XiOLV JpSL IHOLVPHUWO KDVznos, ha ismerjük, hogy az emberi beszédmegértést mennyire támogatja a vizuális jel. A vizsgálatok szerint különösen a hang képzési helyének felismerését segíti. Ebben a kísérletben a természetes beszédhez meghatározott pillanatnyi energiájú zajt adtunk. A képet a vizsgált szó sorszámával feliratoztuk. Csak akusztikus jelnél a sorszám látszott, audio-yl]xiolv YL]VJiODWQiO D EHV]pO NpSH LV >@ %HQRît és társai azt vizsgálták, hogy az arc mely részei a legfontosabbak a beszéd felismeréséhez. [7] A legtöbb segítséget a száj adja, de szinte az egész test alátámasztja (vagy éppen cáfolja) a PRQGDQLYDOyW $ EHV]pGIHOLVPHU UHQGV]HUHN WHUYH]pVHNRU D N YHWNH] NpUGpVHN PHU OQHN IHO+RJ\DQWDOiOMXNPHJDNpSHQDEHV]pODUFiWD]DMNDLWYDJ\PiV beszédes testrészeit? +RJ\DQHPHOKHWM NNLDOpQ\HJHVYL]XiOLVLQIRUPiFLyWDYLGHRMHOEO"0HO\HNDOHJIRQWRVDEE YL]XiOLVMHOOHP]N"+RJ\DQOHKHWD]DXGLRpVYL]XiOLVFVDWRUQDLQIRUPiFLyLWLQWHJUiOQL" A vizuális információ kinyerésére olyan algoritmusra van szükség, amely nem érzékeny a PHJYLOiJtWiV YiOWR]iVDLUD D EUV]tQUH D EHV]pO WiYROViJiUD PR]JiViUD D] DUFV]U]HWUH VPLQNUH VWE 1pKiQ\ UHQGV]HUEHQ D NDPHUD U J]tWHWW D EHV]pO IHMpKH] NpSHVW SO VSHFLiOLV VLVDNNDO+DDEHV]pOV]DEDGRQPR]RJKDWHOVIHODGDWDz arc megtalálása. Ez rendszerint a EUV]tQDODSMiQW UWpQLN$EUV]tQH]HWHHOpJpU]pNHWOHQDPHJYLOiJtWiVN O QEVpJHLUHpVDOLJ függ az emberi rasszoktól. Fekete- fehér képen a mozgás figyelése vezethet eredményre. A EHV]pOV]iMDpViOODYpJ]LDOHJLQWenzívebb mozgást.[8] A hang és képi információk egyesítésére két módszer terjedt el: az elején vagy a végén HJ\HVtWKHWM NDNpW~WRQNDSRWWHUHGPpQ\HNHW+DD]HOHMpQLQWHJUiOXQNDIHOLVPHUEHPHQHWL jeleként használjuk az akusztikus és a vizuális informiflywpvhj\ WWGROJR]]XNIHONHW+DD végén integrálunk, a külön-külön feldolgozott eredményeket a végén vetjük össze. Létezik N ]EHQVPyGV]HULVDPHO\D]HJ\LNMHOIHOGROJR]iVDN ]EHQYHV]LILJ\HOHPEHDPiVLNMHOHW Máig megválaszolatlan kérdés, hogy az ember hogyan integrálja az akusztikus és vizuális jelet. Ennek vizsgálatára használják a McGurk hatást. 3. A McGurk hatás McGurk és MacDonald 1976-ban publikált cikkében adta közre a felfedezést, amely szerint, ha egy hangot hallunk egy másik hang képével párosítva, gyakran egy harmadik hangot érzékelünk. Tipikus példa, hogy b-t hallunk, g-t látunk és d-t érzékelünk. A jelenséget McGurk hatásnak nevezik. Az utóbbi két évtizedben az effektust igen intenzíven kutatják. (J\LNRNDD]pUGHNOGpVQHND]KRJ\D]RQNHYpVOHKHWVpJHNHJ\LNpUOYDQV]yDPLNRUWLV]WD - zaj illetve torzításmentes KDQJJDOYpJH]KHW QNNtVpUOHWHW$]DMHOOHP]XJ\DQLVKRJ\D WLV]WDEHV]pGYL]XiOLVUiVHJtWpVQpON OLVW NpOHWHVHQpUWKHWtJ\DEHV]pGYL]XiOLVWiPRJDWiVD nem érzpnhokhw$0f*xunkdwivshgljwlv]wdehv]pgqpolvihoops Egyetemi hallgatók bevonásával a McGurk hatás zajfüggését és magánhangzó függését YL]VJiOWXN,VPHUHWHLP V]HULQW PDJ\DU DQ\DQ\HOY& KDOOJDWyViJJDO *UDVVHJHU YpJ]HWW kísérleteket, de a tesztelt szöyhjrv]wuindnfhqwxv~qpphwq\hoy&yrow

$] HOV NtVpUOHWEHQ 6, 0, illetve +6 db-es jel-zaj viszonyú beszéd esetén vizsgáltuk a 0F*XUN KDWiVW $ N O QE ] V]yWDJRNKR] XJ\DQD]W D KDQJRW V]LQNURnizáltuk. A hallgatók mindig b-t hallottak és b-t, d-t, g-t, vagy gy-t láttak. B válasz esetén hang dominanciát, d-b párnál d válasz esetén kép dominanciát állapítottunk meg. Ha g-t vagy gy-t láttak, b-t hallottak és d-t válaszoltak, McGurk hatást regisztráltunk. Az eredmények (1. ábra) 0 db-nél a Mc Gurk illúziypd[lpxpiwpxwdwmin5rvv]deeplqvpj&ehv]pgqpomreedqkdj\dwnr]xqn a vizuális jelre, amit kép dominancia formájában is tapasztalhattunk. +6 db-nél a hang ad több támpontot, amit hang dominancia formájában is érzékelhetünk. 0-dB jel-zaj viszony körül alakul ki a McGurk hatás maximuma. A csatolt videón Ön is kipróbálhatja a McGurk hatást. Az anyagon szótagokat hall és lát, PLQGHJ\LNHWNpWV]HUHJ\PiVXWiQ$]DNXV]WLNXVpVYL]XiOLVMHOHOWpU0LQGHQEHPRQGásnál be -t hallunk és mást-mást látunk. (PróbálMXNPHJKDOOJDWQLFVXNRWWV]HPPHO$]HOVV]yWDJ a be (kétszer), nincs ellentmondás a kép és a hang között. A második szótag a de. Ha de -t hallunk, a vizuális jel dominál. Ezután ge és gye látszik és ahogy már megszoktuk be hallatszik. Ha de -t érzékelünk, érvényesült a McGurk hatás.

G% G% G% 1. ábra A McGurk hatás 6, 0 és +6 db jel-zaj viszonynál (%). $ N YHWNH] NtVpUOHWEHQ D] HOEEL PiVVDOKDQJ]yNDW a, e, illetve i magánhangzók követték. Az eredmények e környezetben jóval több illúziót mutattak, mintµd KDQJHOWWpV kicsivel többet mint i HOWW D H L ieud0f*xunkdwivn O QE ]PDJiQKDQJ]yNN UQ\H]HWpEHQ $0F*XUNKDWiVHOWpUDUiQ\iQDNHJ\OHKHWVpJHVPDJ\DUi]DWDKRJ\DKiURPKDQJN ] OH]D legnyíltabb, itt látható legjobban a hangképzés. Összefoglalás $ URKDPOpSWHNEHQ IHMOG V]iPtWiVWHFKQLNDL HV]N ] N pv V]RIWYHUHN OHKHWYp WHV]LN RO\DQ PXOWLPpGLDDQ\DJRNHOiOOtWiViW DPHO\HN D] DXGLRYL]XiOLVHPEHULEHV]pGPHJpUWpVNXWDWiViW segítik. Olyan alkalmazásokat fejlesztenek, amelyek megkönnyíthetik a nagyothallók beszédmegértését és a gépi beszédfelismerés hatékonyságát is javíthatják.

Irodalomjegyzék 1. D. W. Massaro: Perceiving Talking Faces MIT Press, 1998. 2. T. Kuratate: Kinematics Based Syntesis of Realistic Talking Faces AVSP 98 Sydney, 1998. 3. Philip Rubin, Eric Vatikiotis-Bateson: Talking Heads AVSP 98 Sydney, 1998 4. S. Morishima: Real-time Talking Head Driven by Voice and its Application to Communication and entertainment AVSP 98 Sydney, 1998 5. N. M. Brooke: Talking Heads and Speech Recognisers That Can See D.G. Stork, M. E. Hennecke: Speechreading by humans and machines Springer-Verlag 1996. 6. L. Czap: Audio and Audio-visual Perception of Consonants Disturbed by White Noise and Cocktail Party ICSLP 98 Sydney 7. C. Benoit, T. G. Marigny, B. Le Goff, A. Adjoudani: Which Components of the Face do Humans and Machines Best Speechread? D.G. Stork, M. E. Hennecke: Speechreading by humans and machines Springer-Verlag 1996. 8. M. E. Hennecke, D. G. Stork, K. V. Prasad: Visionary Speech: Looking Ahead to Practical Speechreading Systems D.G. Stork, M. E. Hennecke: Speechreading by humans and machines Springer-Verlag 1996. 9. H. McGurk, J. W. MacDonald: Hearing Lips and Seeing Voices. Nature, 264. 1976. 10. K. P. Green: The Use of Auditory and Visual Information in Phonetis Perception D.G. Stork, M. E. Hennecke: Speechreading by humans and machines Springer-Verlag 1996.