Egérmutató vezérlése Electro-Oculo-Gram jelekkel Marlok Béla Diplomamunka Konzulens: Dr. Vidnyánszky Zoltán, Cserey György, Ph.D. Információs Technológiai Kar Pázmány Péter Katolikus Egyetem Budapest, 2007
Összefoglaló A közelmúlt éveiben jelentős kutatások folytak az emberi test különböző pontjain mérhető bioelektromos jelek gépek vezérlésére történő felhasználásának irányában. A tervezett eszközök legfőképpen a mozgáskorlátozottak számára jelenthetnek életminőség javulást, de egészséges emberek is képesek használatukra. A biológiai rendszerek hihetetlen bonyolultsága révén azonban, a bioleketromos jelek feldolgozása egyáltalán nem triviális feladat. A szemek körül, felszíni elektródákkal mérhető Elektro-okulogram is több különböző forrásból származó jel együttese amelyek egyike a tekintet szögének elfordulása. Az összes többi forrásból származó komponenst tehát ki kell szűrni a jelből, a tekintet irányának meghatározása érdekében. Diplomamunkám célja egy Elektro-okulogram alapú tekintet követő rendszer tervezése és megvalósítása, valamint a rendszer segítségével a számítógép kurzorának vezérlése. A rendszer egy szemmozgáson alapuló Human Machine Interface megvalósítására is felhasználható. A dolgozat a ma létező tekintet követő technikák összehasonlítása után, egy általános EOG alapú kurzor vezérlő rendszer tervét és az elkészített szoftver implementációját mutatja be. A dolgozat részletezi a megtervezett és implementált különböző szűrési és jelfeldolgozási algoritmusokat, majd a laboratóriumban készített mérések segítségével elemzi a rendszer működését.
Abstract Bioelectrical signals can be used to control machines, and there have been many significant researches in this field recently. These planned systems provide handicapped persons a remarkable improvement in the quality of their lives and healthy people may find them useful too. However, the processing of bioelectrical signals is not an easy task, because of the complexity of biological systems. Electro-oculogram can be measured around ones eyes with surface electrodes, and this signal usually contains information from several distinct sources. One of the sources is the movement of the eye, but all the other components must be filtered, in order to correctly estimate the gaze-angle. The aim of this study is to develop an electro-oculogram based eyegaze tracking system, and to control the cursor on a computer screen with it. The proposed system can be used to develop an eye-movement based Human-Machine-Interface. The study compares the different gaze tracking techniques available today, proposes a genereal scheme for an EOG based eye -tracking system and reviews the implemented EogMouse software. The study discusses the planned and implemented signal processing algorithms in detail, and evaluates the performance of the system with laboratory measurments.
Tartalomjegyzék 1. Bevezetés 1 1.1. Bioelektromos jelek.......................... 2 1.2. A szemmozgás............................. 3 1.3. Az emberi szem felépítése...................... 4 2. Tekintet követő technikák 9 2.1. Kontaktlencse alapú rendszerek................... 9 2.2. Videokamera alapú rendszerek.................... 11 2.2.1. Limbus és pupilla követő rendszerek............. 11 2.2.2. IROG............................. 12 2.2.3. Korneális reflexiót követő rendszerek............ 13 2.2.4. DPI.............................. 13 2.3. Electro-Oculográfia (EOG)...................... 14 2.4. A különböző technikák összehasonlítása............... 15 2.5. Szemmozgás alapú HMI....................... 16 3. Rendszerterv 18 3.1. Követelmény specifikáció....................... 18 3.1.1. Áttekintés........................... 18 3.1.2. Felhasználói követelmények................. 18 3.1.3. Általános célok........................ 19 3.1.4. Piaci célok........................... 19 3.1.5. Rendszerkorlátok....................... 20 3.1.6. Főbb rendszerfunkciók.................... 20 3.1.6.1. Aktorok....................... 20 i
TARTALOMJEGYZÉK ii 3.1.6.2. Használati esetek.................. 20 3.1.7. Hardver és szoftverkövetelmények.............. 22 3.2. Statikus modell............................ 22 3.2.1. Osztályok........................... 23 3.2.1.1. Eog Mouse System................. 23 3.2.1.2. Hardware Settings................. 24 3.2.1.3. I/O Settings.................... 24 3.2.1.4. Eog Data...................... 24 3.2.1.5. Calibration Data.................. 24 3.2.1.6. General Input Data................ 25 3.2.1.7. Noise Filter..................... 25 3.2.1.8. Cursor........................ 25 3.2.1.9. Calibration Sequence................ 25 3.2.1.10. Stimulus....................... 25 3.2.1.11. User Characteristics................ 26 3.3. Dinamikus modell........................... 26 3.3.1. A rendszer állapot diagramja és állapotai.......... 26 3.3.1.1. StartupWindow................... 28 3.3.1.2. ConfigureHardware................. 28 3.3.1.3. ConfigureIO..................... 28 3.3.1.4. IOSettingsOK.................... 28 3.3.1.5. Calibration..................... 28 3.3.1.6. ControlCursor................... 30 4. Mérések és mérőeszközök 32 4.0.2. Elektródák........................... 32 4.0.2.1. I. Konfiguráció................... 34 4.0.2.2. II. Konfiguráció................... 35 4.0.2.3. III. Konfiguráció.................. 35 4.0.3. Erősítők............................ 36 4.0.4. Recorder PC......................... 37 4.0.5. Analyzer PC......................... 37 4.0.6. Célképernyő.......................... 38
TARTALOMJEGYZÉK iii 4.0.7. A mérés kivitelezése..................... 38 4.0.8. A kalibrációs szekvencia................... 39 4.0.8.1. Stimulusok..................... 39 4.0.8.2. Markerek...................... 41 4.0.9. Validáció............................ 42 5. Jelfeldolgozás 44 5.1. A mérések során nyert adatok általános jellemzői......... 44 5.1.1. Magasfrekvenciájú zaj.................... 46 5.1.2. Drift.............................. 46 5.1.3. Cross-talk........................... 46 5.1.4. Pislogás............................ 49 5.1.5. Egyéb artefaktok....................... 49 5.2. Előfeldolgozás............................. 49 5.2.1. Csatornák összevonása.................... 51 5.2.2. Zajszűrés és simítás...................... 51 5.2.3. Pislogás szűrés........................ 53 5.3. A tekintet pozíciójának becslése és a kurzor vezérlése....... 57 5.3.1. Szakkád detekció....................... 59 5.3.1.1. Az optimális threshold értékek beállítása..... 60 5.3.1.2. A szakkádok detektálása.............. 61 5.3.2. A szakkád kezdő és végpontja................ 64 5.3.3. A szakkád relatív nagysága................. 66 5.3.4. A szakkád relatív nagysága és a tekintet szögének változása közötti összefüggés...................... 66 5.3.5. A kurzor vezérlése...................... 66 5.4. Validáció és eredmények....................... 68 5.4.1. Az IViewX pontossága.................... 68 5.4.2. Az EogMouse pontossága.................. 68 5.4.3. Dinamikus rekalibráció.................... 73
6. Az EogMouse program 74 6.1. A fejlesztői környezet......................... 74 6.2. A grafikus felhasználói felület.................... 75 6.2.1. Hardware Settings...................... 75 6.2.2. I/O Settings.......................... 76 6.2.3. Calibrate........................... 76 6.2.4. Run.............................. 77 6.2.5. Help.............................. 77 6.2.6. Quit.............................. 78 7. Összegzés és konklúzió 79 7.1. Összegzés............................... 79 7.2. Konklúzió............................... 79 References 84 iv
1. fejezet Bevezetés Becslések szerint az Európai Unióban a teljes lakosság 10-15 %-a mozgáskorlátozott vagy időskorú, ami kb. 50 millió embert jelent [1]. A mozgáskorlátozottság problémája a 60 év felettiek esetében, majdnem minden tizedik egyént érinti valamilyen formában. Különböző tanulmányok azt is kimutatták, hogy az egyének kora és mozgáskorlátozottságuk mértéke között igen erős összefüggés tapasztalható [2]. A világ fejlett országaiban, így az Európai Unió tagállamaiban is, az emberek várható élettartama növekszik, tehát a lakosság egyre nagyobb hányadának kell a közeljövőben a mozgáskorlátozottság problémájával szembenéznie. A mozgáskorlátozottak életkörülményeit javító alkalmazásokban azonban még manapság is hiány tapasztalható. Ezt felismerve, a közelmúlt éveiben, az eme témában folyó kutatások egyre több figyelmet és támogatást kaptak, és világszerte számos projekt indult az idősek illetve mozgáskorlátozottak kommunikációjának és mobilitásának gépekkel történő segítésére, ami növeli az életminőségüket és a szociális integrálódásuk esélyét [3]. A tradicionális (mechanikus) rendszerek továbbfejlesztése mellett egyre nagyobb szerepet kapnak a számítógéppel segített rendszerek. Mindkét esetben szükség van az ember és gép közötti kényelmes interakcióra, így a számítógépes rendszereknek is elengedhetetlen és egyben legfontosabb eleme maga az ember és a gép közötti kommunikációt létrehozó interfész. Az ideális interfész egyszerű (nem igényel betanítást a használata), gyors, robusztus és felhasználóbarát. A különböző hagyományos gépek vezérlésére a legelterjedtebb eszközök a gombok, pedálok és kallantyúk, míg a számítógépek esetében a billentyűzet, az egér, 1
1.1 Bioelektromos jelek 2 a touchpad és a joystick, melyek többé-kevésbé eleget is tesznek a fenti követelményeknek. Nem meglepő tehát, hogy a mozgáskorlátozottak segítésére tervezett eszközök esetében is eredményesen alkalmazhatóak, gondoljunk például a joystickkel vezérelt kerekesszékre. Ezekkel a hagyományosnak mondható eszközökkel nagyon jól végrehajthatók az egyszerűbb feladatok, azonban egy összetettebb feladat végrehajtásához már több ilyen eszköz egyidejű használatára van szükség, ami megnehezíti a vezérlést. Az összetettebb vezérlési műveletek a mozgáskorlátozottak számára akár fizikailag lehetetlen feladattá is válhatnak, így szükség van újfajta, más elven működő vezérlő eszközök kifejlesztésére. A fenti vezérlő eszközök további közös tulajdonsága, hogy közvetett motoros tevékenységet igényelnek. Közvetett motoros tevékenység például, amikor egy bizonyos cél érdekében, a felhasználónak egy meghatározott mozdulatot kell végrehajtania, aminek csak közvetve van kapcsolata magával a célcselekvéssel. A jövő vezérlőeszközei azonban már nem fognak motoros tevékenységet igényelni, hanem különböző szenzoraik révén mintegy megérzik, hogy mit akar a felhasználó. Ezeket a vezérlő eszközöket a motoros rendszerükben károsodott egyének is képesek lesznek használni, illetve sokkal összetettebb vezérlést is el lehet majd velük érni, hiszen a felhasználónak nem kell magára a vezérlésre figyelnie, hanem csak az elvégzendő feladatra. Ezen az újfajta vezérlésen alapuló interaktív eszközök újfajta vezérlőjeleket igényelnek, amire a különböző bioelektromos jelek kínálhatnak megoldást. 1.1. Bioelektromos jelek A bioelektromos jelek a különböző élő szervek, szervrendszerek működését kísérő akciós áramok, tehát mindig összefüggnek bizonyos szenzoros, motoros vagy kognitív folyamatokkal. Számos különféle bioelektromos jelet ismerünk és mérhetünk. Jelenleg az emberi test négy területén: az agy, a szív, az ideg-izomrendszer és a látórendszer vizsgálatainál hasznosítják legtöbbször a bioelektromos jeleket. Ilyenkor felveszik az agykéreg működését kísérő - a koponyán mérhető - elektromos jelformákat, ez az elektroenkefalogram (EEG); a szív működésekor fellépő és a testfelület egyes részein megjelenő elektromos jelformákat, ez az elektrokardiogram (EKG); az izmok működése során keletkező akciós feszültséget, ez
1.2 A szemmozgás 3 az elektromiogram (EMG), és a szem környékén mérhető, a szemmozgás által létrejövő potenciálváltozást az elektro-okulogramot (EOG). A bioelektromos jelek vezérlésre történő felhasználása mellett szólnak az alábbi érvek: 1. Könnyen és viszonylag egyszerű eszközökkel mérhetők (pl. olcsó, kisméretű elektródák) 2. A felhasználó nem fárad el a használatuk során 3. Mivel orvosi felhasználásuk igen elterjedt, a mérési módszereket már kifejlesztették és a mérőeszközök akár készen is kaphatók Ez a dolgozat a szemmozgás által létrejövő EOG vezérlésre történő felhasználásával foglalkozik így nem tér ki az EEG, vagy az EMG hasonló felhasználási lehetőségeire. 1.2. A szemmozgás A látás funkciójához szorosan kapcsolódik a szemgolyó mozgásképessége. Ezt 6 db külső szemizom biztosítja, melyek a szemgödör különböző részein erednek, és a szemgolyó külső, rostos burkán tapadnak. Összerendezett mozgásuk lehetővé teszi azt, hogy két szemünk együtt mozogjon. A szemmozgás az emberi mozgások egyik leggyakoribb fajtája, és az emberi információ feldolgozás is nagyrészt látásunkra támaszkodik. Információnkat a környezetünkről igen nagy százalékban (80-85 %) vizuális úton szerezzük, így sokat tanulhatunk abból, ha megfigyeljük, hogy pontosan hova és mennyi ideig tekint egy ember egy adott helyzetben. Ezt felismervén az elmúlt 30 évben számos kutatás foglalkozott a szemmozgás megfigyelésével. A szemmozgás kutatása az idegtudományok és a pszichológia területén is kiemelkedően fontosnak bizonyult. A nem tudatos szemmozgás vizsgálatával különböző szembetegségek, hatékonyan és eredményesen diagnosztizálhatóak, illetve az alvás során jelentkező gyors és lassú szemmozgások tanulmányozása is kiemelt figyelmet kapott a közelmúltban. Agyunk és látásunk működésének megértéséhez hasznosak az úgynevezett figyelmi térképek (saliencymap) is, melyeket különböző tekintet követő technikák segítségével készítenek. Makro- és mikro-szemmozgásokat különböztetünk meg. Az elektro-okulográfiával a makro-szemmozgások követhetők eredményesen. A makro-szemmozgások a következők:
1.3 Az emberi szem felépítése 4 Szakkádok Lassú, követő mozgások Vergens mozgások A szakkádok gyors, hirtelen mozgások, amikor mozdulatlan tárgy megfigyelésekor vagy olvasásnál a tekintet egyik fikszációs pontról a másikra ugrik. Az információ-felvétel a szakkádok közötti szünetben történik. A lassú, követő mozgások biztosítják a mozgó tárgyak megfigyelését. Ha a lassú követő mozgások és szakkádok váltakoznak (pl. vonatablakból való kinézés esetén), optokinetikus nisztagmusról beszélünk. A vergens mozgásoknál a 2 szemgolyó befelé vagy kifelé térül el, a megfigyelt tárgy távolságának függvényében. A szemmozgás bizonyos mértékig tudatosan is irányítható, és a mai fejlett technikákkal igen pontosan és gyorsan mérhető, illetve követhető. A gerincsérült, vagy másmódon mozgáskorlátozott emberek esetében a sérülés fokától függően különböző mértékben maradnak meg motoros funkciók, azonban a szemmozgás, szinte mindegyikük esetében megmarad. Egy szemmozgáson alapuló Human- Machine Interface (HMI), és a ráépülő számítógépes eszközök nagyban emelnék ezen emberek életminőségét, ill. a beszédfunkciójukat is elvesztettek esetében akár alapvető kapcsolatukat adhatják vissza a külvilággal. 1.3. Az emberi szem felépítése Ez a fejezet a különböző technikák működési elvének és korlátainak megértése érdekében röviden ismerteti az emberi szem felépítését. A látás páros szerve a szem, mely mindössze 2,4 cm átmérőjű és nagyjából gömb alakú. A szemgolyó védett helyen, a koponyacsontok által alkotott szemgödörben, zsírszövetbe ágyazva helyezkedik el. A külvilág felé is védőszervek biztosítják épségét: a szemhéjak a szélükön elhelyezkedő szempillákkal segítenek kivédeni a károsító mechanikai hatásokat, továbbá a reflexes pislogással és a szem akaratlagos zárásával megakadályozzák a szem kiszáradását. A szem elülső felszínét a szaruhártya területén kívül, valamint a szemhéjak belső oldalát egy vékony, átlátszó nyálkahártya borítja. Ez a kötőhártya (Conjunctiva), amely
1.3 Az emberi szem felépítése 5 1.1. ábra. Az emberi szem általános felépítése
1.3 Az emberi szem felépítése 6 szintén részt vesz a szemgolyó elülső felületének védelmében. Speciális sejtjei egy nyákos anyagot termelnek, amely segít a könny - film vékonyságú - rétegét a szem elülső felszínén tartani. A könnyet a szemgödör felső részében található könnymirigy termeli, és a pislogások során a szemhéjak oszlatják el a szem felszínén. A könny nedvesen tartja a szemet hozzájárulva ezzel az éleslátás kialakulásához, táplálja a szaruhártyát, és szerepet játszik a szem fertőzésekkel és fizikai károsításokkal szembeni védelmében. Elvezetési útjai a könnyet a belső szemzugból az orrüregbe továbbítják. A kívülről érkező fény útját követve sorra végigjárhatjuk a szemgolyó felépítésében résztvevő képleteket. A fénysugarak először a szaruhártyára (Cornea) érkeznek. Ez egy teljesen tiszta, átlátszó, óraüveg alakú törőközeg, amely a szem külső, fehér, rostos burkát alkotó ínhártyába (Sclera) illeszkedik be (lásd: 1.1 ábra). Domború felszíne összetéríti a rajta áthaladó fénysugarakat. A szaruhártya hibátlan alakja, felszínének egyenletessége és anyagának tisztasága az éles látás kialakulásának elengedhetetlen feltétele. A szaruhártya mögött egy tiszta folyadékkal, úgy nevezett csarnokvízzel teli térség található. Ez a szem elülső és hátsó csarnoka és a kettőt a szivárványhártya gyűrű alakú lemeze választja el egymástól. A csarnokvizet a sugártest termeli, a szem csarnokaiban tárolódik, majd az elülső csarnok szögletében, az úgy nevezett csarnokzugban vezetődik el. A csarnokvíz termelődése és elvezetése közötti egyensúly hozza létre a szem belső nyomását. A szemnyomás szigorú szabályozás alatt áll, mivel ez biztosítja a szemgolyó alakját és ezzel egészséges működését. A fény a szem hátsó részébe a pupillán vagy más nevén, szembogáron keresztül jut be. A pupilla körül látható, körkörös, színes terület a szivárványhártya (Iris), amelyben a pupillát szűkíteni illetve tágítani képes izmok helyezkednek el. Ezek feladata a szembe jutó fény mennyiségének szabályozása a környezeti fényviszonyoknak megfelelően. A szemgolyóban hátrafelé haladva a szivárványhártya folytatásában a sugártest található, belsejében a szemlencse domborúságát szabályozó sugárizommal és a csarnokvizet termelő szövetekkel, majd emögött az érhártya (Choroid) helyezkedik el. Utóbbi egy sűrű érhálózat, amely a szemgolyó falának külső, rostos burka (Sclera) és a legbelső ideghártya (Retina) közötti középső réteget képezi. Feladata az ideghártya vérellátásának biztosítása.
1.3 Az emberi szem felépítése 7 A hátsó szemcsarnok mögött elhelyezkedő szemlencse, a szaruhártyán kívüli másik fontos törőközeg. Egészséges szemben ez a kristálytiszta, rugalmas anyagú, domború képlet fókuszálja a fényt az ideghártyára. Alaphelyzetben, mikor a szem távolra néz, a lencsét körkörösen a sugártesthez felfüggesztő szalagok feszesek, és a lencse lapos. Közelre tekintéskor a sugárizom összehúzódik, emiatt a lencsefüggesztő rostok ellazulnak, és a lencse domborúsága saját rugalmasságánál fogva megnő. Ezzel törőereje is növekszik, és lehetővé válik az éles közeli látás. Az életkor előrehaladtával a lencse rugalmassága csökken, és fokozatosan egyre nehezebbé válik a törőerő növelése, azaz a közelre nézés, így alakul ki az öregszeműség. A szemlencse mögött, a szemgolyó térfogatának legnagyobb részét kitevő átlátszó, kocsonya-szerű anyag található. Ez az üvegtest, amely 98%-ban vízből áll. Feladata a fény áteresztése a mögötte elhelyezkedő ideghártya felé. Újszülött korban irányítja a szemgolyó növekesését, a későbbiekben pedig szerepe van az ideghártya mechanikai védelmének biztosításában. Egészséges fénytörésű szemben a beérkező fénysugarak az üvegtesten való áthaladás után végül az ideghártyára (Retina) érkeznek meg, és itt egyesülnek éles képpé. A törőközegek által összetérített fénysugarak fókuszpontja az ideghártya központi, kiemelt jelentősségű területére, a sárgafoltra (Macula) esik, aminek centrumában helyezkedik el a fovea vagy látógödör. Ez az éleslátás tényleges kialakulásának a helye. A fovea nem esik egybe pontosan a szem optikai tengelyével (Optic axis lásd: 1.1 ábra), amit a szemgolyó középpontja és a pupilla közepe definiál. A foveát és a pupilla közepét összekötő egyenes a vizuális tengely (Visual axis). A vizuális tengely iránya határozza meg azt a pontot, amire az egyén figyelme irányul, és nem az optikai tengely. A szemben kb. 127 millió receptorsejt szolgál a fényinger felvételére és kémiai ingerré történő átalakítására. Ezeket a sejteket alakjuk után pálcikáknak és csapoknak nevezik. Bennük a fény hatására olyan kémiai anyagok termelődnek, amelyek több átkapcsolódáson keresztül, további idegsejteken végighaladva továbbítják a külvilág fényingereit az agy felé. Az ingerületet továbbító idegsejtek nyúlványai az egész ideghártya felszínéről a látóidegfőben (Papilla) szedődnek össze. A látóideg innentől már a szemgolyón kívül folytatja útját az agy látásért felelős területei felé. A látópálya végül az agykéreg látásért felelős központjaiban ér
1.3 Az emberi szem felépítése 8 véget, ahol megtörténik az ideghártyán kialakult kicsinyített, fordított kép értelmezése és magasabb szintű feldolgozása.
2. fejezet Tekintet követő technikák A tekintet követő rendszerek (Eye Gaze Trackers), olyan eszközök, amelyek különböző technikák segítségével megbecsülik az alany tekintetének irányát. A tekintet becsült pozíciója felhasználható diagnosztikára és vezérlésre is. Ez a fejezet rövid áttekintést ad a ma létező tekintet követő technikákról. Összehasonlítja és értékeli az elektro-okulográfiát használó technikát vezérlésre történő felhasználási lehetősége függvényében. 2.1. Kontaktlencse alapú rendszerek Ezek a rendszerek a legpontosabb szemmozgás mérő technikák közé tartoznak. Közös jellemzőjük, hogy egy kontaktlencsébe épített referenciaobjektum elmozdulását mérik. A kontaktlencsének viszonylag nagynak kell lennie, a szaruhártyán túl a szklerára is ki kell terjednie, mert így megelőzhető a használat során az elcsúszása. Különböző mechanikus, optikai és indukciós referenciaobjektumokat is használnak, de manapság elsősorban indukciós tekercset építenek a lencsébe. A tekercs elmozdulása elektromágneses térben mérhető. A 2.1 ábrán látható egy indukciós tekerccsel ellátott kontaktlencse, illetve a 2.2 ábrán a méréshez használt elektromágneses mezőt előállító keret. Habár a kontaktlencse alapú rendszerekkel akár 5-10 szögmásodperc pontossággal is meghatározható a tekintet iránya (egy limitált tartományban [9]), ez az egyik leginkább intruzív módszer. A lencse felhelyezésére egy példa a 2.3 ábrán látható. A lencse pontos felhelyezése igen nagy odafigyelést és szakértelmet 9
2.1 Kontaktlencse alapú rendszerek 10 2.1. ábra. Kontaktlencsébe épített tekercs 2.2. ábra. A vizsgálathoz használt keret 2.3. ábra. A kontaktlencse felhelyezése.
2.2 Videokamera alapú rendszerek 11 igényel, ráadásul viselése is igen kényelmetlen, így a módszer leginkább laboratóriumi vizsgálatokra alkalmas. 2.2. Videokamera alapú rendszerek A legtöbb tekintet követő rendszer a videokamera alapú rendszerek közé sorolható. A kamerát használó tekintet követő rendszerek alapja a szem egy-egy olyan tulajdonsága, ami optikai eszközökkel jól felismerhető és követhető. A rendszerek általában saját referencia fényforrást használnak a jobb képminőség elérése érdekében. Ezen rendszerek többsége megvalósítható kevésbé intruzív eszközökkel. 2.2.1. Limbus és pupilla követő rendszerek A limbust és a pupillát követő technikák igen elterjedtek. A limbus a szklera és az írisz (lásd 1.3 fejezet) határfelülete. A két régió igen eltérő színe miatt fellépő erős kontrasztnak köszönhetően a limbus viszonylag könnyedén követhető horizontálisan, azonban a szemhéjak általában eltakarják az írisz egy részét, így a limbus-t követő rendszereknek kisebb a vertikális pontossága. A pupillát valamivel nehezebb követni, mivel kisebb a kontraszt a pupilla és az írisz határán, azonban a szemhéjak általában nem takarják. Sok tekintet követő rendszer infravörös fényforrást használ, hogy növelje a pupilla és az írisz kontrasztját, mivel ilyenkor a retináról visszaverődő fény miatt a pupilla fehérnek látszik. A 2.4 ábra bal oldalán látható a normál fényt használó rendszerrel kapott kép, míg a jobb oldalon az infravörös fényforrást használó rendszerrel kapott kamerakép. További előnye az infravörös fényforrásnak, hogy az emberi szem számára nem látható, így nem zavarja a felhasználót. A gyakorlatban általában az infravörös tartományhoz igen közel eső, kb. 880 nm hullámhosszú fényt alkalmaznak, ami majdnem teljesen láthatatlan az emberi szem számára, de a legtöbb közönséges kamerával még érzékelhető [4].
2.2 Videokamera alapú rendszerek 12 2.4. ábra. Sötét és világos pupilla 2.2.2. IROG Reulen és munkatársai [5] a limbus követő technika egy infravörös fényforrást használó variációját fejlesztették ki, a rendszert IROG-nak nevezték el. Infravörös fényt kibocsátó diódákat és infravörös fényre érzékeny foto-tranzisztorokat helyeztek el a szem felett és alatt. A dióda-tranzisztor párokat különböző szemüvegekbe és sisakokba építik, oly módon, hogy a limbus minden helyzetben meg legyen világítva, különösen a limbus nazális és temporális oldala. A foto-tranzisztorok a visszavert infravörös fényt feszültséggé alakítják. A nazális és a temporális tranzisztorok feszültségének különbsége arányos a tekintet szögével. A 2.5 ábrán a Skalar cég fejreszerelhető, infravörös fényforrást használó (IROG) limbus követő rendszere látható. 2.5. ábra. A Skalar cég IRIS IR elnevezésű, fejre szerelhető infravörös limbus trackere
2.2 Videokamera alapú rendszerek 13 2.2.3. Korneális reflexiót követő rendszerek A fényforrás generálja az úgynevezett korneális reflexiót, ami egy csillogó pont a kornea felszínén, és ami az 2.4 ábra bal oldali képén is jól kivehető a pupilla közelében. Ezt a pontot használja referencia pontként a korneális reflexió technika. A technika a fix fényforrás által generált reflexió helyét és a pupilla közepét hasonlítja össze. Ha a két pont egybeesik, akkor a felhasználó pontosan a kamerára tekint. Ha nem esik egybe, akkor a kettő közötti távolságból, illetve a reflexió eltérülésének irányából megállapítható a tekintet elfordulási szöge a kamerához képest. A rendszer időbeli felbontása 30-60Hz-ig terjed, ami elegendő a legtöbb szemmozgás érzékeléséhez. A térbeli felbontása a kamera lencseméretétől, illetve a kamera és a szem távolságától függ. Felnőtt alanyok vizsgálata és fix fejpozíció ( max. 2 cm elmozdulás ) esetén, a térbeli felbontás elérheti a 0.1 -ot [6]. 2.2.4. DPI Cornsweet és Crane egy nagyon pontos tekintet követő technikát ismertet [7], ami az első és a negyedik Purkinje-féle tükörképet használja. A Purkinje-féle tükörképek, a szem különböző rétegei felől érkező fényvisszaverődések (lásd 2.6 ábra). 2.6. ábra. A Purkinje-féle tükörképek
2.3 Electro-Oculográfia (EOG) 14 Az első Purkinje-tükörkép (azaz a korneális reflexió) a szaruhártya és a környezet határáról verődik vissza. Ez a legfényesebb és a legegyszerűbben detektálható, illetve követhető reflexió. A többi Purkinje-tükörkép detektálásához már speciális hardver szükséges, azonban a harmadik és a negyedik tükörkép a tekintet térbeli helyének becslésére is használható, mivel ezek pozíciója a szemlencse alakjától is függ [7]. A kettős Purkinje-tükörkép követő rendszer (Dual Purkinje Imaging vagy DPI) alapja az a jelenség, hogy a szemek transzlációs mozgása esetén a két Purkinje-tükörkép (az első és a negyedik) együtt mozog, azonban a szemek elfordulása esetén különböző mértékben mozdulnak el. Ez a különbség arányos a szem elfordulásával. A szerzők a rendszer térbeli pontosságát kb. 1 -ben állapítják meg, azonban ilyen nagymértékű pontosság eléréséhez mindenképpen szükséges a fej stabilizációja. A 2.7 ábrán látható egy DPI alapú tekintet követő rendszer. 2.7. ábra. A Fourward Optical Technologies DPI követő rendszere 2.3. Electro-Oculográfia (EOG) Emil du Bois-Reymond 1848-ban megfigyelte, hogy a szem szaruhártyája elektromosan pozitív töltést mutat a szemfenékhez képest. Ez a corneo-retinális potenciál az alapja a szemek környékén, felszíni elektródákkal is mérhető elektrookulogramnak. A potenciálmező a szemmel együtt forog, következésképpen a szem horizontális és vertikális mozgási síkjainak megfelelően elhelyezett elektródák a szem mozgásainak megfelelő potenciál-változásokat detektálnak (lásd: 2.8 ábra). Ez a jel felhasználható az elfordulás mértékének, azaz a tekintet irányának meghatározására.
2.4 A különböző technikák összehasonlítása 15 2.8. ábra. Az EOG kialakulása A korneo-retinális potenciál általában 50 és 3500 mikrovolt közé esik, frekvencia tartománya kb. Dc-100 Hz-ig terjed. A viselkedése ±30 fokig terjedő szemmozgások esetén lineárisnak tekinthető [2]. A mért potenciál azonban nemcsak egyénenként, de időben is változhat, akár azonos mérési körülmények esetén is, valamint biológiai artefaktokkal és a környezetből eredő elektromos zajjal is terhelt. Az EOG alapú rendszerekkel elérhető legnagyobb pontosság horizontálisan 1, vertikálisan kb. 2 [9]. Az EOG-s szemkövetés legnagyobb előnyei, az egyszerű hardware és az alacsony ár. A diplomamunka keretében végzett EOG-mérések megvalósításának részletes leírását, valamint a mért jelek tulajdonságait a 4. fejezet tárgyalja. 2.4. A különböző technikák összehasonlítása Az előző fejezetek bepillantást nyújtottak abba, hogy a különböző technikák esetében mit és hogyan mérnek a tekintet irányának megbecsülése érdekében. A kapott mérési adatokat, mint például a pupilla pozícióját, a limbus pozícióját,
2.5 Szemmozgás alapú HMI 16 a bőrfelszíni potenciálokat, stb. ezután meg kell feleltetni a szem orientációját leíró koordinátáknak. A mért adatok és a szem orientációja közötti összefüggés megtalálásához általában egy kalibrációs eljárásra is szükség van. A kalibrációs eljárás során a felhasználónak pontosan meghatározott helyű vizuális célpontokra kell irányítania a tekintetét, miközben a szóban forgó mérést elvégzik. Az így kapott adatpárokból ezután egy általános leképezés számolható ki, ami ideális esetben lineáris függvény. Azoknál a technikáknál, ahol a szem orientációját a fej pozíciójához képest mérik, a felhasználó fejpozíciója a kalibráció alatt és után nem változhat. A 2.1 táblázat összefoglalja a tradicionális tekintet követő technikák legfontosabb jellemzőit. 2.1. táblázat. Tekintet követő technikák jellemzői [4] nyomán Technika Pontosság Megjegyzés Kontaktlencse 1 Gyors és pontos, de nagymértékben intruzív EOG 2 Alacsony költség, egyszerű eszközök IROG 2 Fejre szerelhető, limbust követi DPI 1 Fejfixációt igényel, nem intruzív Limbus tracker 1 Kamera alapú, vertikálisan kisebb a pontossága Pupilla tracker 1 Kamera alapú, nehéz a pupilla detetktálása 2.5. Szemmozgás alapú HMI A szemmozgást vezérlésre használó ideális HMI az alábbi követelményeknek tesz eleget: nagy pontosság és gyorsaság alacsony ár egyszerű használat, nem igényel betanítást komfort mobilitás
2.5 Szemmozgás alapú HMI 17 Minden követelménynek maximálisan eleget tevő tekintet követő technika jelenleg nem létezik, így egy konkrét rendszer megvalósításához a technikát a rendszer pontos felhasználási területének figyelembevételével kell megválasztani. Ez a dolgozat egy EOG alapú tekintet követő rendszer tervezésével és megvalósításával foglalkozik. Az EOG alapú tekintet követés, nem tartozik a ma létező legpontosabb technikák közé. Térbeli és időbeli felbontása azonban elegendő vezérlőjelek előállításához egy Human Machine Interfész számára. Legfőbb előnye a rendkívül szerény eszközigénye, amiből következik a nagyon alacsony költsége is. További előnye, hogy nem intruzív, és nem igényel nehéz, fejre erősített szerkezetet. Jövőbeli, mindennapi életben történő alkalmazása azonban nem valószínű, az elektródák negatív esztétikai hatása miatt. Az EOG alapú rendszerek kivitelezésénél a legfőbb problémát a korneo-retinális potenciál spontán lassú elkúszása (az úgynevezett drifting), valamint a pislogásból, illetve az izommozgásokból eredő artefaktok kiszűrése jelenti.
3. fejezet Rendszerterv Ez a fejezet ismerteti a rendszertervet. A rendszerterv nem egy konkrét alkalmazásra készült, hanem egy általános, EOG alapú vezérlést használó szemmozgás felismerő szoftver rendszert mutat be. A tervezésnél törekedtem követni az UML metodikát. A rendszert különböző aspektusokból ismertető rendszerterv főbb alkotóelemei a követelmény specifikáció, a statikus- és a dinamikus rendszermodell. 3.1. Követelmény specifikáció 3.1.1. Áttekintés A szemmozgásból eredő bioelektromos jelek, más néven az Elektro-Okulo-Gram (lásd: 2.4 fejezet), a szemek körül a bőrfelszínre tapasztott elektródákkal mérhető. A tervezett szoftver rendszer a felhasználón mért Electro-Oculo-Gram alapján meghatározza a felhasználó tekintetének irányát. A szoftver a felhasználó előtt elhelyezett síkképernyőn, a meghatározott irány alapján a kurzort irányítja. 3.1.2. Felhasználói követelmények A rendszer a felhasználón mért Electro-Oculo-Gram alapján határozza meg a tekintet irányát, illetve a szemmozgást. A rendszerrel lehessen a számítógép képernyőjén a kurzort irányítani. felhasználó tetszőleges fizikai paraméterekkel rendelkezhet. 18
3.1 Követelmény specifikáció 19 rendszert tetszőleges méretű és tetszőleges távolságra levő képernyővel is lehessen használni. rendszer törekedjen minél nagyobb térbeli pontosságra. rendszer törekedjen minél nagyobb időbeli pontosságra. rendszer törekedjen a robusztusságra. 3.1.3. Általános célok A rendszer bemenete az EOG regisztrátum, kimenete a képernyőn a kurzor pozíciója, vagy sebessége. A kurzor kívánt helyre történő mozgatásához, a felhasználó tekintetének minél pontosabb meghatározására van szükség. A megfelelő pontosság elérése érdekében a beérkező, zajjal terhelt EOG jeleken szűrést kell végezni, és a szűrt jelekből kell meghatározni a tekintet irányát. A szűrt jelből és a felhasználó egyedi paramétereiből meg kell határozni a felhasználó tekintetének a képernyő középpontjához viszonyított horizontális és vertikális szögét. A kurzort a tekintetből kinyert vezérlő parancsnak megfelelően kell mozgatni. Az EOG mérések sajátosságából adódóan (lásd: 2.4 fejezet) minden egyes mérés és mért alany egyedi paraméterekkel rendelkezik. A felhasználó egyedi paramétereinek meghatározása érdekében a rendszert kalibrálni kell. A célképernyő méretét, felbontását és távolságát a felhasználó adhatja meg. 3.1.4. Piaci célok A rendszer a Pázmány Péter Katolikus Egyetem egy hallgatójának Diplomatervének része. Elsősorban kísérleti, kutatási célból lesz fejlesztve, így laboratóriumi körülmények közötti vizsgálatok végzésére a legalkalmasabb. Hasonló rendszerekkel szembeni legfőbb előnye az alacsony költség, és az egyszerű használat.
3.1 Követelmény specifikáció 20 3.1.5. Rendszerkorlátok A rendszerterv nem foglalkozik az EOG mérések megvalósításával, az alkalmazott mérőeszközökkel, illetve a jelek A/D átalakításával. A mérések megvalósítását a 4. fejezet tárgyalja, de a rendszerterv ettől független. A rendszer az EOG jeleket meghatározott digitális formátumban kapja a bemeneti interfészre. A rendszer megfelelő működéséhez minimum 4 csatorna jelére van szükség, lehetőleg 2 horizontális illetve 2 vertikális csatornára. A 2 vertikális és horizontális csatorna nagyjából egymás negált jelét tartalmazza, azaz például 1-1 elektróda legyen a szem alatt és fölött, valamint 1-1 a jobb és bal oldalán. A rendszer kalibrálása után a felhasználó fejpozíciója, a képernyőméret és a képernyőtávolság nem változhat. Ha mégis változik, a kalibrációt meg kell ismételni. 3.1.6. Főbb rendszerfunkciók A szoftver rendszer négy legalapvetőbb funkciója: a hardware paraméterek állíthatósága, a bemenet konfigurálása, a kalibráció és a kurzormozgatás. A 3.1 ábrán a rendszer használati eset (Use case) diagramja látható. 3.1.6.1. Aktorok A rendszernek egyetlen aktora van, a felhasználó (lásd: 3.1 ábra:user). A felhasználó az a személy, akin az EOG mérés végzendő, és aki a tekintetével vezérlheti a kurzort a képernyőn. 3.1.6.2. Használati esetek 1. Change Hardware Settings: A felhasználó itt állíthatja be a különböző hardver paramétereket, pl: képernyőméret, felbontás, képernyő távolsága, stb. Opcionális Use case, nem kötelező a program minden egyes futása során használni, de a rendszer pontos működése csak abban az esetben garantálható, ha beállítások megegyeznek a valós értékekkel. 2. Configure Data IO: A felhasználó itt konfigurálja az Input/Output interfészeket. Megadhatja pl. az adatszerver IP címét, vagy a markerek
3.1 Követelmény specifikáció 21 3.1. ábra. A rendszer Use case diagramja
3.2 Statikus modell 22 küldésére használandó portot. A rendszer további funkcióinak elérése érdekében, legalább egyszer be kell állítani a helyes értékeket. 3. Calibrate: A felhasználó itt kalibrálja a rendszert, saját fizikai paramétereihez. A kurzor vezérlése előtt a rendszert legalább egyszer sikeresen kalibrálni kell. Kalibráció csak akkor hajtható végre, ha a Configure Data IO eset már legalább egyszer szabályosan lefutott. Érvénytelen kalibráció vagy érvénytelen Input/Output beállítások esetén a szoftver figyelmezteti a felhasználót. A kalibráció érvénytelenné válik, ha a program újraindul, felhasználó váltás történt, vagy megváltoztak a hardver paraméterek. A kalibráció igény esetén akárhányszor megismételhető. 4. Control Cursor: A felhasználó bekapcsolhatja az EOG alapú kurzorvezérlést. Bekapcsolt esetben a kurzor a képernyőn a felhasználó tekintetéből kinyert vezérlőjelek alapján mozog. Csak akkor használható, ha a legutóbbi kalibráció sikeresen lefutott. A kurzorvezérlés kikapcsolása a billentyűzet egy tetszőleges billentyűjének lenyomásával lehetséges. 3.1.7. Hardver és szoftverkövetelmények min. 1000 Mhz CPU min. 512 Mb RAM min. 250 Mb memory Windows XP.Net Framework 2.0 Matlab Component Runtime v7.6 3.2. Statikus modell A statikus modell szerkezeti szempontból elemzi a rendszert. A következő kérdésekre ad választ: milyen egységekből épül fel a rendszer, mi ezeknek az egységeknek a feladata, illetve milyen kapcsolatban vannak egymással a megoldás elérésének
3.2 Statikus modell 23 az érdekében. [12] Az 3.2 ábrán látható a rendszer osztálydiagramja (Class diagram). A rendszerhez egy osztálydiagram tartozik, amely a rendszer egész idejére jellemző. 3.2. ábra. A rendszer osztály diagramja 3.2.1. Osztályok 3.2.1.1. Eog Mouse System Az Eog Mouse System osztály tekinthető a rendszer központi osztályának, kapcsolatban áll a rendszer összes többi osztályával. Az osztályból egyetlen példány készül. A rendszer központi vezérlést alkalmaz, ebből az osztályból indul ki az összes vezérlési utasítás. Ez az osztály foglalja egységbe az egész rendszert, és
3.2 Statikus modell 24 nagymértékben felelős a program helyes működéséért. Ez az osztály valósítja meg a program elsődleges felhasználói felületét. 3.2.1.2. Hardware Settings A Hardware Settings osztály szerepe a hardver beállítások tárolása, illetve a beállítások megváltoztatásához szükséges, kényelmes felhasználói felület biztosítása. Az osztályból egyetlen példány készül. A beállítások megváltoztatása az éppen aktuális kalibrációt érvényteleníti. A hardver paraméterek ismerete (pl. a képernyő mérete, felbontása és távolsága) nélkülözhetetlen azon folyamat során, amikor a rendszer a tekintet horizontális és vertikális szögéből meghatározza a tekintet x és y koordinátáját a célképernyőn. 3.2.1.3. I/O Settings Az I/O Settings osztály szerepe az Input és Output beállítások tárolása, illetve a beállítások megváltoztatásához szükséges felhasználói felület biztosítása. A osztályból egyetlen példány készül. Ez az osztály tárolja például a bejövő EOG adat szerverének IP címét, vagy a kalibráció során, a markerek küldésére használt port címét. 3.2.1.4. Eog Data Absztrakt osztály, szerepe a bejövő csatornák EOG adatainak tárolása. Két osztály származtatható belőle: Calibration Data és a General Input Data osztály. 3.2.1.5. Calibration Data A Calibration Data osztály az Eog Data osztály egyik megvalósítása. Egyszerre egyetlen példány létezik belőle, ami a kalibráció kezdetekor jön létre. Feladata a kalibráció alatt mért EOG jelek és a különböző mérési paraméterek tárolása, mint pl. a bejövő csatornák száma, neve, mértékegysége, illetve az alkalmazott mintavételezési frekvencia. A Calibration Data és a Calibration Sequence osztály példányainak attribútumai alapján számolja ki a rendszer a felhasználó egyedi paramétereit (User Characteristics).
3.2 Statikus modell 25 3.2.1.6. General Input Data A General Input Data osztály az absztrakt Eog Data osztály egyik implementációja. Feladata a kurzor mozgatási fázis során a bejövő EOG adatok tárolása. A rendszer az osztály példányának attribútumait dolgozza fel a felhasználó pillanatnyi tekintetének meghatározására és a kurzor megfelelő helyre történő mozgatására. 3.2.1.7. Noise Filter A Noise Filter osztály tartalmazza az adatok feldolgozásánál használt szűrési algoritmust. Feladata a bejövő zajjal terhelt adatok szűrése a pontosabb feldolgozás érdekében. Egy példány létezhet belőle, hiszen a kalibráció és a kurzor mozgatás során ugyanazt a szűrést kell alkalmazni. A Calibraton Data és a General Input Data osztályok példányaiban tárolt EOG regisztrátumokon végez szűrést. 3.2.1.8. Cursor A Cursor osztály reprezentálja a képernyőn megjelenő egérmutatót. A rendszer ezt a mutatót mozgatja az EOG jelek alapján. 3.2.1.9. Calibration Sequence A Calibration Sequence osztály példánya tartalmazza a kalibráció során, a felhasználónak vetített összes stimulust (Stimulus osztály). A stimulusok meghatározott időközönként és sorrendben jelennek meg a képernyőn. 3.2.1.10. Stimulus A Stimulus osztály példánya egyetlen stimulust reprezentál, ami a kalibráció alatt, a képernyő egy meghatározott pontján, meghatározott ideig látható kereszt vagy más szimbólum. Az osztályból határozatlan számú példány készülhet, amik a Calibration Sequence osztály példányában vannak meghatározott sorrendben tárolva. A stimulusok tartalmazzák a megjelenítésük x és y koordinátáját, valamint a megjelenítendő szimbólumot. A stimulusok tartalmazzák az EOG-t felvevő készüléknek, a felvillanás pillanatában a kimeneti porton küldendő kódot (azaz a markereket) is. A felvett adatokból és a markereket tartalmazó fájlból
3.3 Dinamikus modell 26 a rendszer meg tudja állapítani az EOG jelekben a stimulusok felvillanásának, illetve eltűnésének pontos helyét. Ezt az információt felhasználva a rendszer meg tudja állapítani a felhasználó egyedi karakterisztikáit (User Characteristics). 3.2.1.11. User Characteristics A User Characteristics osztály példányának szerepe a felhasználón mért EOG egyedi karakterisztikájának tárolása. Az osztálynak egyszerre egyetlen példánya létezhet, ami a kalibráció utolsó fázisában jön létre és kap értékeket. A tárolt karakterisztikát a rendszer a kurzor mozgatás fázisában használja, az EOG csatornákon mért potenciálból a felhasználó tekintetének horizontális és vertikális szögeinek meghatározására. 3.3. Dinamikus modell A rendszert dinamikus szempontból vizsgálva arra keressük a választ, hogy a rendszer egyes részegységei hogyan viselkednek a probléma megoldása során. Az egységek milyen állapotokat vesznek fel, milyen események hatására változik az állapotuk, milyen a közöttük lévő együttműködés mechanizmusa és időben hogyan játszódnak le közöttük az üzenetek. [12] Az osztályok dinamikus viselkedését a probléma megoldása során az állapotdiagram írja le, ami egy állapotautomatát ábrázol. A 3.3 ábrán látható a rendszer állapot diagramja. 3.3.1. A rendszer állapot diagramja és állapotai A rendszer állapot diagramja a 3.3 ábrán látható. A kezdeti állapotból a rendszer a StartupWindow állapotba kerül, majd várakozik a felhasználótól érkező parancsra, ami például a felhasználói felület egy gombjának megnyomását jelenti. Az állapotátmenetek nevei a jelentésüket próbálják tükrözni, ennek érdekében néhány elnevezési szabályt alkalmaz az ábra. A btn prefix a lehetséges események nevei elején az angol button szóból ered és gombot jelent. A Click postfix pedig az egérkattintás által kiváltott eseményt jelöli, azaz például a btn- Quit Click() esemény jelentése, hogy a felhasználó a Quit gombra kattintott.
3.3 Dinamikus modell 27 3.3. ábra. A rendszer állapot diagramja
3.3 Dinamikus modell 28 A pre- és postfix nélküli eseményeket nem a felhasználó váltja ki, hanem a rendszeren belülről érkeznek, kivéve a KeyDown eseményt, aminek a jelentése a billentyűzet egy tetszőleges billentyűjének leütése. 3.3.1.1. StartupWindow A rendszer az elindítás után a StartupWindow állapotban várakozik és az elsődleges grafikus kezelőfelületet mutatja a felhasználó felé. Ebből az állapotból a rendszer csak felhasználói input hatására tud továbblépni. 3.3.1.2. ConfigureHardware A ConfigureHardware állapotba lépve, a hardver paraméterek beállítása lehetséges, és innen csak ismét a StartupWindow állapotba lehet továbbjutni, mivel a hardver paraméterek megváltozása esetén többek között a rendszer kalibrációját is meg kell ismételni. 3.3.1.3. ConfigureIO A ConfigureIO állapotban a felhasználó konfigurálhatja a rendszer Input és Output interfészeit. A legfontosabb állapotok (Calibration és ControlCursor) csak ebből az állapotból továbblépve (az IOSettingsOK állapoton keresztül) érhetők el. Ez biztosítja, hogy a rendszer be- és kimeneti interfészei helyesen legyenek beállítva a kalibráció, vagy a kurzor mozgatás kezdete előtt. 3.3.1.4. IOSettingsOK A ConfigureIO állapotból juthat ide a rendszer, azonban csak az Input és Output interfészek helyes beállítása után. Ez jelentheti például azt, hogy a rendszer sikeresen csatlakozott az EOG jeleket küldő szerverhez. 3.3.1.5. Calibration A Calibration állapot, azaz a kalibráció az IOSettingsOK állapotból érhető el a Calibration gombra kattintva. Ez az állapot egy összevont állapot, azaz a rendszer kalibrációja több kisebb állapotra bontható. A Calibration állapot részletes kifejtése az 3.4 ábrán látható.
3.3 Dinamikus modell 29 3.4. ábra. A Calibraton állapot részletes kifejtése
3.3 Dinamikus modell 30 A kalibráció 5 alaplépése a következő: 1. Csatlakozás az EOG jeleket szolgáltató szerverhez 2. A stimulusok prezentálása, a markerek küldése a recorder felé és az ez idő alatt kapott eog jelek felvevétele 3. Az összes adat mentése 4. Az adatok szűrése és feldolgozása 5. A felhasználó egyedi paramétereinek meghatározása A rendszer csak sikeres kalibráció esetén léphet tovább a CalibrationDone állapotba, ez biztosítja, hogy még a kurzor vezérlése előtt megtörténik a kalibrálás. Hiba esetén a rendszer visszakerül (a CalibrationError állapoton keresztül) az IOSettingsOK állapotba, miközben tájékoztatja a felhasználót a hiba lehetséges okairól. 3.3.1.6. ControlCursor A ControlCursor állapot jelenti azt, amikor a felhasználó a tekintetével vezérli a kurzort a képernyőn. Az állapot részletes kifejtése a 3.5 ábrán látható. Ebbe az állapotba a rendszer csak sikeres interfész konfiguráció és kalibráció után juthat el. A rendszer hiba, vagy a billentyűzet tetszőleges gombjának megnyomása esetén leállítja az EOG alapú kurzorvezérlést, és visszatér CalibrationDone állapotba, illetve tájékoztatja a felhasználót a hiba lehetséges okairól.
3.3 Dinamikus modell 31 3.5. ábra. A ControlCursor állapot részletes kifejtése
4. fejezet Mérések és mérőeszközök A rendszer tesztelése és az off-line szimulációk adatainak gyűjtése érdekében számos mérés történt. Az elektro-okulogram mérések a Pázmány Péter Katolikus Egyetem Információs Technológiai karának Látáskutató Laboratóriumában készültek. A mérések a labor EEG-mérő készülékével történtek, hiszen az EEGmérés és az EOG-mérés is a bőrfelszíni potenciálokat méri, csak a fej különböző területein. A mérés során felhasznált legfontosabb eszközöket és az eszközök közötti kommunikációt a 4.1 ábra szemlélteti. A következő fejezetek részletesen tárgyalják, a felhasznált eszközöket, illetve a mérések kivitelezését, és a kapott eredményeket. 4.0.2. Elektródák Az elektro-okulogram rögzítése ezüst/ezüst-klorid passzív-elektródákkal történt. Az elektródákat a laborban rendszerint EEG mérésre használják. A jelminőség javítása érdekében az elektródák felhelyezése előtt a kérdéses bőrfelületet meg kell tisztítani a szennyeződésektől és az elhalt hámsejtektől (például alkoholos vattával), valamint az elektróda és a bőr közé egy speciális elektróda-gélt kell felvinni. Az elektródák rögzítése a bőrfelszínen ragasztószalaggal történt, így nem csúszhattak el a mérés alatt. Az alkalmazott elektródák és elektróda-gél az 4.2 ábrán látható. Az elektródákkal regisztrálható EOG jelek hasznos információ tartalma nagyban függ az elektródák pozíciójától. Az ideális elektróda konfiguráció meghatározása érdekében 3 féle konfigurációval is történtek mérések. Az eog-t mérő 32
33 4.1. ábra. A rendszer felépítése 4.2. ábra. A felhasznált elektródák, elektróda-gél és alkohol a bőrfelület megtisztításához
34 elektródákon kívül egy referencia- és egy föld-elektródára is szükség van. A referencia elektróda helye általában a homlok közepe, a földé pedig a bal fülcimpa. A referencia és a föld-elektróda mindhárom tesztelt konfiguráció esetén azonos helyen volt. 4.0.2.1. I. Konfiguráció A mérés négy darab elektródával történt. Az elektródák pozícióját a fejen a 4.3 ábra szemlélteti. A horizontális szemmozgás az ábrán látható HR(Horizontal Right) és HL(Horizontal Left) elektróda jeléből, a vertikális szemmozgás pedig a VL1 és VL2 elektróda-pár jeléből határozható meg. 4.3. ábra. Az elektródák pozíciója a fejen, I. konfiguráció Ezt a konfigurációt alkalmaztam első méréseim során, és hasonlót használt munkája során pl. [2], [14], [15], [16], [17]. Az általam ezzel a konfigurációval végzett mérések során kapott eredmények első ránézésre igen bíztatónak tűntek. A HR és HL csatorna jele elegendőnek bizonyult a tekintet horizontális irányszögének meghatározásához, ezért ezek helye a további két konfiguráció esetén sem változott. Elfogadható vertikális pontosságot azonban nem sikerült elérnem pusztán a VL1 és VL2 csatorna jeléből.
35 4.0.2.2. II. Konfiguráció A mérés hat elektródával történt. Ez a konfiguráció gyakorlatilag az I. konfiguráció kibővítése a vertikális pontosság növelése érdekében, azaz mindkét szem alatt és fölött is voltak elektródák. Az elektródák pozícióját a fejen az 4.4 ábra szemlélteti. 4.4. ábra. Az elektródák pozíciója a fejen, II. konfiguráció A csatornák számának megduplázása jelentősen növelte az elérhető maximális vertikális pontosságot. A VL1,VL2,VR1 és VR2 csatorna jele már elegendőnek bizonyult a tekintet vertikális irányának meghatározásához, így erre a konfigurációra alapult rendszer további fejlesztése. 4.0.2.3. III. Konfiguráció A mérés nyolc elektródával történt. A cél itt is a vertikális pontosság növelése volt. A szemek felett két-két elektróda volt elhelyezve, azonban ezek közül egyik sem esett egybe a szem alatti elektróda valamint az egyenesen néző szem pupillája által alkotott függőleges egyenessel. Az elektródák pozícióját a fejen a 4.5 ábra szemlélteti. A III. konfigurációval kapott mérési eredmények alapján nem sikerült megfelelő pontossággal meghatározni a tekintet vertikális irányát. A mérések azonban