TEMATIKA KÉPEK HASZNÁLATA AZ OKTATÁS HÉTKÖZNAPJAIBAN Forczek Erzsébet, forczek@edu.szote.u-szeged.hu SZTE, ÁOK Orvosi Informatikai Intézet Szanyi Ágnes, szanyiagi@hotmail.com PTE, Kommunikáció Doktori Iskola Az utóbbi években a képi adatbázisok száma ugyan látványosan megnőtt, de ez a mennyiségi növekedés nem vonta maga után képanyagaink kezelhetőségére módot adó, általánosan is elfogadott konvenció, vagy szoftver eszközök létrejöttét ill. elterjedését. A digitalizált képek kezelhetőségének problémáját, jelen eszközök mellett, elsősorban a verbális fogalmi síkra történő vetítéssel tudjuk megoldani. Bár, ezzel a dimenzió csökkenéssel éppen a képek legjellemzőbb sajátosságát, a képiségüket veszítjük el, mégis, a képekhez rendelt szöveges információ ad némi esélyt a tartalomalapú tárolásra, karbantartásra és ezáltal a visszakeresésre. ABSTRACT USE OF IMAGES IN THE EVERY DAYS OF EDUCATION Forczek Erzsébet, forczek@edu.szote.u-szeged.hu SZTE, ÁOK Orvosi Informatikai Intézet Szanyi Ágnes, szanyiagi@hotmail.com PTE, Kommunikáció Doktori Iskola Although the number of image databases has spectacularly increased in the past years, this quantitative growth did not bring along the appearance and spread of generally accepted convention or software tools that allow the managing of our image materials. With the present tools the problem of managing digital images can be primarily solved by reflection to the verbal conceptual level. Although by this dimension decrease we just loose the most typical property of the images, their being an image, the textual information assigned to images gives us some chance for content-based storage, maintenance and thus retrieval.
KÉPEK HASZNÁLATA AZ OKTATÁS HÉTKÖZNAPJAIBAN Forczek Erzsébet, forczek@edu.szote.u-szeged.hu SZTE, ÁOK Orvosi Informatikai Intézet Szanyi Ágnes, szanyiagi@hotmail.com PTE, Kommunikáció Doktori Iskola Bevezetés Még néhány éve a tanárok és a diákok akár több napos vagy hetes kutatómunkát is folytattak egy-egy szemléltetőkép vagy videó megszerzésére, addig mára ez az esetek nagy részében csak néhány órára, esetleg néhány percre korlátozódik. A digitális technika, a tárolási és az átviteli médiumok hallatlanul gyors fejlődésének köszönhetően több száz, de inkább több ezer kép is található digitális könyvtárainkban. A könnyű képkészítés ill. az internet segítségével a könnyű elérhetőség utat nyit egy hatékonyabb, fokozottan vizuális elemekre épülő tanóra felépítésére A képek használata az órákon, a házi feladatok megoldásánál és az önálló tanulás részeként is egyre inkább előtérbe kerül, de ezzel párhuzamosan szembekerülünk az egyre kezelhetetlenebb mennyiségű képi információ legváltozatosabb helyen történő tárolásával, reprezentálásával és karbantartásával. Képek előélete Ha megvizsgáljuk a képek származási helyét, alapvetően három különböző típusú forrást találunk. Elsődleges forrást jelentenek a művészeti adatbázisok, de találunk a felszíni webes dokumentumok között is sok értékes anyagot. Harmadikként említhetők a saját magunk által előállított képek. Több művészeti és képmegosztó adatbázissal is találkozhatunk a hálón, általában egy konzisztens relációs modell szerint szervezve, ahol a hatékony alkalmazás egy teljes és pontos adatmodellre épül. Általában webes alkalmazáson keresztül érjük el a felületüket, de utána a keresők elől rejtett, saját kereső szoftverükkel dolgozunk. A képek formális, technikai és tartalmi jegyei magában az adatbázisban vannak tárolva, nem a kép részeként. Így, ha a képeket innen átvesszük saját munkaterületünkre, akkor azokat a tulajdonságjegyeket és kapcsolatokat is át kell vennünk, amelyek a logikai struktúra leképezéseként és a többi tulajdonságjegy előfordulásaként vannak jelen a képbázisban. Ha webes dokumentumokból gyűjtünk, akkor a keresők általában a kép oldalán lévő, vagy a ráhivatkozó oldalak szövegeinek elemzéséből következtetnek a kép tartalmára Az automatikus gépi felismerése ma még csak speciális esetekben lehetséges (például ujjlenyomat, védjegy azonosítás). Ha semmi előzetes előállítási vagy feldolgozási információnk nincs, akkor a gépi felismerés nem elegendő a kép megtalálásához, a festmények felismeréséhez. Itt a szöveges annotáció segíthet a képek láthatóvá tételében. Természetesen a saját készítésű fotóknál sem jobb a helyzet, itt is a képek mellé kell letenni a kereséshez szükséges többletinformációt. A képi támogatás megszervezése A számunkra releváns képeket érdemes kiválogatni, és archiválni a saját könyvtárunkba (természetesen a szerzői jogok figyelembevételével). A mentés oka nemcsak az, hogy
legközelebb a keresés eredményeként nem teljesen ezt a listát kapjuk, vagy, hogy ezt az információt már soha többé nem találjuk meg, hanem az is, hogy elég sok időbe telik összegyűjteni a legkülönbözőbb előfordulási helyekről a kívánt képek halmazát. Nem hatékony úgy felépíteni egy tanórát, jelen esetben egy művészetszociológiait, hogy ne álljanak egyetlen tárolási helyen rendelkezésre a szükséges információk, azaz, kell egy olyan munkaterület és lehetőség, ahol a képek tárolása, azonosítása és visszakeresése lehetséges. Feladatunk egy művészetszociológiai gyakorlati óra támogatása. Szervezzük meg, hogy a közös tanár-diák munka során összegyűjtött képeket egységes szempont szerint lehessen tárolni, formai és tartalmi jegyek alapján visszakeresni. Szükséges, hogy a képekhez mindenki tudjon újat felvenni, és bárki tudja a visszakeresés szempontjait bővíteni, alternatív megoldásokat adni. Fontos, hogy nagyon egyszerűen kezelhető legyen, és már a kevés befektetett munka is adjon használható eredményt. Például azt kutatjuk, hogy a különböző korok festményein hogyan tükröződik az emberek életmódja, és ehhez képeket gyűjtünk és dolgozunk fel. Követelmény, hogy tároljuk azokat az információkat, amelyek a képek, mint objektumok azonosítására szolgálnak (kép címe, készítés időpontja, kép szerzője, kép mérete, felbontása, minősége, technikai részletek stb.), a technikai, technológiai megoldások leírásait, a tartalmi jegyek felsorolását, mint történelmi kor, földrajzi hely, esemény, festő életére vonatkozó adatok, háttéresemények, életstílusok, életkörülmények stb. Ezek a mutatók a képek egyedi előfordulására vonatkoznak. A feldolgozandó kérdések a képek egymáshoz és környezetéhez való viszonyára is vonatkozhatnak, mint, technikai, technológiai megoldások időbeli áttekintése, hatásuk későbbi korokra; keresztmetszeti adatokra, egy szerző, egy téma képei, Rubens nőalakjai egy időpillanatban vagy időintervallumban stb. Ezekre az összetett kérdésekre képkeresővel már nem kaphatunk választ, hiszen a kérdésfeltevéshez és válaszokhoz szükséges formalizáláshoz nem rendelkezünk kellő háttértudással. A lekérdezés elemei Nézzük a következő képet (1. ábra). Soroljunk fel olyan szavakat, amelyeket a lekérdezés során használnánk a képek keresésekor. Ezek a szavak, vagy szóösszetételek csak a kép leíró jellegű tulajdonságaira vonatkoznak, és nem határozzák meg a többi képhez való viszonyukat. Jan Van Eyck's Arnolfini "Wedding" Portrait Eyck_az arnolfini házaspár 1434.jpg, műtárgy típusa, festmény, művészettörténeti korszak, reneszánsz, kora reneszánsz származási hely, Németalföld/flamand ember, nő, férfi, állat, enteriőr/lakberendezés, zsáner, tárgyak, bútor, dísztárgy, használati tárgy, fekvőbútor, ágy, szőnyeg, ruházat/öltözködés/divat, polgári, terhes, áldott állapot, terhesség, házasságkötés. 1. ábra
Reprezentálási lehetőségek, szöveges annotáció A felsorolt szavak rendszertelennek tűnnek, és sok az átfedés a jelentésükben. Ha rendelkeznénk egy, a képek szöveges annotációjához rendelhető ontológiával, ami nemcsak a fogalmak hierarchikus rendszerét tartalmazná, hanem a leíró logikai formalizmusukat is, akkor a fogalmak és összefüggéseik redundancia nélkül felvehetők lennének. Ontológiát szervezni rendkívül időigényes feladat, különösen azokon a területeken, ahol még egy egységes paradigmarendszerről sem beszélhetünk, ilyen a művészettörténet és a szociológia is. Ha lenne is ontológiánk, problémát jelentene azonban, hogy pillanatnyilag még a keresők nem veszik figyelembe a szemantikus információkat. Nem is szükségesek feltétlenül a fogalmak pontos leírása és a logikai összefüggések tárháza, hisz esetünkben csak a képek megtalálásáról és nem kiértékeléséről van szó. Fontos lenne azonban a fogalmak hierarchikus rendszerének kialakítása, aminek segítségével a webes kereső motorok értelmezni tudnák a hierarchia következményét. De a jelenleg használt kereső programok nem tudják ezt a többlet információt értelmezni, nem veszik figyelembe például, hogy a nő is és a férfi is ember és élőlény is egyben. Lényegében csak arra a szóra keresnek rá, amit megadunk. Ha azt szeretnénk, hogy a hierarchia teljes vonalát megtalálja, akkor adjuk meg (művészettörténeti korszak, reneszánsz, kora reneszánsz ) nekik, ezáltal bármely szülő fogalom is jelen lesz, sőt ahol tudjuk, vagy értelmét látjuk, adjuk meg a szinonimákat is. Ez a redundancia nagyon nagy pazarlásnak tűnik, de a gyakorlatban ezek az útvonalak nem túl hosszúak, és a szöveges információ nagysága a képek többszöri tárolásához képest elenyésző. művészettörténeti korszak* Redundancia!! reneszánsz * kora reneszánsz késő reneszánsz érett reneszánsz *OSZK KÖZTAURUSZ felhasználásával 2. ábra Így feladatunk a szakterülethez tartozó fontos fogalmak strukturált felépítésére redukálódott. A módszer az, hogy az alapvetőnek tartott fogalmak hierarchiáját felépítjük, majd a bejövő képek és felmerülő kérdések során ezeket bővítjük. Gyakorlati jelentősége, hogy az adatbázisok állandóságát kiküszöbölve, az oktatásban és a tanulásban azonnal illeszkedik a felmerülő problémákhoz, az új kérdésfelvetésekhez és szempontokhoz. A szavak rendszert alkotnak, így sokkal szervezettebbek és célirányosabbak, mint egy szabadszöveges leírás.
Gépi megvalósítás Bár feladatunkat már a legminimálisabbra csökkentettük, mégis problémát okoz, hogy hogyan tudassuk a keresőkkel a képekre vonatkozó kereső információkat. Léteznek a képekhez csatolt metainformációk. Egyik leggyakrabban előforduló a jpg kiterjesztésű képekhez csatolt EXIFszabvány szerinti adatleírás. Megtekintésére több freeware illetve shareware segédprogramot is találhatunk. Az EXIF legnagyobb előnye, hogy részletes információt ad egy-egy fotó elkészültének pontos részleteiről, a beállításokról, de fűzhetünk hozzá tartalmi leírásokat is. Hátránya, hogy a keresők nem dolgozzák fel a benne tárolt információt, és semmi nem garantálja a teljes feldolgozásukat a jövőben sem. Egyszerű megoldás, ha a képekhez szöveges információkat teszünk le és a fájloknál elérhető Tulajdonságok Összegzés menüpont alá. Ezek a szövegek tartalmazhatják a jellemző keresőszavakat, amit már egy Google Desktop is fel tud dolgozni. A következő 3. ábra egy ilyen megoldást mutat. Az annotáció bevitele után nemsokkal a Google Desktop az összes képet megtalálta, amelynél női szépségideál szó a tartalomban szerepelt. Használatát mégsem ajánljuk speciális és korlátozott volta miatt. 3. ábra Találhatunk viszont egy egyszerű eszközt, a Dublin Core-szabványt, ami 15 fő pontot határoz meg. 1. Cím / TITLE 2. Létrehozó / CREATOR 3. Közreműködő / CONTRIBUTOR 4. Kiadó / PUBLISHER 5. Azonosító / IDENTIFIER 6. Forrás / SOURCE 7. Kapcsolat / RELATION 8. Dátum / DATE 9. Formátum / FORMAT 10. Típus / TYPE 11. Téma / SUBJECT! 12. Tartalmi leírás / DESCRIPTION 13. Tér-idő vonatkozás / COVERAGE 14. Nyelv / LANGUAGE 15. Jogok / RIGHTS
A 15 pontnak megfelelő http://www.mek.oszk.hu/dc/ címen található űrlap, kitöltésével metaadatokat készíthetünk a digitális dokumentumainkhoz, majd bemásolhatjuk őket a HTML fájlok fejlécébe, vagy elmenthetjük XML formátumban a dokumentum mellé. Az űrlap és fogalomrendszere bővíthető. Az űrlap mellé MOKKA nevek, NDA névtér, és KÖZTAURUSZ is csatolva van. művészettörténeti korszak reneszánsz kora reneszánsz 4. ábra Dublin Core űrlap és az Excel lap egy részlete Lehetőség van a tartalmi adatok bevitelére is. A fenti típusú struktúrák leírásához csatoltunk egy Excel munkalapot, ami vezet bennünket a struktúra aktuális útvonalának leírásában. Így a leírás rendkívül gyors, és előnye, hogy mindig ugyanazokat a kifejezéseket használjuk. (4. ábra.) A jellemző keresőszavak segítségével a Google Desktop a keresett képeket szintén nagyon gyorsan megtalálja. Legfontosabb előnye, hogy általános megoldást ad, és illeszkedik a szemantikus web fejlesztési irányaihoz. Így ebben az esetben biztosított legjobban, hogy munkánk később nem vész el.
Összefoglaló A digitális képek kezelhetőségét, jelen eszközök mellett, elsősorban a verbális fogalmi síkra történő vetítéssel tudjuk megoldani. A képekhez csatolt szöveges annotáció módot ad, a képek, mint objektumok azonosítására (kép címe, készítés időpontja, kép szerzője, kép mérete, felbontása, minősége, technikai részletek stb.), a technikai, technológiai megoldások leírására, és a tartalmi jegyek felsorolására, mint történelmi kor, földrajzi hely, esemény, festő életére vonatkozó adatok, háttéresemények, életstílusok, életkörülmények, stb. Rendszerünk vizsgálata során kialakítottuk a legfontosabb fogalmak hierarchikus felépítését, amelynek segítségével nemcsak az aktuális kifejezéseket, hanem az ahhoz vezető útvonal fogalmait is felvettük. Az OSZK Dublin Core űrlapjának segítségével, mely lehetőséget ad a kialakított tartalmi jegyek bevitelére is, dokumentáltuk képeinket. Irodalomjegyzék: [1] Nyíri K.: Mentális képek mint teoretikus konstrukciók http://www.phil-inst.hu/highlights/agytudat/nyiri.htm [2] Vámos T.: MTA SZTAKI Ember-gép kapcsolat és reprezentáció http://makogxi.btk.pte.hu/meghiv.htm#mero [3] Dezsényi Cs.: Tudásalapú információkinyerés: az IKF projekt. Tudományos és Műszaki Tájékoztatás, 2004/5 [4] http://tmt.omikk.bme.hu/ [5] Futó I.: Mesterséges intelligencia. Budapest, Aula Kiadó (1999) [6] Máthé S.: Fogalomtárak közös adatszerkezetének kialakítása az eegészség Programban IME III. évfolyam 6.szám 2004. [7] Szeredi P.-Lukács G.-Benkő T.: A szemantikus világháló elmélete és gyakorlata Budapest Typotex 2005. [8] Gottdank Tibor: Szemantikus web. Budapest, ComputerBooks (2005)