MultiMédia az oktatásban Zsigmond Király Fıiskola Budapest, szeptember

Hasonló dokumentumok
KÉPI INFORMÁCIÓK KEZELHETŐSÉGE. Forczek Erzsébet SZTE ÁOK Orvosi Informatikai Intézet. Összefoglaló

Internet és világháló

KÉPEK HASZNÁLATA AZ OKTATÁS HÉTKÖZNAPJAIBAN

MIT ÉR AZ ADAT, HA KÉP?

KÉPEK HASZNÁLATÁNAK KORLÁTAI AZ OKTATÁSBAN

Az informáci. Forczek Erzsébet SZTE, ÁOK Orvosi Informatikai Intézet május

Kutatói pályára felkészítı akadémiai ismeretek modul

Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése

Beszámoló a 13. ECDL (European Conference on Digital Libraries) konferenciáról

Fülöp Csaba, Kovács László, Micsik András

Képek használata az oktatás hétköznapjaiban

Tudásalapú információ integráció

A szemantikus világháló oktatása

Szemantikus világháló a BME-n

Útmutató a MATARKA adatbázisból való adatátvételhez

A tantárgyelem kódja: KIT0402G

A tantárgyelem kódja: KIT0402G

Adatbázisok 1. Az egyed-kapcsolat modell (E/K)

Szakdolgozat. A Microsoft Access módszertana. Témavezetı: Radványi Tibor Készítette: Erényi Péter, 2006 IV. évfolyam, számítástechnika szak

Könyvtári kölcsönzések kezelése

Informatika szóbeli vizsga témakörök

ÉRETTSÉGI TÉTELCÍMEK 2018 Informatika

gyakorlatban Nagy Gusztáv

Az adatbázisrendszerek világa

Informatikai ellenırzések, az informatika szerepe az ellenırzések támogatásában

Országos Területrendezési Terv térképi mel ékleteinek WMS szolgáltatással történő elérése, Quantum GIS program alkalmazásával Útmutató 2010.

Siki Zoltán DigiKom Kft. BME ÁFGT. KÖRINFO Konferencia május 28-án

Alkalmazásokban. Dezsényi Csaba Ovitas Magyarország kft.

C É G I S M E R T E Tİ M A J U T E M É R N Ö K I R O D A

Verzió: 1.7 Dátum: Elektronikus archiválási útmutató

Multimédiás adatbázisok

6. A szervezet. Az egyik legfontosabb vezetıi feladat. A szervezetek kialakítása, irányítása, mőködésük ellenırzése, hatékonyságuk növelése,

A tantárgyelem kódja: KIT0401G. gyakorlat A tantárgyelem jellege: A tantárgyelem oktatásának ajánlott 5. félév

Adatmodellezés. 1. Fogalmi modell

MÉRNÖK-SZÓTÁR. számítógépes program rendszer. magyar-angol-német-orosz és más nyelvek. Mérnökök által összeállított szakmai szótárak, szakembereknek!

Szemantikus Web Semantic Web A szemantikus web alkalmas megközelítés, illetve megfelel nyelvekkel, eszközökkel támogatja az intelligens információs

Az egyed-kapcsolat modell (E/K)

matematikus-informatikus szemével

A tartalomelemzés szőkebb értelemben olyan szisztematikus kvalitatív eljárás, amely segítségével bármely szöveget értelmezni tudunk, és

13. Fájlformátumok. Schulcz Róbert Madarassy László 13. Fájlformátumok v

Önálló labor feladatkiírásaim tavasz

A tantárgyelem kódja: KIN2802G

Fájlrendszerek. A Windows operációs rendszerek fájlrendszere

A tantárgyelem kódja: KIT0301G

Internet és világháló I-II. Forczek Erzsébet Orvosi Fizikai és Orvosi Informatikai Intézet

Adatbázis-kezelő rendszerek. dr. Siki Zoltán

A tantárgyelem kódja: KIN2802G

Vállalati információs rendszerek I, MIN5B6IN, 5 kredit, K. 4. A meghirdetés ideje (mintatanterv szerint vagy keresztfélében):

Új fejlesztések, együttműködések a Magyar Elektronikus Könyvtárban, 2011-ben

Bevezetés s a szemantikus technológi

TSIMMIS egy lekérdezés centrikus megközelítés. TSIMMIS célok, technikák, megoldások TSIMMIS korlátai További lehetségek

Petőfi Irodalmi Múzeum. megújuló rendszere technológiaváltás

Fejlett kereső és lekérdező eszközök egy elektronikus szakfolyóirathoz (IBVS)

Többfelhasználós és internetes térkép kezelés, megjelenítés

A DocuBase önkormányzati programrendszer

Milyen weboldalt készítsünk?

18. századi folyóiratok komplex feldolgozása a Debreceni Egyetemen

Magyar Nemzeti Bank FELHASZNÁLÓI SEGÉDLET

Ungváry Rudolf: Relex Relációkat és lexikai egységeket kezelő névtérszerkesztő a weben

Informatikai kommunikációs technikák a beszállító iparban

Kiss Gergő, Kovács László, Micsik András, Moldován István

ÉRETTSÉGI TÉTELCÍMEK 2012 Informatika

ONTOLÓGIA és TUDÁSREPREZENTÁCIÓ

Kulcsár Attila. A második szint GeoCalc GIS 2. GISopen 2012 konfrencia.

Informatikai alapismeretek Földtudományi BSC számára

Intelligens partner rendszer virtuális kórházi osztály megvalósításához

KÉPZÉS NEVE: Informatikai statisztikus és gazdasági tervezı TANTÁRGY CÍME: Projektmenedzsment. Készítette: Dr. Sediviné Balassa Ildikó

Földmérési és Távérzékelési Intézet

Szemantikus Web Semantic Web A szemantikus web alkalmas megközelítés, illetve megfelel nyelvekkel, eszközökkel támogatja az intelligens információs

Beszédfelismerés alapú megoldások. AITIA International Zrt. Fegyó Tibor

Digitális írástudás március 13. TÁMOP C-09/ Trambulin

A pécsi koordinációban készült tananyagok és kreditallokáció TÁMOP A/1-11/

Playboy.hu médiaajánlat

Explosion Protection Documentation System EPDS

INFORMATIKA TANMENET SZAKKÖZÉPISKOLA 9.NY OSZTÁLY HETI 4 ÓRA 37 HÉT/ ÖSSZ 148 ÓRA

ECDL Információ és kommunikáció

Az annotáció elvei. Oravecz Csaba MTA Nyelvtudományi Intézet MANYE vitaülés február 20.

Három az egyben. Közös keresõ az elektronikus könyvtárban

EGY MÓDSZERTANI KÍSÉRLET A RAKTÁRI JEGYZÉKEK SZÁMÍTÓGÉPES MEGJELENÍTÉSE

Térképek jelentése és elemzése

Az adatok a vállalat kulcsfontosságú erőforrásai. Az információs rendszer adatai kezelésének két alapvető változata:

e-szignó Online Szolgáltatások - e-számla rendszer

KÉP VAGY TÉRKÉP DR. PLIHÁL KATALIN ORSZÁGOS SZÉCHÉNYI KÖNYVTÁR


ÁVF oktatási és közösségi portál

Az Ingatlanközvetítı szakképzés szakdolgozatának gyakran elıforduló hibái

Döntéstámogatás terepi gyakorlatokon

HELYI TANTERV / INFORMATIKA

A korszerű infokommunikációs technológia (IKT) alkalmazásával csak kis mértékben javíthatjuk az emberi agy információ tároló és feldolgozó képességét.

Programozás. Adatbázis-kezelés (alapok) Fodor Attila

Geeks.hu médiaajánlat

Informatika 9Ny. Az informatikai eszközök használata

1. tétel. A kommunikáció információelméleti modellje. Analóg és digitális mennyiségek. Az információ fogalma, egységei. Informatika érettségi (diák)

IT biztonsági szintek és biztonsági kategorizálási minta

Mesterséges Intelligencia Elektronikus Almanach

Tömörítés, csomagolás, kicsomagolás. Letöltve: lenartpeter.uw.hu

A TANTÁRGY ADATLAPJA

E-Számlázás az ECOD rendszeren belül. Horváth Péter, Senior Projekt Menedzser Synergon Retail Systems Kft.

Az ELTE Egyetemi Könyvtár Metszet-, Térkép-, és Tájképgyűjteménye

Enterprise Content Governance

Átírás:

FORCZEK ERZSÉBET Metaadatok szerepe a multimédia elemek kereshetıségében SZTE ÁOK Orvosi Informatikai Intézet forczek@edu.szote.u-szeged.hu Absztrakt A metaadat adat az adatról. A metaadatok egy része technikai, az objektumok meghatározására és paramétereinek leírására szolgál, más részük leíró jellegő, a tartalom azonosítását segíti. A leíró jellegő adatok, az annotációk, lehetnek szabadszövegek, strukturált, hierarchikus szövegek vagy logikai összefüggésekkel ellátott leírások, ontológiák. A metaadatok a tartalom állandóságát, következetességét, és a különbözı objektumok összekapcsolhatóságát is képesek biztosítani a megfelelı szervezettség esetén, ez pedig elengedhetetlen a multimédiás és szöveges dokumentumok hathatós gépi feldolgozásában. A metaadatokat, megnövekedett szerepük ellenére, csak szórványosan, részleteiben és speciális esetekben oktatjuk. Az elıadás egy nagyvonalú áttekintést ad a metaadatok szerepérıl, típusairól, szükséges szervezési formáiról és szorgalmazza az oktatásba való megjelenésüket. Az adatok tárolása, reprezentálása a kereshetıség szempontjából Adatainkat, még multimédia elemeinket is, leggyakrabban adatbázisokban tároljuk. Elınye, hogy egy konzisztens, általában relációs adatmodell szerint az információt adatszerősíthetjük, a tulajdonságokat, kapcsolatokat pontosan meghatározhatjuk. A finoman kódolt adatok és struktúrák manipulációja egyszerő, és adatbázison belül könnyen és pontosan kereshetı. Hátránya, hogy a feladat indulásakor pontosan kell látni a feladat minden részletét, a lehetséges adatokat, kapcsolatokat és elnevezéseket. Így az adatbázisok lényegi bıvítése, a mozgástér (adatbázistér) kiterjesztése nehézkes. Hátránya még, hogy zárt rendszer, így a felszíni weben nem látható, a keresık általában nem találják meg, tartalma rejtve marad a felhasználók elıl [3.], [4.]. A hagyományos WEB térhódításával a szöveges dokumentumok száma óriási mértékben megnıtt. A dokumentumokhoz kapcsolódó információk nagy része szabad szöveg, min-

denféle struktúra és kapcsolat nélkül. A lapokon található képek, vagy más multimédia elemek csak a környezetükben lévı szövegek, linkek és más paraméterek, esetleg képelemzések alapján azonosíthatók, ha egyáltalán ez lehetséges. Éppen ezért, a hagyományos keresések csak a keresı szavak próbálgatásával, a kereséshez adott plusz információkkal adnak releváns eredményeket. Elınyük azonban, hogy ezek nyílt rendszerek, és a keresık megtalálják ıket. [1.], [8.]. A hagyományos webnek elınye tehát, hogy a keresık látogatják ıket. A keresık azonban a szabadszöveges keresés során fıként alaki tulajdonságok, és nem tartalmi jegyek alapján azonosítanak. Ha meghagyjuk a lehetıségét a strukturálatlan, szabadszöveges vagy kvázi szabadszöveges adatfeldolgozásnak, de az adatokat oly módon írjuk le, hogy a gépi programok a tartalmuk alapján kezelni is tudják ıket, akkor ezzel az asszociációs kapcsolattal nemcsak az adatok alaki megjelenésére, de a tartalmi jelentésére is képesek leszünk keresni [2.], [11.]. A keresı programok egy része, funkciója ( desktop ) bıvülésével már nemcsak a webes felületekrıl tud keresni, hanem lokálisan is, például dokumentumok, képek között. Ez utóbbinak azért is van nagy jelentısége, mert a háttértárolók kapacitásának ugrásszerő növekedésével nehezen kezelhetı mennyiségő adat van digitálisan tárolva. Az összegyőjtött adatok közötti navigáláshoz viszont nem kapunk kellı támogatást, így célszerő a keresıktıl kapott lehetıséget maximálisan kihasználni. Tartalmak reprezentálása metaadatokkal Napjainkra mérhetetlen mennyiségő dokumentum, és ezen belül, multimédia tartalom áll rendelkezésre a világhálón, saját állományainkban és az archívumokban. A különbözı adatbázisok, az internetes portálok, és az általunk összegyőjtött információk halmazának gyakorlati haszna attól függ, hogy megtaláljuk-e bennük, és milyen gyorsan a számunkra hasznos információkat. A hagyományos keresés legnagyobb problémája, hogy a keresık nem a fellelhetı dokumentumok és a keresıkérdések jelentésével foglalkoznak, hanem kizárólag annak szöveges elıfordulásával. A tartalmak átjárhatósága, ami a keresés alapja, szabványos megoldások nélkül nem biztosítható. A megoldások egyik szabványos módja, hogy a weben megtalálható információkat jelentéssel ruházzuk fel úgy, hogy a webes tartalmakhoz metainformációkat társítunk, akár úgy is, hogy ezeken az információkon következtetéseket is végezhessünk [2.].

A metaadatok használata általános eszköz arra, hogy azonosítsuk objektumainkat, fájljainkat, leírjuk technikai, technológiai paramétereiket, és az intelligensebb kereshetıség érdekében, a tartalmi jegyeiket is: Metaadatokkal írjuk le a fájlok paramétereit (méretét, létrehozás dátumát, ), de a fájlban található elemek jellemzıit, például a dokumentum vagy kép szerzıjének nevét, keletkezési idejét és helyét is. A webes felületeknek is részét képezhetik a metainformációk (pl. a META nevő HTML elem). A fájlokhoz általában csatolhatunk szabadszöveges formátumú annotációkat, tartalmi megjegyzéseket is. Amíg az elızıek inkább technikai, technológiai, ez utóbbi leíró jellegő metaadatokat feltételeznek. A létrehozás mikéntjétıl és környezetétıl függıen ezen speciális adatok egy része a fájl nevével együtt, vagy a fájlon belül, míg más esetekben az elemet leíró fájltól függetlenül tárolódnak [7.]. A dokumentumok (beleértve a multimédia elemeket is) a valóság bármely elemét felölelhetik, így a technika, a tudomány a mővészet területeit is. Az annotáció lehetıséget kínál a fájl tartalmát leíró információk bevitelére. Különösen jelentıs ez a multimédia elemeknél, mert ott gyakran nincs más lehetıség a tartalmi azonosításra. Ha szabadszöveges leírást választunk, akkor az erre épülı kiértékelés általában gyenge eredményre vezet. Jobb eredményt kapunk, ha a szöveges információt formalizált adatbevitellel, kódrendszerek, tezauruszok, tématérképek vagy ontológiák segítségével, és a szemantikus web adta lehetıségekkel visszük be. Különös jelentıséggel bír ez a multimédia elemek tulajdonságainak leírásában és a felszínre hozásában, ahol a kvázi szabad szöveges keresı szavak jól behatárolhatják az egyébként rejtve maradó tartalmat [9.]. Az annotációk leírhatnak egy önálló eseményt, témát: - felsorolhatják a tartalmi jegyeket, mint történelmi kor, földrajzi hely, személyre, eseményre vonatkozó adatok, stb. Ezek a mutatók egy egyedi elıfordulásra vonatkoznak. A feldolgozandó kérdések a különbözı elemek egymáshoz és környezetükhöz való viszonyára is vonatkozhatnak, mint, technikai, technológiai megoldások idıbeli áttekintése, vagy vonatkozhatnak keresztmetszeti adatokra, stb. Elıfordulhat az is, hogy csak a fájl tartalmát leíró információk, az annotációk érhetık el szabadon a felhasználók számára, a tényleges tartalom elérése már feltételekhez kötött (ilyen esetek a fizetıs cikkek).

Annotációk szervezése; kódrendszerek használata A képek, hangok általános elemzése még kevés eredményt szolgáltat a keresıknek, sokszor a szöveges dokumentumok szövegbányászata sem hoz kellı eredményt. A tartalmat figyelembe vevı keresésekhez segítséget nyújthatnak a metaadatok. A tartalom feltárásának lehetısége elsısorban ezen metainformációk kiértékelhetıségén múlik, azaz az objektumok és a hozzájuk csatolt metaadatok elérhetıségén, minıségén és szervezettségén. Az elérhetıség egyik szempontja a felhasználás felületének és kiterjedtségének a meghatározása, ha az objektumunkat széles körben elérhetıvé akarjuk tenni, azaz publikálni akarjuk a weben, vagy akár csak egy kisebb közösség számára készítjük, akkor is célszerő a felszíni weben közzé tenni. A hathatós gépi kiértékeléshez azonban szükséges lenne, hogy ezen információk hordozzák az elnevezések, a kapcsolatok és az összefüggések következetes rendszerét. Éppen ezért nagyon fontos az annotáció létrehozásakor a pontos fogalomalkotás, a szakma által használt szakkifejezések pontos használata. Elsıdleges szempont, hogy a fogalomrendszer ne csak az aktuális munkára, feladatra korlátozódjon, hanem más feladatok elnevezés és összefüggés rendszerével is megegyezzen, de legalábbis átkonvertálható legyen egyik a másikba [10.], [11]. Ha rendelkeznénk egy, a képek, hangok, dokumentumok szöveges annotációjához rendelhetı ontológiával, ami nemcsak a fogalmak hierarchikus rendszerét tartalmazná, hanem a leíró logikai formalizmusukat is, akkor az elemi adatokból azok összes asszociációja és kapcsolatai is elıállíthatók, és természetes módon bıvíthetık lennének. Ontológiát szervezni rendkívül idıigényes feladat, különösen azokon a területeken, ahol a tudományterület, a szakma nem rendelkezik egy egységes paradigmarendszerrel. Tezauruszokkal, tématérképekkel több területen is találkozunk, de leggyakrabban kódrendszerek állnak rendelkezésünkre. A kódrendszerek általában nem rendelkeznek a fogalmak pontos leírásával és a logikai összefüggések tárházával, de a hierarchia felvázolja a fogalmi struktúrát, a benne elfoglalt hely pedig utal a tartalomra [5.], [6.]. A metaadatok reprezentációjának technikai kérdései Metaadatokkal írjuk le a fájlok paramétereit (név, méret, típus, dátumok, állapot, ), de a fájlban található elemek jellemzıit, például a dokumentum vagy kép szerzıjének nevét, kelet-

kezési idejét és helyét is. Ezek a paraméterek hagyományosan is a fájlhoz tartoznak. A fájlrendszerek gyakran a fájlokon kívül, de a fájlnévvel együtt adminisztrálják ezen jellemzıket. Ha például kitöltjük a WINDOWS operációs rendszer tulajdonságok Összegzés menüpontját, akkor az itt felvett adatokat pl. a Google keresı Desktop funkciójával rövid idı múlva - megtaláljuk. A multimédia elemek több formátuma is alkalmas metaadatok tárolására. Ezek közül a legismertebbek: A JPEG típusú képek esetén a részletes leírást adhatunk a kép formai és tartalmi jegyeirıl. A DICOM formátum a digitális képkezelés és kommunikációs szabványok átfogó halmaza a képek tárolására és továbbítására az orvostudományban. A térinformatikai rendszereket használók körében a TIFF formátum speciális alkalmazásával a raszteres képeket tehetjük hordozhatóvá (GeoTIFF) a GIS (Geographical Information System - Földrajzi Információs Rendszer) rendszerek között. Az MP3-as formátumok esetében az ID3 ad lehetıséget a jellemzıjegyek leírására. Programozási nyelvek, pl. a JAVA tartalmazhatnak metaleírásokat. Metainformáció pl. a pdf vagy doc fájlok leírása, vagy az adatbázist leíró adathalmazok (pl. táblaszerkezet, relációs információk, stb.) összessége is. A felsorolt példák közös jellemzıje, hogy a metainformációk többnyire a fájlon belül találhatók és a tárolt információknak legfeljebb csak egy részét látják a jelenlegi keresık. Mivel a formátumok igen sokfélék, ezért csak néhányról képzelhetı el, hogy a közeljövıben a teljes tartalmuk kiértékelhetıvé válik, és felszínre kerül a mélyrıl. A tartalmi keresésre szabványos megoldást nyújt azonban a Szemantikus Web (Semantic Web technology) irányzata. Több lehetıséget is kínál, de minden esetben az adatokhoz rendelt tartalom a felszíni weben elérhetı [2.]. Az egyik ilyen szabványos megoldás a minimum elvet kielégítı Dublin Core (DC) séma, ami mindössze 15 alapelembıl áll. Valószínőleg egyszerősége miatt népszerő. A DC-ben univerzálisan értelmezhetı szemantikájú elemek kerülnek alkalmazásra (pl. egy tudományos cikk szerzıje és egy forgatókönyv írója is "creator"), de kiegészíthetı annotációs leírással is (13. elem). A szabad formátumú kiértékelés ebben a formában még kevés lehetıséget ad a tartalmi leírásoknak. Ha az annotációt ontológiába szervezzük, felvesszük a belsı kapcsolataikat és egymáshoz való viszonyukat is, akkor a kialakított eszköztárral (Protege, OWL) egy konzisztens annotációs szisztémát tudunk kiépíteni. Ez a

megoldás azonban rendkívül munkaigényes, de ha egyszer elkészül, a karbantartása már gyors és megbízható, a kiértékelések teljes értékőek lesznek. Összefoglalás A hallgatónak látnia és gyakorolnia kell a számítógépes formalizálás módszerét. A metaadatok készítése jó lehetıség arra, hogy megismertesse az információ formalizálásának, és a tartalmak digitális közzétételének követendı elveit, gyakorlati megvalósítását. A pontos fogalomalkotás, a szakma által használt szakkifejezések pontos használata mellett, az információ struktúrák és a strukturális elemek összefüggésének vizsgálatát is lehetıvé teszi. Az elkészítendı annotációs szisztémának megtervezése során a nyílt rendszerek esettanulmányokkal történı felépítését is tanulmányozhatják. Jó példája ez a szakmai integrációnak is, mivel a metainformácók szervezési kérdéseinek megvitatásánál nem fiktív példákon, hanem éles szakmai anyagokon, kódrendszereken, esetleg ontológiákon keresztül jutnak el az ábrázolásig, miközben komoly informatikai területeket, információszervezési kérdéseket is érintenek. Irodalomjegyzék [1.] Dezsényi Cs.: Tudásalapú információkinyerés: az IKF projekt. Tudományos és Mőszaki Tájékoztatás (2004/5) http://tmt.omikk.bme.hu/ [2.] Gottdank Tibor: Szemantikus Web. Budapest, ComputerBooks (2005) [3.] Hector Garcia-Molina Jeffrey D. Ullman-Jennifer Widom Adatbázisrendszerek megvalósítása Panem-John Wiley & Sons (2001) [4.] Jeffrey D., Ullman-Jennifer Widom Adatbázisrendszerek Panem-Prentice-Hall (1998) [5.] Kékes E., Surján Gy., Balkányi L., Kozmann Gy. Egészségügyi informatika. Budapest (2000) [6.] Máthé S.: Fogalomtárak közös adatszerkezetének kialakítása az eegészség Programban IME III. évfolyam 6.szám (2004) [7.] Obrenovic Z., Multimedia Semantics: Overview of Relevant Tools and Resources (2005) http://www.w3.org/2005/incubator/mmsem/xgr-image-annotation [8.] Pajor E., A láthatatlan/mély web felhasználása a könyvtári tájékoztatásban Doktori diszszertáció Budapest (2006)

[9.] Raphaël T, Ossenbruggen, Pan Z, Stamou G., Image Annotation on the Semantic Web (2005) http://www.w3.org/2005/incubator/mmsem/xgr-image-annotation/ [10.] Sántáné-Tóth E., Bíró M., Gábor A., Kı A., Lovrics L. Döntéstámogató rendszerek. Budapest (2008) [11.] Szeredi P., Lukács G., Benkı T.: A szemantikus világháló elmélete és gyakorlata. Budapest, Typotex (2005).