Ontológiák és alkalmazásuk orvosi területen



Hasonló dokumentumok
A szemantikus világháló oktatása

Szemantikus világháló a BME-n

matematikus-informatikus szemével

Tudásalapú információ integráció

Mi is volt ez? és hogy is volt ez?

Hatékony keresés a szemantikus világhálón

Név: Neptun kód: április

A Szemantikus világháló alapjai

Alkalmazásokban. Dezsényi Csaba Ovitas Magyarország kft.

Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése

Szemantikus Web Semantic Web A szemantikus web alkalmas megközelítés, illetve megfelel nyelvekkel, eszközökkel támogatja az intelligens információs

Fülöp Csaba, Kovács László, Micsik András

Bevezetés s a szemantikus technológi

Emerald: Integrált jogi modellező keretrendszer

Oktatói önéletrajz Dr. Molnár Bálint

Szemantikus Web Semantic Web A szemantikus web alkalmas megközelítés, illetve megfelel nyelvekkel, eszközökkel támogatja az intelligens információs

Mesterséges Intelligencia Elektronikus Almanach

Google App Engine az Oktatásban 1.0. ügyvezető MattaKis Consulting

Üzleti modellen alapuló webes tudásprezentáció

Önálló labor feladatkiírásaim tavasz

Oktatói önéletrajz Kő Andrea

Multimédiás adatbázisok

Többnyelvű tezaurusz építése és szolgáltatása webes környezetben

Petőfi Irodalmi Múzeum. megújuló rendszere technológiaváltás

Projekt beszámoló. NEWSIT News basedearlywarning System forintradaytrading: Hír alapú Korai Figyelmeztető Rendszer Napon belüli Kereskedéshez

Számonkérési formák a BME-n a Deklaratív programozás című tárgyban

ÜZLETI I TELLIGE CIA - VIZUALIZÁCIÓ

Bánki Zsolt István Csáki Zoltán Petőfi Irodalmi Múzeum Könyvtár és Informatika. Networkshop 2014 Pécs

ADATTÁRHÁZ MENEDZSMENT ÉS METAADAT KEZELÉS

A szemantikus Web. Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 0.

Térképek jelentése és elemzése

Adatbázisok MSc. 12. téma. Ontológia és SPARQL

Szolgáltatásintegráció (VIMIM234) tárgy bevezető

SZTE Eötvös Loránd Kollégium. 2. Móra György: Információkinyerés természetes nyelvű szövegekből

SAS szoftverek felhasználási lehetőségei a felsőoktatásban

Óbudai Egyetem Neumann János Informatikai Kar. Intelligens Mérnöki Rendszerek Intézet

Szoftver-technológia II. Szoftver újrafelhasználás. (Software reuse) Irodalom

Biomatika Intézet Neumann János Informatikai Kar Óbudai Egyetem. Dr. Kozlovszky Miklós egyetemi docens, intézetigazgató, OE NIK

Ismeretalapú modellezés XI. Leíró logikák

Microsoft SQL Server telepítése

Micskei Zoltán Strausz György. Méréstechnika és Információs Rendszerek Tanszék.

A Magyar Nemzeti Múzeum, mint szabványos alapokra helyezett magyar múzeumi aggregátor

A Békés Megyei Könyvtár Elektronikus Könyvtárának kialakítása

Informatikai és Könyvtári Szövetség

Az ekovut költségvetés követő alkalmazás web-es környezetben működik, adatait SQL adatbázisban tárolja.

PUBLIKÁCIÓS LISTA Sántáné-Tóth Edit

Angol szótár V

Tartalom. Konfiguráció menedzsment bevezetési tapasztalatok. Bevezetés. Tipikus konfigurációs adatbázis kialakítási projekt. Adatbázis szerkezet

A J2EE fejlesztési si platform (application. model) 1.4 platform. Ficsor Lajos Általános Informatikai Tanszék Miskolci Egyetem

KÖNYVTÁR-INFORMATIKAI KÉPZÉS A KLTE-N

ÖNÉLETRAJZ. Felsőfokú tanulmányok és végzettség: 1961 Szegedi Tudományegyetemen matematika tanár és alkalmazott matematikus szak

Fejlett kereső és lekérdező eszközök egy elektronikus szakfolyóirathoz (IBVS)

KÉPI INFORMÁCIÓK KEZELHETŐSÉGE. Forczek Erzsébet SZTE ÁOK Orvosi Informatikai Intézet. Összefoglaló

Szolgáltatásintegráció (VIMIM234) tárgy bevezető

A Java EE 5 plattform

TSIMMIS egy lekérdezés centrikus megközelítés. TSIMMIS célok, technikák, megoldások TSIMMIS korlátai További lehetségek

A HunTéka elektronikus könyvtár modulja

Vállalati információs rendszerek I, MIN5B6IN, 5 kredit, K. 4. A meghirdetés ideje (mintatanterv szerint vagy keresztfélében):


Oktatási cloud használata

Ontológiák és adatbázisok következtetés nyílt és zárt világokban

Internet és világháló

Az Internet jövője Internet of Things

BSc hallgatók szakdolgozatával szemben támasztott követelmények SZTE TTIK Földrajzi és Földtani Tanszékcsoport

Szemantikus technológiák területei. Rácz Gábor,

A webanalitika változó világa 4 felvonásban

Intelligens partner rendszer virtuális kórházi osztály megvalósításához

Elektronikus Almanach

Publikációk. Könyvek, könyvfejezetek:

SDL Trados szervermegoldások. Szekeres Csaba SDL Trados partner M-Prospect Kft.

Hely- és kontextusfüggő alkalmazások fejlesztését támogató keretrendszer mobil környezetben

Szolgáltatási szint megállapodás

ADATBÁZIS-KEZELÉS. Adatbázis-kezelő rendszerek

Adatkeresés az interneten. Cicer Norbert 12/K.

Mesterséges Intelligencia Elektronikus Almanach. Konzorciumi partnerek

SZOFTVERES SZEMLÉLTETÉS A MESTERSÉGES INTELLIGENCIA OKTATÁSÁBAN _ Jeszenszky Péter Debreceni Egyetem, Informatikai Kar jeszenszky.peter@inf.unideb.

Az adatok a vállalat kulcsfontosságú erőforrásai. Az információs rendszer adatai kezelésének két alapvető változata:

AKTUÁTOR MODELLEK KIVÁLASZTÁSA ÉS OBJEKTÍV ÖSSZEHASONLÍTÁSA

Ungváry Rudolf: Tezauruszok mint kisvilágok. Kapcsoltság a fogalmak között

Infor PM10 Üzleti intelligencia megoldás

Miskolci Egyetem Gépészmérnöki és Informatikai Kar Alkalmazott Informatikai Tanszék. Dr. Kulcsár Gyula egyetemi docens

Ficsor Lajos Általános Informatikai Tanszék Miskolci Egyetem

NETinv. Új generációs informatikai és kommunikációs megoldások

FEOR szám kereső V

Sikerünk kulcsa: az információ De honnan lesz adatunk? Palaczk Péter

Átlag (standard hiba)

Mezőgazdasági külső információs rendszerek fejlesztése

18. századi folyóiratok komplex feldolgozása a Debreceni Egyetemen

A SZAKIRODALOM HASZNA ÉS SZERKEZETE

TANANYAGTÁRHÁZAK SZEREPE AZ ELEARNINGBEN. Vágvölgyi Csaba - Papp Gyula. Kölcsey Ferenc Református Tanítóképző Főiskola Debrecen

EGYÜTTMŰKÖDŐ ÉS VERSENGŐ ERŐFORRÁSOK SZERVEZÉSÉT TÁMOGATÓ ÁGENS RENDSZER KIDOLGOZÁSA

AZ EGYETEM TÖRTÉNETE. Az Eötvös Loránd Tudományegyetem Magyarország legrégebbi folyamatosan m{köd[, s egyben legnagyobb egyeteme.

Célkitűzés Megoldandó feladatok A tesztkörnyezet komponensei V&V folyamatok Eszközintegrációs szintek. Megfelelőség tanúsítása modell alapon

Elektronikus szövegek és adatok szolgáltatás és megőrzés

FIGYELEM! Ez a kérdőív az adatszolgáltatás teljesítésére nem alkalmas, csak tájékoztatóul szolgál!

Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék. ELTE ÁJK szeptember 13.

Szolgáltatási szint megállapodás. Verzió: 1.0. (2010. december 13.)

KÖVETKEZŐ GENERÁCIÓS NAGYVÁLLALATI TARTALOMKEZELŐ MEGOLDÁSOK Stratis Kft. / Autonomy üzleti reggeli / Mezei Ferenc üzletág-igazgató

DW/BI rendszerek kialakítása bevezetői szemszögből. Gollnhofer Gábor - Meta Consulting Kft.

Átírás:

Ontológiák és alkalmazásuk orvosi területen Lukácsy Gergely, IQSYS Rt., BME Szeredi Péter, IQSYS Rt., BME A cikk áttekinti az ontológiák témakörét, és bemutat egy kísérleti ontológiakezelô rendszert, hangsúlyt fektetve annak orvosi területeken való alkalmazhatóságára. Az ontológiák fontos szerepet játszanak különféle intelligens keresôrendszerekben, nyelvészeti- és adatbányászati eszközökben, csakúgy, mint a hagyományos információforrások hatékonyabb és kényelmesebb elérésének biztosításában. Az ontológiák különösen fontosak az orvostudományban, mert az utóbbi évek fejlôdése olyan mennyiségû biológiai és orvosi adatot termelt ki magából, amelyek között egyre nehezebb a kívánt információ megtalálása. BEVEZETÉS Ontológián egy adott tudományterületen fellelhetô tudás formális leírását értjük. Egy ilyen leírásban meg kell határoznunk az adott szakterület fogalmait és a köztük felállítható kapcsolatokat, le kell írnunk ezek hierarchikus elrendezését és a rájuk vonatkozó szabályokat. A Tolnai Lexikonban a görög eredetû szó jelentése a létrôl szóló tudomány. Foglalkozik a létezés kritériumaival, a létezôk legáltalánosabb tulajdonságaival és megismerhetôségével. Vannak filozófiai rendszerek, amelyekben az ontológia összeesik a metafizikával. Például a lázas beteg fogalmát definiálhatjuk úgy, hogy az egy olyan személy, akinek a testhômérséklete 38º felett van. Kapcsolat lehet az orvos-beteg viszony, amely két személyt kapcsol össze, vagy a testhômérséklete tulajdonság, amely egy személyhez annak hômérsékleti értékét rendeli. Fogalmak hierarchikus elrendezésekor gondolhatunk betegségek kategorizálására, valamilyen szempont szerint, vagy arra a kijelentésre, hogy minden lázas beteg egyben személy is. Szabály lehet például az, hogy akinek van háziorvosa, van TB kártyája is. Az ontológiai szabályok sok rokonságot mutatnak a különféle szakértô- és szabály-alapú rendszerekkel [2]. Ez a példa nem jó, egymástól függô fogalmakat nem szabad egymással meghatározni. (l. a deninitio szabályait). Helyes példa egy szabályra: akinek jogosan van érvényes TAJ számot igazoló hatósági igazolványa, annak joga van az OEP költségére az OEP-el szerzôdött háziorvosok közül háziorvost választani. Az egyszerûbb ontológiák csak egy fogalmi hierarchiát írnak le, ezeket hívjuk pehelysúlyú ontológiáknak. Az ún. nehézsúlyú ontológiákban a fogalom-hierarchia mellett szerepelhetnek kapcsolatok, definíciók, szabályok (ezekre a fentiekben láthattunk néhány példát). Cikkünkben a LOBO (LOgic Based management of Ontologies) projektet mutatjuk be, amely egy alkalmazás-független, logikai alapú, intelligens ontológiakezelô és információ-integrációs eszköz kifejlesztését tûzte ki célul. Ismertetjük a LOBO rendszer megvalósítási alapelveit, valamint a rendszer kísérleti alkalmazását az orvosi ontológiák területén. Legfontosabb céljaink között szerepelt, hogy a rendszer tegye lehetôvé nehézsúlyú ontológiák létrehozását és szerkesztését, létezô ontológiák konzisztenciájának ellenôrzését, ontológiák összehasonlítását és integrálását, valamint az ontológiákon alapuló ismeretkezelést. Ez utóbbi magába foglalja a létezô adatforrások ontológia-alapú lekérdezését, valamint ontológia-alapú konzisztencia ellenôrzését. ÁLTALÁBAN AZ ONTOLÓGIÁKRÓL Ontológiának általában bizonyos tulajdonságoknak megfelelô, formálisan reprezentált háttértudást hívunk. A leírás formális volta itt nagyon fontos, hiszen az ontológiák használatával azt szeretnénk elérni, hogy bizonyos (eddig nem automatizálható) folyamatokat a gépek sokkal intelligensebben tudjanak elvégezni, mint korábban. A leggyakrabban használt ontológiai háttértudás a fogalmak hierarchiája (taxonómia, rendszertan), amely már önmagában is jól felhasználható intelligens kereséshez, lekérdezéshez. A háttértudás azonban ennél sokkal bonyolultabb is lehet. Leírhatjuk például, hogy aki nô, nem férfi (fogalmak diszjunktsága), hogy a gyermekemnek én a szülôje vagyok (inverz kapcsolatok), vagy, hogy a leszármazottam leszármazottja az én leszármazottam is (tranzitív kapcsolat). Kijelenthetjük, hogy akik orvos-beteg viszonyban vannak, csaknem biztosan ismerik is egymást kivéve a még kivételes telemedicina eseteit (kapcsolatok hierarchiája). Ugyancsak szerepelhet egy ontológiában az a tudás, hogy mindenkinek, akinek van kedvenc sörfôzdéje, van kedvenc söre is (szabály), és bevezethetjük a sokgyerekes apa fogalmát úgy, hogy az egy olyan férfi, akinek van legalább két gyermeke (fogalomdefiníció). Az ontológiákat leíró formalizmusok komoly matematikai háttérrel, sokszor több évtizedes múlttal rendelkeznek. Az orvosi ontológiák területén az egyik legfejlettebb ontológia a 26

GRAIL (GALEN Representation and Integration Language) nyelv [8], amely az ún. leíró logikákon [3] alapul. Nem véletlen, hogy az egyik legrészletesebb klinikai ontológia éppen az OpenGalen CRM (Common Reference Model). Hasonlóan, a National Library of Medicine által gondozott másik népszerû orvosi ontológia, a MeSH [7] is rendelkezik megfelelô matematikai háttérrel, bár ez korántsem olyan kifejezô, mint a GRAIL esetében. Az ontológiák felhasználása számos kérdést vet fel. Fontos, hogy a feladathoz megfelelô kifejezôerôvel rendelkezô formalizmust válasszunk. Tudni kell ugyanakkor, hogy minél bonyolultabb a formalizmus, annál nehezebb (idôigényesebb) segítségével következtetni, és ez bizonyos esetekben problémát jelenthet. Ugyancsak lényeges kérdés, hogy hogyan kapcsoljuk össze az ontológiát az adatainkkal, valamint fontos lehet több ontológiából egy nagy, egységes ontológiát készíteni. HAGYOMÁNYOS ADATBÁZISOK ÉS AZ ONTOLÓGIÁK Az ontológiák egyik nagy elônye, hogy segítségükkel meglévô adatbázisok lekérdezése intelligensebbé tehetô, anélkül, hogy magukon az adatforrásokon bármit is változtatni kellene [6]. Képzeljünk el egy relációs adatforrást, amelynek egy-egy sora egy-egy vírust azonosít, leírja a nevét, azt, hogy a vírus melyik törzsbe tartozik, valamint egy egyedi azonosítót, az alábbi táblázatban leírtakhoz hasonló módon: Vírusnév Törzs Azonosító Herpesvirus Simplexvírusok 0134 HIV Lentivírusok 0022 SIV Retrovírusok 0345 Feltételezzük, hogy az adatforrás készítôje általában a legszûkebb törzsbe sorolja be az adott vírust, de ez nem feltétlenül van mindig így. A fenti példa a HIV vírust a lentivírusok családjába sorolja. Így, ha csak a fenti adatforrásra támaszkodunk, akkor arra a kérdésre, hogy igaz-e, hogy a HIV vírus retrovírus, nemleges lesz a válasz. Persze, hiszen honnan tudná egy gép, amely végrehajtja a lekérdezést, hogy a lentivírusok családja része a retrovírusokénak? Egy olyan ontológia segítségével, amely leírja a vírustörzsek tartalmazási hierarchiáját azonban már kikövetkeztethetô, hogy a HIV retrovírus. Ehhez semmi más nem kell, mint az eredeti adatbázis, az ontológia, amely a szükséges fogalmi rendszert (a vírustörzsek hierarchiáját, rendszertanát) írja le, és egy rendszer, amely képes összekapcsolni az ontológiát az adatforrással és ezért képes, az ontológia alapján intelligensebben válaszolni a feltett kérdésekre. Az ontológiák egy másik alkalmazási területe az adatkonzisztencia-ellenôrzés. Adatforrások összekapcsolásakor ugyanis elôfordulhatnak olyan ellentmondások, amelyek bizonyos háttértudás nélkül nem szûrhetôk ki. Tekintsük azt a példát, amikor egy adatforrásunkban a betegségekhez azok tüneteit társítjuk, például egy adott betegséghez többek között a levertséget. Egy másik adatforrásban betegségekhez ugyancsak tüneteket rendelünk, valamint elôfordulási gyakoriságot, halálozási arányt stb. Nyilván érdemes ezen két adatforrást egyként látni, hiszen elképzelhetô, hogy egyikben olyan betegségrôl is található információ, amelyrôl a másikban nem. Mi van azonban akkor, ha az egyik adatforrásban ugyanahhoz a betegséghez a levertség, a másikban a hiperaktivitás társul, mint jellemzô tünet? Háttértudás segítségével figyelmeztethetjük az integrációt végzô szakembert, hogy a két tünet általában kizárja egymást. Ontológia nélkül a két tünet pusztán két szó, amelyek viszonyáról semmit sem tudunk. A SZEMANTIKUS WEB Az ontológiák kiemelkedô szerepet játszhatnak abban is, hogy a jelenleginél intelligensebb módon kereshessünk a weben jelenlévô információ-dzsungelben, a honlapok, képek, folyóiratcikkek között. Az alábbiakban röviden áttekintjük az intelligens Internet megvalósítására irányuló legismertebb elképzelés, a szemantikus web [4, 5] alapjait. A szemantikus web megközelítés két alapötleten alapul. Az egyik az, hogy kapcsoljunk metainformációkat az Internetes erôforrásokhoz. Meta-adatnak nevezünk olyan adatot, amely adat egy adatról. Meta-adat például egy kémiai elemnek a felfedezôje, egy honlapról az, hogy ki készítette és mikor, egy állományról annak típusa és mérete, vagy egy képrôl az, hogy van rajta oroszlán, csimpánz és banán. A szemantikus web elképzelés meglehetôsen tágan értelmezi az Internetes erôforrások fogalmát és alapkövetelményének tekinti, hogy metainformációt társíthassunk lényegében bármihez, ami egyedileg azonosítható. Ilyen például egy honlap vagy a honlap egy része, egy kép, egy videó anyag, egy tetszôleges állomány, egy hardvereszköz. Ilyen lehet azonban egy kávéscsésze, egy betegség, egy daganat, egy szerv vagy egy kesztyû is, amennyiben egyedi azonosító társul hozzájuk. Így egy folyóiratcikkhez egységes módon társíthatunk információt, függetlenül attól, hogy az egy Word állományként vagy PDF formátumban áll rendelkezésre. A metainformációk erôforrásokhoz kapcsolásán túl a szemantikus web másik lényeges alapeleme, hogy következtetni kell tudni ezen metainformációk segítségével. 27

Ez például azt jelenti, hogy valamilyen úton ki kell tudni deríteni, hogy a fentebb említett csimpánzos képen állatok szerepelnek, holott a metainformáció csak annyi volt, hogy csimpánz és oroszlán is látható rajta. Az ontológiák a szemantikus web következtetési oldalán játszanak nagyon fontos szerepet. Látható, hogy a fenti esetben egy közönséges, állatok hierarchikus viszonyait leíró ontológia is elég ahhoz, hogy kikövetkeztessük, a csimpánz és az oroszlán is állat. Sokszor persze ennél jóval bonyolultabb információkra is lehet szükség a hatékony kereséshez. A LOBO RENDSZER MEGVALÓSÍTÁSÁNAK ALAPJAI Egy általános ontológiakezelô rendszernek szüksége van heterogén adatforrások kezelésére. Ez azért fontos, mert a különbözô ontológiák más-más nyelven készülnek, más-más reprezentációt használnak. A LOBO rendszer ilyen téren egy sikeres EU projekt, a SILK [1] eredményeire épít. A SILK rendszer vállalati információ-források integrálását segítô eszközök gyûjteménye. Az eszközkészletet a SILK (System Integration via Logic and Knowledge) EU projekt keretében, az 5. keretprogram IST alprogramjának támogatásával fejlesztette ki az IQSOFT Rt., francia, román és görög partnerekkel közösen. A LOBO mûködésének megértéséhez érdemes áttekinteni a SILK alapfilozófiáját, a modelltárház megközelítést, valamint megvizsgálni, hogy a heterogén információforrások kezelése milyen problémákat vet fel a megvalósítás során. A gyakorlatban sokszor elôfordul, hogy különbözô adatbázisok valamilyen szempontból összetartozó adatokat tárolnak, amelyeket érdemes lehet egyként látni. Képzeljünk el két, genetikai információkat tároló adatforrást. Az egyik például Ausztráliában, a másik Kanadában található. Egy orvos használhatja az egyiket is és a másikat is, sôt az is elképzelhetô, hogy olyan kérdést tesz fel, amelyhez mindkét adatforrás egyidejû lekérdezése szükséges. Érdemes lehet tehát valamilyen módon összekapcsolni, integrálni ezeket az adatforrásokat, és az így létrejött egységes adathalmazt használni a lekérdezések során. További tipikus integrációs feladat egy nagyobb intézmény, pl. kórház különbözô osztályain egymástól függetlenül kifejlesztett betegnyilvántartó rendszerek egyesítése, illetve két intézmény összeolvadásakor az adatbázisaik egységesítése. Az információ-integráció korántsem triviális feladat. Nagyon valószínû, hogy a különbözô adatforrások különbözô módon vannak tárolva, az egyik szabad szövegként, a másik relációs adatbázisként, a harmadik XML formátumú, részben strukturált szövegként (még a nyelv sem biztos, hogy azonos). Ha feltesszük, hogy azonos a tárolási formalizmus, akkor is szinte biztos, hogy más a logikája a tárolásnak. Az egyik, betegeket leíró adatbázis tárolja a beteg bizonyos adatait, a másik nem stb. Elképzelhetô, hogy ún. meta-szintû inkonzisztenciák is fellépnek, mert például mindkét adatforrás korlátozza a betegek magasságát, de az egyik azt jelenti, ki, hogy a betegek nagyobbak, mint 3(láb), a másik pedig azt jelenti, ki, hogy kisebbek, mint 2,5(m). Persze mindkét adatforrás mértékegység nélkül tárolja a számokat (hiszen minden angol orvos feltételezi, hogy a saját adatforrásában a mértékegység láb stb.), amibôl az integráció során ellentmondás keletkezik. A LOBO rendszer az adatintegrációs stratégiák közül az ún. modelltárház megközelítést használja, szemben a talán szélesebb körben ismert adattárház megközelítéssel. A modelltárház megközelítés egy ún. virtuális adatbázist épít. Ennek során csak az integrálandó adatforrásokat leíró modelleket, másképpen metaadatokat szükséges valójában összekapcsolni. Relációs esetben például metaadat az adatbázisban szereplô táblák neve és adatai, valami olyasmi, hogy ebben az adatforrásban vírusnevek vannak a hozzájuk kapcsolódó azonosítóval és rövid szöveges magyarázattal. A metaadatok segítségével lehetôvé válik az egyes adatforrások távoli lekérdezése. A felhasználó a kérdéseit a virtuális adatbázishoz intézi: ô úgy látja, mintha valójában létezne a megfelelô adattárház. A tényleges lekérdezés az ún. mediátor segítségével történik. Egy mediátor a megkapott kérdést felbontja olyan részekre, melyek megválaszolásához már csak egy-egy konkrét, valódi adatforrás szükséges. A modelltárház-megközelítés nagy elônye, hogy az adatforrásokban történô esetleges változásokat valós idôben képes átvezetni a rendszeren. Így, ha bármilyen adatszintû változás történt egy adatforrásban, az érezteti a hatását már a következô lekérdezéskor. További elôny, hogy létrehozásához nem kell költséges új hardver-elemeket venni, nem szükséges óriási mennyiségû információtömeggel közvetlenül dolgozni. Hátránya ugyanakkor a modelltárházaknak, hogy az összes megközelítés közül, lekérdezéskor, ennek a legnagyobb az erôforrásigénye, és emiatt a teljesítménye alacsonyabb lehet bizonyos, több adatforrást átfogó kérdéseknél. A SILK és a LOBO rendszerek komoly szimbolikus és logikai feladatok megvalósítását igénylik, ezért természetesen adódott a logikai programozás [9], mint a fô implementációs paradigma. Így a rendszerek magja a Prolog logikai nyelven készült, míg az adatbázisok elérését ill. a felhasználói felületet biztosító komponensekhez a Java nyelvet használtuk. AZ ORVOSI TERÜLET SPECIÁLIS IGÉNYEI Az utóbbi években tapasztalható fejlôdés miatt az orvosi területek ma már exponenciálisan növekedô adatmennyiséget termelnek ki. Különbözô adatbázisok jelentek meg, melyek például orvosi cikkeket, kutatási eredményeket tesznek kereshetôvé, sok esetben ingyenesen. Ilyen rendszer például a PubMed, melyet az orvos-kutatók a tényleges na- 28

pi rutin során is használnak. Ugyanakkor, az adatmennyiség növekedésével párhuzamosan egyre nehezebbé válik a releváns adatok hatékony elérése, felhasználása. Ebben segíthetnek az ontológiák. Például a PubMed rendszer a cikkekhez társítja a MeSH ontológia különbözô kategóriáit, így történhet az meg, hogy olyan találatokat kapunk vissza, melyek egyáltalán nem következnek magából a feltett keresôkérdésbôl. Az orvosi területeken megjelenô adatok és a hozzájuk tartozó ontológiák egységes központi adatbázisba való szervezése azonban gyakorlatilag kivihetetlen, az ismeretek és információk rendkívüli bonyolultsága, elosztottsága, heterogén, nem szabványos tárolási módjuk és az adatmennyiség gyors növekedése miatt. Az adatok együttes elérése azonban mindenképpen kívánatos, hiszen nagy segítség lenne, ha különbözô adatbázisokban egyszerre kereshetnék az orvosok a számukra érdekes adatokat. A LOBO PROJEKT JELENLEGI ÁLLÁSA A LOBO eszközkészletet a SILK rendszer ontológia irányú kibôvítéseként fejlesztjük ki. A SILK modellalapú szemléletmódja tökéletes alap egy ontológiakezelô rendszer létrehozásához. A SILK támogatja a modellek összehasonlítását, összekapcsolását, integrációját, heterogén információforrások modellalapú, komplex lekérdezését. A bôvítés célja, hogy a SILK nyelvét kiegészítsük az ontológiakezeléshez szükséges matematikai konstrukciókkal, valamint lehetôvé tegyük, hogy ezen konstrukciók a megfelelô módon használhatók legyenek a rendszer által nyújtott összes szolgáltatás során. A modelltárházban tároljuk a modelleket/ontológiákat. Ezeket létrehozhatjuk és szerkeszthetjük magával a LOBO rendszerrel, de felhasználhatunk erre a célra külsô eszközöket is. Ilyen eszköz lehet például a Protégé-2000 rendszer, melyben már készültek orvosi ontológiák. Ezen ontológiákat bevihetjük a LOBO rendszerbe és összeköthetjük létezô információforrásokkal, összehasonlíthatjuk más ontológiákkal stb. A bôvítés érdekében olyan modulokat is elkészítettünk, amelyek lehetôvé teszik, hogy a szemantikus web alapnyelvén, az RDF nyelven írt ontológiákat beolvassunk a LOBO modelltárházába. Ezután létrehoztunk egy alkalmazást, amely képes a MeSH ontológiát RDF alakúra konvertálni, amelyet így a LOBO rendszer is beolvashat. Készül továbbá egy olyan modul is, mely a GRAIL forrásokat teszi elérhetôvé a LOBO számára. A projekt kapcsán kifejlesztettünk egy, a LOBO-hoz szorosan kötôdô ontológiaszerkesztô eszközt, a LORE-t, mely az ontológiák böngészése során sokat kamatoztat az ún. Topic Map (ISO 13250-es szabvány) szemléletmódból. Ez utóbbi egy tudásreprezentációs formalizmus, amely nagyon közeli rokonságban áll az RDF-fel. A felhasználó szemszögébôl nézve ez egy nagyon jól áttekinthetô és követhetô böngészési módot tesz lehetôvé. Jelenleg a LOBO rendszer webesítésén dolgozunk. Egy olyan webalkalmazást hozunk létre, mely elérhetôvé teszi a LOBO rendszer legfôbb szolgáltatásait nyilvánosan, a weben keresztül. Terveink szerint lehetôvé válik, hogy a felhasználók néhány gombnyomás segítségével megadhassák az általuk integrálni kívánt információ-források elérhetôségét, az esetleges kiegészítô ontológiákat. Ezek után a rendszer segítségével máris lehetôvé válik komplex, több információ-forrás egyidejû használatát igénylô lekérdezések futtatása. ÖSSZEFOGLALÁS Az ontológiák használata jelentôsen elôsegítheti meglévô adatbázisok és információforrások intelligensebb lekérdezését és kezelését. Az általunk fejlesztett LOBO rendszer képes az ismertebb orvosi ontológiák beolvasására és kezelésére. Az ontológiák heterogén és elosztott tárolási módja szükségessé teszi azt is, hogy egy ontológiakezelô rendszer információ-integrációs feladatokat végezzen. Mi erre a célra a modelltárház megközelítést használjuk. KÖSZÖNETNYILVÁNÍTÁS A cikkben bemutatott munkát az EU 5. Keretprogramjának IST-1999-11135 számú SILK projektje, ill. az OM IKTA programjának 00126/2002 számú LOBO projektje keretében végeztük el. A szerzôk köszönettel tartoznak a SILK és LOBO projekt összes résztvevôjének. Külön szeretnénk megköszönni Benkô Tamásnak a cikk írása során nyújtott segítségét, nagyon értékes tanácsait és megjegyzéseit. IRODALOMJEGYZÉK [1] Benkô T., Krauth P., Szeredi P.: A Logic Based System for Application Integration, Proceedings of the 18th International Conference on Logic Programming, ICLP 2002, Springer, LNCS, 2002 [2] Darvas F, Futó I, Szeredi P: Logic-based program system for predicting drug interactions, Int J Biomed Comput. 1978 Jul; 9(4):259-71. Folytatás a következô oldalon. 29

[3] Ian Horrocks. Reasoning with expressive description logics: Theory and practice. In Andrei Voronkov, editor, Proc. of the 18th Int. Conf. on Automated Deduction (CADE 2002), number 2392 in Lecture Notes in Artificial Intelligence, pages 1-15. Springer, 2002. [4] Ian Horrocks, Peter F. Patel-Schneider: Three theses of representation in the semantic web. In Proc. of the Twelfth International World Wide Web Conference (WWW 2003), pages 39-47. ACM, 2003. [5] Lukácsy G.: RDFConsole Intelligens lekérdezés és következtetés a Weben. NJSZT MI szakosztály elôadás, Budapest, 2003 február. [6] Lukácsy G., Benkô T., Szeredi P., Krauth P.: Ontológiakezelés logikai módszerekkel, Networkshop 2003 konferencia, elôadás, Pécs 2003 április, http://nws.iif.hu/ncd2003/docs/ehu/ehu-122.pdf [7] Nelson, Stuart J.; Johnston, Douglas, Humphreys, Betsy L: Relations in Medical Subject Heading. Relationships in the organization of knowledge. New York: Kluwer Academic Publishers; 2001. p.171-184. [8] A. Rector, S. Bechhofer, C. A. Goble, I. Horrocks, W. A. Nowlan, W. D. Solomon: The Grail concept modelling language for medical terminology. Artificial Intelligence in Medicine, 9: 139-171, 1997. [9] Szeredi P., Gyimóthy T.: Logikai programozás és alkalmazásai. IX. Neumann Kongresszus kiadványa: 181-198. Neumann János Számítástudományi Társaság, 2003. A SZERZÔK BEMUTATÁSA Lukácsy Gergely 2003-ban szerzett okleveles mérnök-informatikus diplomát a Budapesti Mûszaki és Gazdaságtudományi Egyetemen. Tanulmányokat folytatott a Wyoming-i egyetem computer science szakán is. Jelenleg a BME Informatika Doktori Iskolájának állami ösztöndíjas doktorandusz hallgatója, témája az intelligens keresôrendszerek, a szemantikus Web és az ontológiák kapcsolata. 2002 óta az IQSOFT Rt. illetve IQSYS Rt. dolgozója. Szeredi Péter 1972-ben szerzett matematikus diplomát az Eötvös Loránd Tudományegyetemen, 1998-ban kapta meg a PhD fokozatot a Budapesti Mûszaki és Gazdaságtudományi Egyetemen (BME). 1972-tôl szoftver-fejlesztôként dolgozott a NIM Ipargazdasági és üzemszervezési Intézetben, majd 1979- tôl a Számítástechnikai Kutató és Innovációs központban (SZKI). 1987 és 1990 között a Manchesteri majd a Bristoli Egyetemen volt vendégkutató. 1990-tôl az IQSOFT illetve IQSYS Rt. munkatársa, majd tudományos vezetôje. Ezzel párhuzamosan 1998-tól a BME félállású egyetemi docense. Közel 30 éve dolgozik fô kutatási területén, a logikai programozási nyelvek megvalósításán és alkalmazásán. 1977 óta vesz részt a logikai programozás orvos-biológiai alkalmazásainak kutatásában. 1983-ban megosztott Akadémiai, 1988-ban megosztott Állami Díjban részesült. 30