Ontológiák és alkalmazásuk orvosi területen

Ontológiák és alkalmazásuk orvosi területen Lukácsy Gergely, IQSYS Rt., BME Szeredi Péter, IQSYS Rt., BME A cikk áttekinti az ontológiák témakörét, és bemutat egy kísérleti ontológiakezelô rendszert, hangsúlyt fektetve annak orvosi területeken való alkalmazhatóságára. Az ontológiák fontos szerepet játszanak különféle intelligens keresôrendszerekben, nyelvészeti- és adatbányászati eszközökben, csakúgy, mint a hagyományos információforrások hatékonyabb és kényelmesebb elérésének biztosításában. Az ontológiák különösen fontosak az orvostudományban, mert az utóbbi évek fejlôdése olyan mennyiségû biológiai és orvosi adatot termelt ki magából, amelyek között egyre nehezebb a kívánt információ megtalálása. BEVEZETÉS Ontológián egy adott tudományterületen fellelhetô tudás formális leírását értjük. Egy ilyen leírásban meg kell határoznunk az adott szakterület fogalmait és a köztük felállítható kapcsolatokat, le kell írnunk ezek hierarchikus elrendezését és a rájuk vonatkozó szabályokat. A Tolnai Lexikonban a görög eredetû szó jelentése a létrôl szóló tudomány. Foglalkozik a létezés kritériumaival, a létezôk legáltalánosabb tulajdonságaival és megismerhetôségével. Vannak filozófiai rendszerek, amelyekben az ontológia összeesik a metafizikával. Például a lázas beteg fogalmát definiálhatjuk úgy, hogy az egy olyan személy, akinek a testhômérséklete 38º felett van. Kapcsolat lehet az orvos-beteg viszony, amely két személyt kapcsol össze, vagy a testhômérséklete tulajdonság, amely egy személyhez annak hômérsékleti értékét rendeli. Fogalmak hierarchikus elrendezésekor gondolhatunk betegségek kategorizálására, valamilyen szempont szerint, vagy arra a kijelentésre, hogy minden lázas beteg egyben személy is. Szabály lehet például az, hogy akinek van háziorvosa, van TB kártyája is. Az ontológiai szabályok sok rokonságot mutatnak a különféle szakértô- és szabály-alapú rendszerekkel [2]. Ez a példa nem jó, egymástól függô fogalmakat nem szabad egymással meghatározni. (l. a deninitio szabályait). Helyes példa egy szabályra: akinek jogosan van érvényes TAJ számot igazoló hatósági igazolványa, annak joga van az OEP költségére az OEP-el szerzôdött háziorvosok közül háziorvost választani. Az egyszerûbb ontológiák csak egy fogalmi hierarchiát írnak le, ezeket hívjuk pehelysúlyú ontológiáknak. Az ún. nehézsúlyú ontológiákban a fogalom-hierarchia mellett szerepelhetnek kapcsolatok, definíciók, szabályok (ezekre a fentiekben láthattunk néhány példát). Cikkünkben a LOBO (LOgic Based management of Ontologies) projektet mutatjuk be, amely egy alkalmazás-független, logikai alapú, intelligens ontológiakezelô és információ-integrációs eszköz kifejlesztését tûzte ki célul. Ismertetjük a LOBO rendszer megvalósítási alapelveit, valamint a rendszer kísérleti alkalmazását az orvosi ontológiák területén. Legfontosabb céljaink között szerepelt, hogy a rendszer tegye lehetôvé nehézsúlyú ontológiák létrehozását és szerkesztését, létezô ontológiák konzisztenciájának ellenôrzését, ontológiák összehasonlítását és integrálását, valamint az ontológiákon alapuló ismeretkezelést. Ez utóbbi magába foglalja a létezô adatforrások ontológia-alapú lekérdezését, valamint ontológia-alapú konzisztencia ellenôrzését. ÁLTALÁBAN AZ ONTOLÓGIÁKRÓL Ontológiának általában bizonyos tulajdonságoknak megfelelô, formálisan reprezentált háttértudást hívunk. A leírás formális volta itt nagyon fontos, hiszen az ontológiák használatával azt szeretnénk elérni, hogy bizonyos (eddig nem automatizálható) folyamatokat a gépek sokkal intelligensebben tudjanak elvégezni, mint korábban. A leggyakrabban használt ontológiai háttértudás a fogalmak hierarchiája (taxonómia, rendszertan), amely már önmagában is jól felhasználható intelligens kereséshez, lekérdezéshez. A háttértudás azonban ennél sokkal bonyolultabb is lehet. Leírhatjuk például, hogy aki nô, nem férfi (fogalmak diszjunktsága), hogy a gyermekemnek én a szülôje vagyok (inverz kapcsolatok), vagy, hogy a leszármazottam leszármazottja az én leszármazottam is (tranzitív kapcsolat). Kijelenthetjük, hogy akik orvos-beteg viszonyban vannak, csaknem biztosan ismerik is egymást kivéve a még kivételes telemedicina eseteit (kapcsolatok hierarchiája). Ugyancsak szerepelhet egy ontológiában az a tudás, hogy mindenkinek, akinek van kedvenc sörfôzdéje, van kedvenc söre is (szabály), és bevezethetjük a sokgyerekes apa fogalmát úgy, hogy az egy olyan férfi, akinek van legalább két gyermeke (fogalomdefiníció). Az ontológiákat leíró formalizmusok komoly matematikai háttérrel, sokszor több évtizedes múlttal rendelkeznek. Az orvosi ontológiák területén az egyik legfejlettebb ontológia a 26

GRAIL (GALEN Representation and Integration Language) nyelv [8], amely az ún. leíró logikákon [3] alapul. Nem véletlen, hogy az egyik legrészletesebb klinikai ontológia éppen az OpenGalen CRM (Common Reference Model). Hasonlóan, a National Library of Medicine által gondozott másik népszerû orvosi ontológia, a MeSH [7] is rendelkezik megfelelô matematikai háttérrel, bár ez korántsem olyan kifejezô, mint a GRAIL esetében. Az ontológiák felhasználása számos kérdést vet fel. Fontos, hogy a feladathoz megfelelô kifejezôerôvel rendelkezô formalizmust válasszunk. Tudni kell ugyanakkor, hogy minél bonyolultabb a formalizmus, annál nehezebb (idôigényesebb) segítségével következtetni, és ez bizonyos esetekben problémát jelenthet. Ugyancsak lényeges kérdés, hogy hogyan kapcsoljuk össze az ontológiát az adatainkkal, valamint fontos lehet több ontológiából egy nagy, egységes ontológiát készíteni. HAGYOMÁNYOS ADATBÁZISOK ÉS AZ ONTOLÓGIÁK Az ontológiák egyik nagy elônye, hogy segítségükkel meglévô adatbázisok lekérdezése intelligensebbé tehetô, anélkül, hogy magukon az adatforrásokon bármit is változtatni kellene [6]. Képzeljünk el egy relációs adatforrást, amelynek egy-egy sora egy-egy vírust azonosít, leírja a nevét, azt, hogy a vírus melyik törzsbe tartozik, valamint egy egyedi azonosítót, az alábbi táblázatban leírtakhoz hasonló módon: Vírusnév Törzs Azonosító Herpesvirus Simplexvírusok 0134 HIV Lentivírusok 0022 SIV Retrovírusok 0345 Feltételezzük, hogy az adatforrás készítôje általában a legszûkebb törzsbe sorolja be az adott vírust, de ez nem feltétlenül van mindig így. A fenti példa a HIV vírust a lentivírusok családjába sorolja. Így, ha csak a fenti adatforrásra támaszkodunk, akkor arra a kérdésre, hogy igaz-e, hogy a HIV vírus retrovírus, nemleges lesz a válasz. Persze, hiszen honnan tudná egy gép, amely végrehajtja a lekérdezést, hogy a lentivírusok családja része a retrovírusokénak? Egy olyan ontológia segítségével, amely leírja a vírustörzsek tartalmazási hierarchiáját azonban már kikövetkeztethetô, hogy a HIV retrovírus. Ehhez semmi más nem kell, mint az eredeti adatbázis, az ontológia, amely a szükséges fogalmi rendszert (a vírustörzsek hierarchiáját, rendszertanát) írja le, és egy rendszer, amely képes összekapcsolni az ontológiát az adatforrással és ezért képes, az ontológia alapján intelligensebben válaszolni a feltett kérdésekre. Az ontológiák egy másik alkalmazási területe az adatkonzisztencia-ellenôrzés. Adatforrások összekapcsolásakor ugyanis elôfordulhatnak olyan ellentmondások, amelyek bizonyos háttértudás nélkül nem szûrhetôk ki. Tekintsük azt a példát, amikor egy adatforrásunkban a betegségekhez azok tüneteit társítjuk, például egy adott betegséghez többek között a levertséget. Egy másik adatforrásban betegségekhez ugyancsak tüneteket rendelünk, valamint elôfordulási gyakoriságot, halálozási arányt stb. Nyilván érdemes ezen két adatforrást egyként látni, hiszen elképzelhetô, hogy egyikben olyan betegségrôl is található információ, amelyrôl a másikban nem. Mi van azonban akkor, ha az egyik adatforrásban ugyanahhoz a betegséghez a levertség, a másikban a hiperaktivitás társul, mint jellemzô tünet? Háttértudás segítségével figyelmeztethetjük az integrációt végzô szakembert, hogy a két tünet általában kizárja egymást. Ontológia nélkül a két tünet pusztán két szó, amelyek viszonyáról semmit sem tudunk. A SZEMANTIKUS WEB Az ontológiák kiemelkedô szerepet játszhatnak abban is, hogy a jelenleginél intelligensebb módon kereshessünk a weben jelenlévô információ-dzsungelben, a honlapok, képek, folyóiratcikkek között. Az alábbiakban röviden áttekintjük az intelligens Internet megvalósítására irányuló legismertebb elképzelés, a szemantikus web [4, 5] alapjait. A szemantikus web megközelítés két alapötleten alapul. Az egyik az, hogy kapcsoljunk metainformációkat az Internetes erôforrásokhoz. Meta-adatnak nevezünk olyan adatot, amely adat egy adatról. Meta-adat például egy kémiai elemnek a felfedezôje, egy honlapról az, hogy ki készítette és mikor, egy állományról annak típusa és mérete, vagy egy képrôl az, hogy van rajta oroszlán, csimpánz és banán. A szemantikus web elképzelés meglehetôsen tágan értelmezi az Internetes erôforrások fogalmát és alapkövetelményének tekinti, hogy metainformációt társíthassunk lényegében bármihez, ami egyedileg azonosítható. Ilyen például egy honlap vagy a honlap egy része, egy kép, egy videó anyag, egy tetszôleges állomány, egy hardvereszköz. Ilyen lehet azonban egy kávéscsésze, egy betegség, egy daganat, egy szerv vagy egy kesztyû is, amennyiben egyedi azonosító társul hozzájuk. Így egy folyóiratcikkhez egységes módon társíthatunk információt, függetlenül attól, hogy az egy Word állományként vagy PDF formátumban áll rendelkezésre. A metainformációk erôforrásokhoz kapcsolásán túl a szemantikus web másik lényeges alapeleme, hogy következtetni kell tudni ezen metainformációk segítségével. 27

Ez például azt jelenti, hogy valamilyen úton ki kell tudni deríteni, hogy a fentebb említett csimpánzos képen állatok szerepelnek, holott a metainformáció csak annyi volt, hogy csimpánz és oroszlán is látható rajta. Az ontológiák a szemantikus web következtetési oldalán játszanak nagyon fontos szerepet. Látható, hogy a fenti esetben egy közönséges, állatok hierarchikus viszonyait leíró ontológia is elég ahhoz, hogy kikövetkeztessük, a csimpánz és az oroszlán is állat. Sokszor persze ennél jóval bonyolultabb információkra is lehet szükség a hatékony kereséshez. A LOBO RENDSZER MEGVALÓSÍTÁSÁNAK ALAPJAI Egy általános ontológiakezelô rendszernek szüksége van heterogén adatforrások kezelésére. Ez azért fontos, mert a különbözô ontológiák más-más nyelven készülnek, más-más reprezentációt használnak. A LOBO rendszer ilyen téren egy sikeres EU projekt, a SILK [1] eredményeire épít. A SILK rendszer vállalati információ-források integrálását segítô eszközök gyûjteménye. Az eszközkészletet a SILK (System Integration via Logic and Knowledge) EU projekt keretében, az 5. keretprogram IST alprogramjának támogatásával fejlesztette ki az IQSOFT Rt., francia, román és görög partnerekkel közösen. A LOBO mûködésének megértéséhez érdemes áttekinteni a SILK alapfilozófiáját, a modelltárház megközelítést, valamint megvizsgálni, hogy a heterogén információforrások kezelése milyen problémákat vet fel a megvalósítás során. A gyakorlatban sokszor elôfordul, hogy különbözô adatbázisok valamilyen szempontból összetartozó adatokat tárolnak, amelyeket érdemes lehet egyként látni. Képzeljünk el két, genetikai információkat tároló adatforrást. Az egyik például Ausztráliában, a másik Kanadában található. Egy orvos használhatja az egyiket is és a másikat is, sôt az is elképzelhetô, hogy olyan kérdést tesz fel, amelyhez mindkét adatforrás egyidejû lekérdezése szükséges. Érdemes lehet tehát valamilyen módon összekapcsolni, integrálni ezeket az adatforrásokat, és az így létrejött egységes adathalmazt használni a lekérdezések során. További tipikus integrációs feladat egy nagyobb intézmény, pl. kórház különbözô osztályain egymástól függetlenül kifejlesztett betegnyilvántartó rendszerek egyesítése, illetve két intézmény összeolvadásakor az adatbázisaik egységesítése. Az információ-integráció korántsem triviális feladat. Nagyon valószínû, hogy a különbözô adatforrások különbözô módon vannak tárolva, az egyik szabad szövegként, a másik relációs adatbázisként, a harmadik XML formátumú, részben strukturált szövegként (még a nyelv sem biztos, hogy azonos). Ha feltesszük, hogy azonos a tárolási formalizmus, akkor is szinte biztos, hogy más a logikája a tárolásnak. Az egyik, betegeket leíró adatbázis tárolja a beteg bizonyos adatait, a másik nem stb. Elképzelhetô, hogy ún. meta-szintû inkonzisztenciák is fellépnek, mert például mindkét adatforrás korlátozza a betegek magasságát, de az egyik azt jelenti, ki, hogy a betegek nagyobbak, mint 3(láb), a másik pedig azt jelenti, ki, hogy kisebbek, mint 2,5(m). Persze mindkét adatforrás mértékegység nélkül tárolja a számokat (hiszen minden angol orvos feltételezi, hogy a saját adatforrásában a mértékegység láb stb.), amibôl az integráció során ellentmondás keletkezik. A LOBO rendszer az adatintegrációs stratégiák közül az ún. modelltárház megközelítést használja, szemben a talán szélesebb körben ismert adattárház megközelítéssel. A modelltárház megközelítés egy ún. virtuális adatbázist épít. Ennek során csak az integrálandó adatforrásokat leíró modelleket, másképpen metaadatokat szükséges valójában összekapcsolni. Relációs esetben például metaadat az adatbázisban szereplô táblák neve és adatai, valami olyasmi, hogy ebben az adatforrásban vírusnevek vannak a hozzájuk kapcsolódó azonosítóval és rövid szöveges magyarázattal. A metaadatok segítségével lehetôvé válik az egyes adatforrások távoli lekérdezése. A felhasználó a kérdéseit a virtuális adatbázishoz intézi: ô úgy látja, mintha valójában létezne a megfelelô adattárház. A tényleges lekérdezés az ún. mediátor segítségével történik. Egy mediátor a megkapott kérdést felbontja olyan részekre, melyek megválaszolásához már csak egy-egy konkrét, valódi adatforrás szükséges. A modelltárház-megközelítés nagy elônye, hogy az adatforrásokban történô esetleges változásokat valós idôben képes átvezetni a rendszeren. Így, ha bármilyen adatszintû változás történt egy adatforrásban, az érezteti a hatását már a következô lekérdezéskor. További elôny, hogy létrehozásához nem kell költséges új hardver-elemeket venni, nem szükséges óriási mennyiségû információtömeggel közvetlenül dolgozni. Hátránya ugyanakkor a modelltárházaknak, hogy az összes megközelítés közül, lekérdezéskor, ennek a legnagyobb az erôforrásigénye, és emiatt a teljesítménye alacsonyabb lehet bizonyos, több adatforrást átfogó kérdéseknél. A SILK és a LOBO rendszerek komoly szimbolikus és logikai feladatok megvalósítását igénylik, ezért természetesen adódott a logikai programozás [9], mint a fô implementációs paradigma. Így a rendszerek magja a Prolog logikai nyelven készült, míg az adatbázisok elérését ill. a felhasználói felületet biztosító komponensekhez a Java nyelvet használtuk. AZ ORVOSI TERÜLET SPECIÁLIS IGÉNYEI Az utóbbi években tapasztalható fejlôdés miatt az orvosi területek ma már exponenciálisan növekedô adatmennyiséget termelnek ki. Különbözô adatbázisok jelentek meg, melyek például orvosi cikkeket, kutatási eredményeket tesznek kereshetôvé, sok esetben ingyenesen. Ilyen rendszer például a PubMed, melyet az orvos-kutatók a tényleges na- 28

pi rutin során is használnak. Ugyanakkor, az adatmennyiség növekedésével párhuzamosan egyre nehezebbé válik a releváns adatok hatékony elérése, felhasználása. Ebben segíthetnek az ontológiák. Például a PubMed rendszer a cikkekhez társítja a MeSH ontológia különbözô kategóriáit, így történhet az meg, hogy olyan találatokat kapunk vissza, melyek egyáltalán nem következnek magából a feltett keresôkérdésbôl. Az orvosi területeken megjelenô adatok és a hozzájuk tartozó ontológiák egységes központi adatbázisba való szervezése azonban gyakorlatilag kivihetetlen, az ismeretek és információk rendkívüli bonyolultsága, elosztottsága, heterogén, nem szabványos tárolási módjuk és az adatmennyiség gyors növekedése miatt. Az adatok együttes elérése azonban mindenképpen kívánatos, hiszen nagy segítség lenne, ha különbözô adatbázisokban egyszerre kereshetnék az orvosok a számukra érdekes adatokat. A LOBO PROJEKT JELENLEGI ÁLLÁSA A LOBO eszközkészletet a SILK rendszer ontológia irányú kibôvítéseként fejlesztjük ki. A SILK modellalapú szemléletmódja tökéletes alap egy ontológiakezelô rendszer létrehozásához. A SILK támogatja a modellek összehasonlítását, összekapcsolását, integrációját, heterogén információforrások modellalapú, komplex lekérdezését. A bôvítés célja, hogy a SILK nyelvét kiegészítsük az ontológiakezeléshez szükséges matematikai konstrukciókkal, valamint lehetôvé tegyük, hogy ezen konstrukciók a megfelelô módon használhatók legyenek a rendszer által nyújtott összes szolgáltatás során. A modelltárházban tároljuk a modelleket/ontológiákat. Ezeket létrehozhatjuk és szerkeszthetjük magával a LOBO rendszerrel, de felhasználhatunk erre a célra külsô eszközöket is. Ilyen eszköz lehet például a Protégé-2000 rendszer, melyben már készültek orvosi ontológiák. Ezen ontológiákat bevihetjük a LOBO rendszerbe és összeköthetjük létezô információforrásokkal, összehasonlíthatjuk más ontológiákkal stb. A bôvítés érdekében olyan modulokat is elkészítettünk, amelyek lehetôvé teszik, hogy a szemantikus web alapnyelvén, az RDF nyelven írt ontológiákat beolvassunk a LOBO modelltárházába. Ezután létrehoztunk egy alkalmazást, amely képes a MeSH ontológiát RDF alakúra konvertálni, amelyet így a LOBO rendszer is beolvashat. Készül továbbá egy olyan modul is, mely a GRAIL forrásokat teszi elérhetôvé a LOBO számára. A projekt kapcsán kifejlesztettünk egy, a LOBO-hoz szorosan kötôdô ontológiaszerkesztô eszközt, a LORE-t, mely az ontológiák böngészése során sokat kamatoztat az ún. Topic Map (ISO 13250-es szabvány) szemléletmódból. Ez utóbbi egy tudásreprezentációs formalizmus, amely nagyon közeli rokonságban áll az RDF-fel. A felhasználó szemszögébôl nézve ez egy nagyon jól áttekinthetô és követhetô böngészési módot tesz lehetôvé. Jelenleg a LOBO rendszer webesítésén dolgozunk. Egy olyan webalkalmazást hozunk létre, mely elérhetôvé teszi a LOBO rendszer legfôbb szolgáltatásait nyilvánosan, a weben keresztül. Terveink szerint lehetôvé válik, hogy a felhasználók néhány gombnyomás segítségével megadhassák az általuk integrálni kívánt információ-források elérhetôségét, az esetleges kiegészítô ontológiákat. Ezek után a rendszer segítségével máris lehetôvé válik komplex, több információ-forrás egyidejû használatát igénylô lekérdezések futtatása. ÖSSZEFOGLALÁS Az ontológiák használata jelentôsen elôsegítheti meglévô adatbázisok és információforrások intelligensebb lekérdezését és kezelését. Az általunk fejlesztett LOBO rendszer képes az ismertebb orvosi ontológiák beolvasására és kezelésére. Az ontológiák heterogén és elosztott tárolási módja szükségessé teszi azt is, hogy egy ontológiakezelô rendszer információ-integrációs feladatokat végezzen. Mi erre a célra a modelltárház megközelítést használjuk. KÖSZÖNETNYILVÁNÍTÁS A cikkben bemutatott munkát az EU 5. Keretprogramjának IST-1999-11135 számú SILK projektje, ill. az OM IKTA programjának 00126/2002 számú LOBO projektje keretében végeztük el. A szerzôk köszönettel tartoznak a SILK és LOBO projekt összes résztvevôjének. Külön szeretnénk megköszönni Benkô Tamásnak a cikk írása során nyújtott segítségét, nagyon értékes tanácsait és megjegyzéseit. IRODALOMJEGYZÉK [1] Benkô T., Krauth P., Szeredi P.: A Logic Based System for Application Integration, Proceedings of the 18th International Conference on Logic Programming, ICLP 2002, Springer, LNCS, 2002 [2] Darvas F, Futó I, Szeredi P: Logic-based program system for predicting drug interactions, Int J Biomed Comput. 1978 Jul; 9(4):259-71. Folytatás a következô oldalon. 29

[3] Ian Horrocks. Reasoning with expressive description logics: Theory and practice. In Andrei Voronkov, editor, Proc. of the 18th Int. Conf. on Automated Deduction (CADE 2002), number 2392 in Lecture Notes in Artificial Intelligence, pages 1-15. Springer, 2002. [4] Ian Horrocks, Peter F. Patel-Schneider: Three theses of representation in the semantic web. In Proc. of the Twelfth International World Wide Web Conference (WWW 2003), pages 39-47. ACM, 2003. [5] Lukácsy G.: RDFConsole Intelligens lekérdezés és következtetés a Weben. NJSZT MI szakosztály elôadás, Budapest, 2003 február. [6] Lukácsy G., Benkô T., Szeredi P., Krauth P.: Ontológiakezelés logikai módszerekkel, Networkshop 2003 konferencia, elôadás, Pécs 2003 április, http://nws.iif.hu/ncd2003/docs/ehu/ehu-122.pdf [7] Nelson, Stuart J.; Johnston, Douglas, Humphreys, Betsy L: Relations in Medical Subject Heading. Relationships in the organization of knowledge. New York: Kluwer Academic Publishers; 2001. p.171-184. [8] A. Rector, S. Bechhofer, C. A. Goble, I. Horrocks, W. A. Nowlan, W. D. Solomon: The Grail concept modelling language for medical terminology. Artificial Intelligence in Medicine, 9: 139-171, 1997. [9] Szeredi P., Gyimóthy T.: Logikai programozás és alkalmazásai. IX. Neumann Kongresszus kiadványa: 181-198. Neumann János Számítástudományi Társaság, 2003. A SZERZÔK BEMUTATÁSA Lukácsy Gergely 2003-ban szerzett okleveles mérnök-informatikus diplomát a Budapesti Mûszaki és Gazdaságtudományi Egyetemen. Tanulmányokat folytatott a Wyoming-i egyetem computer science szakán is. Jelenleg a BME Informatika Doktori Iskolájának állami ösztöndíjas doktorandusz hallgatója, témája az intelligens keresôrendszerek, a szemantikus Web és az ontológiák kapcsolata. 2002 óta az IQSOFT Rt. illetve IQSYS Rt. dolgozója. Szeredi Péter 1972-ben szerzett matematikus diplomát az Eötvös Loránd Tudományegyetemen, 1998-ban kapta meg a PhD fokozatot a Budapesti Mûszaki és Gazdaságtudományi Egyetemen (BME). 1972-tôl szoftver-fejlesztôként dolgozott a NIM Ipargazdasági és üzemszervezési Intézetben, majd 1979- tôl a Számítástechnikai Kutató és Innovációs központban (SZKI). 1987 és 1990 között a Manchesteri majd a Bristoli Egyetemen volt vendégkutató. 1990-tôl az IQSOFT illetve IQSYS Rt. munkatársa, majd tudományos vezetôje. Ezzel párhuzamosan 1998-tól a BME félállású egyetemi docense. Közel 30 éve dolgozik fô kutatási területén, a logikai programozási nyelvek megvalósításán és alkalmazásán. 1977 óta vesz részt a logikai programozás orvos-biológiai alkalmazásainak kutatásában. 1983-ban megosztott Akadémiai, 1988-ban megosztott Állami Díjban részesült. 30