X. Néhány ismertebb ontológia 1
ezeket az ontológiákat egy-egy csoport fejleszti megegyezésen alapul a jelentést többnyire szövegesen írják le a formális leíró nyelvvel most még nem foglalkozunk 2
felső szintű általános emberi ismeretek miért is kell a rigó fekete feltételezi, hogy ismert: a rigó egy madár, a madárnak tolla van, a tollnak színe van Cyc (Cyc corp.) Sowa ontológiája (John F. Sowa) Standard Upper Ontology (IEEE munkacsoport) 3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
felső szintű: Cyc minél bonyolultabb, annál valószínűbb az inkonzisztencia mikroelmélet: az ismeretbázisban lévő formulák egy halmaza. minden formula legalább egy kontextusba tartozik, de egy rá vonatkozó állítás csak ahhoz az egyetlen kontextushoz, amelyben az állítás elhangzott minden formulához mikroelméletenként igazságérték rendelhető 26
felső szintű: Cyc öt igazságérték: default true, monotonically true, default false, monotonically false, unknown minden CycL-rendszer legalább egy true és legalább egy false értéket kell támogasson a két leggyakoribb true-érték: monotonically true: kivétel nélkül igaz. Minden változóillesztés esetén igaz, és ez az érték nem hatálytalanítható. default true: igaz, de van kivétel. Bizonyos (fontos) kontextusokban igaz, de ez az érték hatálytalanítható. 27
felső szintű: Sowa háló struktúra: mindennek van közös őse és közös leszármazottja univerzális típus: létezik, minden ennek példánya vagy alosztálya univerzális típus közvetlen leszármazottai: ezek kombinációjából állnak elő továbbiak például: History a Proposition és az Occurrent alosztálya, amiknek közös őse az univerzális típus http://www.jfsowa.com/ontology/toplevel.htm abszurd típus: nincs példánya, mindennek alosztálya 28
felső szintű: SUO (IEEE) 1000 fogalom, 4000 axióma, 750 szabály kézi leképzés a teljes WordNet-re fejlesztés 2000-től, US állami támogatás kapcsolódó tárgyköri ontológiák 20 000 fogalommal és 70 000 axiómával, DBPedia (emberek), Wikipedia, Mondial (földrajzi adatok), ingyenes validálása: WordNet leképzés (lefedettség és teljeség ellenőrzés) peer review (open source) formális validáció tétel bizonyítóval (ellentmondás menteség, a keresésre időkorlát) 29
felső szintű: SUO (IEEE) IFF (Information Flow Framework) Foundation Ontology szintek metashell: pl. halmaz, függvény, gyűjtemények, relációk, natural: pl. halmaz elmélet, intézmények, logikai függvények, http://suo.ieee.org/iff/architecture.html névterek 30
felső szintű: SUO (IEEE) Suggested Upper Merged Ontology (SUMO) részontológiái 31 http://www.ontologyportal.org/
nyelvi nem igazi ontológiák, mert nem a tárgykört modellezik, hanem a nyelvi elemek jelentését nyelvi elemek, leginkább szavak többnyire egy az egy megfeleltetés a szavak és a fogalmak között egy nyelv (pl. WordNET), több nyelv, nyelv függő és független részek (pl. Euro WordNET), nyelv független online adatbázis (pl. WordNET), gépi fordításhoz, szöveg generáláshoz 32
nyelvi: WordNET angol nyelvi lexikális online adatbázis, >150,000 szó kezdeményező George A. Miller (Princeton University's Department of Psychology) szótár a gépeknek, RDF/OWL reprezentáció alapfogalma a synset (szinonima halmaz) car {car, auto, automobile, machine, motorcar} car {car, railcar, railway car, railroad car} egy synset egy vagy több szóértelmet tartalmaz, minden szóértelem pontosan egy synset-be tartozik, minden szóértelmet egy szóalak reprezentál, egy szóalakhoz több szóértelem tartozhat 33
nyelvi: WordNET synset kapcsolatok minden szótípusra szinonima, antoníma főnevekre hiponima (alnév: fa növény), hipernima (felnév), egyosztályú (kutya, farkas kutyafélék), holonima (tartalmazás: ház ablak), része (ablak ház) igékre hipernima (felfog figyel), troponima (selypít beszél), velejár (alvás horkolás), egyosztályú (selypít, ordít beszél) jelzőkre kapcsolódó főnév (kíváncsi kíváncsiság), hasonló (gyors sebes), melléknévi igenév (merni merészség), határozószó (szép szépen) kapcsolatok mentén hierarchia is 34
wiki nem igazi ontológiák wikipedia: közösség által szerkesztett, enciklopédia jellegű szöveges leírások gyűjteménye, >6.9 millió cikk, 251 nyelv, 4% havi növekedés dbpedia: strukturált információkinyerése a Wikipediából hozzáférhető a weben nyílt liszensz alatt kapcsolatok a web más adathalmazaihoz 35
cím Ismertebb ontológiák wiki: dbpedia absztrakt info doboz geo-koordináták kategóriák képek kapcsolatok más nyelvek más lapok egyértelműsítés C.Bizer, S.Auer, R.Cyganiak, G.Kobilarov: DBpedia - Querying Wikipedia like a Database (Slides). 16th International World Wide Web Conference (WWW2007), Banff, Canada, May 2007 36
wiki: dbpedia http://en.wikipedia.org/wiki/calgary http://dbpedia.org/resource/calgary dbpedia:native_name Calgary ; dbpedia:altitude 1048 ; dbpedia:population_city 988193 ; dbpedia:population_metro 1079310 ; mayor_name governing_body... dbpedia:dave_bronconnier ; dbpedia:calgary_city_council; C.Bizer, S.Auer, R.Cyganiak, G.Kobilarov: DBpedia - Querying Wikipedia like a Database (Slides). 16th International World Wide Web Conference (WWW2007), Banff, Canada, May 2007 37
wiki: dbpedia C.Bizer, S.Auer, R.Cyganiak, G.Kobilarov: DBpedia - Querying Wikipedia like a Database (Slides). 16th International World Wide Web Conference (WWW2007), Banff, Canada, May 2007 38
wiki: dbpedia C.Bizer, S.Auer, R.Cyganiak, G.Kobilarov: DBpedia - Querying Wikipedia like a Database (Slides). 16th International World Wide Web Conference (WWW2007), Banff, Canada, May 2007 39
tárgyköri: Dublin Core nem igazán ontológia, kezdetek 1994: hogyan lehet a dolgokat a weben könnyebben megtalálni web oldalak leírására metaadatok, erőforrás leíró, html oldalakban DCMI: Dublin Core Metadata Initiative 2005: absztrakt model szabványok: IETF RFC 2413, CEN, ANSI/NISO Z39.85, ISO 15836 könyvtárak, MARC katalógus 40
tárgyköri: Dublin Core absztrakt modell: az erőforrásokról a metanyelven megfogalmazott állítások struktúrája property resource statement value erőforrás: bármi, amit be lehet azonosítani (fizikai, digitális, fogalom) leírás: egyetlen erőforrásról szóló állítások állítás: tulajdonság azonosító, érték azonosító, érték elem pontosítók: a szülő tulajdonság szűkítése (a könyv illusztrátora a közreműködő speciális esete) 41
tárgyköri: Dublin Core implied subject implied verb one of 15 properties DC:Creator DC:Title DC:Subject DC:Date... property value (an appropriate literal) Resource has property X qualifiers (adjectives) 42 Dublin Core Metadata Tutorial, July 9, 2007, Stuart Weibel, OCLC
tárgyköri: Dublin Core tulajdonságok definiálása Term Name: contributor URI: Label: Definition: Comment: http://purl.org/dc/elements/1.1/contributor Contributor An entity responsible for making contributions to the resource. Examples of a Contributor include a person, an organization, or a service. Typically, the name of a Contributor should be used to indicate the entity. 43 http://dublincore.org/documents/dces/
tárgyköri: Dublin Core 15 tulajdonság Cím Téma Kiadó Dátum Típus Formátum Azonosító Létrehozó Forrás Nyelv Jogok Tartalmi leírás Közreműködő Kapcsolat Tér-idő vonatkozás kódolási sémák kontrollált szótár (pl. Library of Congress Subject Headings) string formátum (pl. "2001-05-02" május 3 és nem február 5) 44
tárgyköri: Dublin Core <head> <link rel="schema.dc" href="http://purl.org/dc"> <meta name="dc.title" content= DC Metadata Tutorial <meta name="dc.creator" content= Stuart L. Weibel"> <meta name="dc.subject" xml:lang= en-us content= Metadata"> <meta name="dc.date" scheme= DCTERMS.W3CDTF" content= 2007-07-08"> </head> <body> [ rest of html document ] 45 Dublin Core Metadata Tutorial, July 9, 2007, Stuart Weibel, OCLC
tárgyköri: UNSPSC United Nations Standard Products and Services Code termékek és szolgáltatások taxonómiája konszenzus alapú felhasználása: Enterprise Resource Planning, e-commerce, Business Intelligence systems hierarchikus 4 szintű fa struktúra: Segment, Family, Class and Commodity termékek csak egy kategóriában szerepelnek, minden kategóriának egy őse van 46
tárgyköri: UNSPSC 47 http://www.unspsc.org/webseminar.asp
tárgyköri: UNSPSC 48 http://www.unspsc.org/webseminar.asp
tárgyköri: RosettaNet 1998-ban alapított független non-profit szervezet XML alapú elektronikus kereskedelmi interfész szabványok a beszállító láncok partnerei közötti folyamatok globális összehangolása RosettaNet konzorcium tagjai fontos IT cégek keretrendszer Partner Interface Processes (PIPs) A Master Dictionary Business Dictionary Technical Dictionary A messaging system 49
tárgyköri: RosettaNet 50 https://kjcsolutions.com/rosettanetprimer3.html
tárgyköri: RosettaNet RosettaNet Business Dictionary információ a kereskedelmi partnerekről Business Properties (e.g. business address), Business Data Entities (like ActionIdentity), Fundemental Business Data Entities (e.g. BusinessTaxIdentifier, AccountNumber) egy business dictionary tartalmazza az összes beszállítói láncot, mint Electronic Components (EC), Information Technology (IT), stb. 51
tárgyköri: RosettaNet RosettaNet termék kategorizálást a RosettaNet Technical Dictionary (RTD) tartalmazza a termékeket és jellemzőiket XML DTD írja le minden termék típushoz előre definiált XML tag halmaz tartozik minden termék osztálynak megfelel egy Universal Standard Products and Services Classification (UNSPSC) kód 52
tárgyköri: SNOMED Systemtized Nomenclature of MEDicine a legrészletesebb orvosi kódrendszer egyes személyek egészségi állapotának lehető legrészletesebb kódolt (formális) leírását igyekszik lehetővé tenni leíró logikát használ, a mai web ontológiák nyelvét 53
összefoglaló sok gyűjtemény létezik már sok terület tudását tartalmazza egy részük szabadalmazott, vagy csak szűk körben használatos jelentős részük szabadon hozzáférhető a weben egyre több összeköttetés létezik közöttük 54