Szemantikus technológiák területei Rácz Gábor, 2011.10.14.
Alkalmazások Cégek közötti együttműködés (Searchy) Telekommunikáció Mobiltelefonos tartalomszolgáltatás (KTF) DBPedia Mobile OntoWiki Mobile Kockázatkezelés (POKM) Kompetenciamenedzsment (CONTO) Hírek, releváns adatok (dayta.me) 2011.10.14. Rácz Gábor 2
Searchy Vállalkozási Információ Integrációs Rendszer Ontológiákon és web-szolgáltatásokon alapul Az adatokat hangolja össze úgy, hogy az adatok belső szerkezete ne változzon. Főbb alapelvek: Elosztottság (distribution) Együttműködés (collaboration) Összefonódás (federation) Laza kapcsolódás (no intrusion) 2011.10.14. Rácz Gábor 3
Searchy Ontológiák Adatintegráció Komm. réteg: SOAP üzenetek az ágensek között R.mag: ágensek igényeinek kezelése, leképezése Wrapperek: minden információtípushoz egy-egy közös interface (SQL, LDAP, Google, Harvest) Adatforrások: Webszerverek, indexek, hagyományos adatbázisok, algoritmus kimenete, 2011.10.14. Rácz Gábor 4
DBPedia Mobil 2011.10.14. Rácz Gábor 5
DBPedia Mobil 2011.10.14. Rácz Gábor 6
DBPedia Mobil 2011.10.14. Rácz Gábor 7
Competencies Management System 2011.10.14. Rácz Gábor 8
Területek Adatgyűjtés Tárolás Adatforrások Integráció Lekérdezés Megjelenítés 2011.10.14. Rácz Gábor 9
Adatok gyűjtése, kinyerése A Weben rengeteg adat található, de többségében strukturálatlanul vagy csak félig strukturáltan. Ahhoz hogy a számítógép el tudjon köztük igazodni, valamilyen eszközt kell adni neki segítségül. E célból születtek, születnek a különböző szemantikus technológiák. A feladat, hogy a Weben már megtalálható, illetve az időközben keletkező adatokat annotálni tudjuk. 2011.10.14. Rácz Gábor 10
Manuálisan Az internetes közösség tagjainak bevonásával. A meglévő oldalak felcímkézése. (Szemantikus annotátorok segítségével.) Direkt hármasok felvitele. Példa: Annotea, OntoMat, SMORE, 2011.10.14. Rácz Gábor 11
Félig automatizálva Egy algoritmusnak valahogy betanítjuk, mit is szeretnénk kinyerni. Aztán a hasonló oldalakat már önállóan feldogozza. Példa: Web2RDF 2011.10.14. Rácz Gábor 12
Web 2 RDF Pinczel Balázs munkája ELTE, IK MSc hallgató?name 2011.10.14. Rácz Gábor 13
Teljesen automatikusan Fájlok, weboldalak metaadatainak gyűjtése Sindice, NEPOMUK, Oldalak, fájlok szövegéből kinyerve NLP eszközök bevonásával többé-kevésbé automatizálni lehet a nyers szövegek feldolgozását. A pontosság még nem éri el azt a szintet, hogy a gyakorlatban jól alkalmazhatóak legyenek ezek az eszközök. 2011.10.14. Rácz Gábor 14
Tárolás Relációs adatbázisban: Jena Sesame Speciális adatbáziskezelők: Virtuoso RDF-3X 2011.10.14. Rácz Gábor 15
Tárolás Gyakran nagy méretű, több száz milliós adathalmazok jönnek létre. Elosztott tárolás Adatintegráció 2011.10.14. Rácz Gábor 16
Adatforrások 2011.10.14. 10. 09. Rácz Gábor 17 Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
Adatforrások DBPedia: a Wikipediában tárolt információ RDF átirata. GeoNames: földrajzi adatok országokról és egyéb helyekről. BBC Music: kritikák és egyéb jellemzők zenei albumokról, előadókról. education.data.gov.uk: az Egyesült Királyság oktatási adatai Gene Ontology: a gén kutatással kapcsolatos eredmények. 2011.10.14. Rácz Gábor 18
Entity Resolution Minden objektumhoz egyértelmű azonosítót rendelünk, azonban egy objektumhoz több ilyet is megadhatunk. Ezekről jó lenne tudni. SameAs Felismerni, hogy két azonosító ugyanazt az objektumot azonosítja: Joachim Kleb, Andreas Abecker: Disambiguating Entity References Within an Ontological Model 2011.10.14. Rácz Gábor 19
Adatintegráció Cél: transzparens módon hozzáférni több, heterogén adatforráshoz 2011.10.14. Rácz Gábor 20
Adatintegráció Problémák: Sémaintegráció Lekérdezések átírása minden forráshoz Lekérdezések optimalizálása Források autonómiája Wrapperek Megoldás: RDF Szabványos séma (subjecte, predicate, object) Szabványos lekérdezőnyelv (SPARQL) 2011.10.14. Rácz Gábor 21
Lekérdezés Már vannak adataink, el vannak tárolva. Most el kéne érni, le kellene kérdezni ezeket. SPARQL 1.0 / 1.1 SPARQL végpontok: Virtuoso Joseki, ARQ Sesame Végpontok listája 2011.10.14. Rácz Gábor 22
Lekérdezés Jens Lehmann, Lorenz Bühmann: AutoSPARQL 2011.10.14. Rácz Gábor 23
VisualQuery Rácz Gábor munkája ELTE, IK MSc hallgató SELECT?x?mbox WHERE{?x foaf:name Peter Goodguy.?x foaf:mbox?mbox. } 2011.10.14. Rácz Gábor 24
Megjelenítés Vannak adataink, el vannak tárolva, le tudjuk őket kérdezni. Valamilyen formában meg kéne jeleníteni őket: az adatokat, a lekérdezések eredményeit. 2011.10.14. Rácz Gábor 25
Megjelenítés Az RDF adatok jól reprezentálhatók gráffal. (csúcsok objektumok, ir. élek - tulajdonságok) Cytoscape Web Relfinder Egyéb megjelenítők SemLens: táblázatok, grafikonok Fresnel: HTML oldal generálása Sima táblázatos forma 2011.10.14. Rácz Gábor 26
Cytoscape Gombos Gergő munkája ELTE, IK MSc hallgató 2011.10.14. Rácz Gábor 27
EU s 7th Framework Programme (FP7) 2007 2013-ig tartó EU-s projekt Tudományos kutatásokat támogat A semantic web kifejezésre rákeresve a több ezer támogatott projektek között, 206 találatot kapunk. 2011.10.14. Rácz Gábor 28
Fontosabb konferenciák, folyóiratok, versenyek ISCW (International Semantic Web Conference: Linked Data-a-thon) ESCW (Extended Semantic Web Conference) WIMS (International Conference on Web Intelligence, Mining and Semantics) FoIKS (Foundations of Information and Knowledge Systems) Journal of Web Semantics Semantic Web Challenge 2011.10.14. Rácz Gábor 29
Köszönöm a figyelmet! 2011.10.14. Rácz Gábor 30