A szemantikus Web. Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 0.



Hasonló dokumentumok
SZEMANTIKUS WEB. Méréstechnika és Információs Rendszerek Tanszék

SZEMANTIKUS WEB. Méréstechnika és Információs Rendszerek Tanszék

Szemantikus Web Semantic Web A szemantikus web alkalmas megközelítés, illetve megfelel nyelvekkel, eszközökkel támogatja az intelligens információs

A Szemantikus Web 2. Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 0.

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 0. A Wolfram Alpha tudásgép.

Szemantikus világháló a BME-n

Tudásalapú információ integráció

SZEMANTIKUS WEB. Integrációs és ellenőrzési technikák VIMIAC04, tavasz

Szemantikus Web Semantic Web A szemantikus web alkalmas megközelítés, illetve megfelel nyelvekkel, eszközökkel támogatja az intelligens információs

Ungváry Rudolf: Tezauruszok mint kisvilágok. Kapcsoltság a fogalmak között

TSIMMIS egy lekérdezés centrikus megközelítés. TSIMMIS célok, technikák, megoldások TSIMMIS korlátai További lehetségek

KERESÉS A NETEN DR. KÓNYA LÁSZLÓ: KERESÉS A NETEN KERESÉS MÓDSZERE, KERESŐPROGRAMOK

Fülöp Csaba, Kovács László, Micsik András

Adatbázisok MSc. 12. téma. Ontológia és SPARQL

Internet és világháló

KÖVETKEZŐ GENERÁCIÓS NAGYVÁLLALATI TARTALOMKEZELŐ MEGOLDÁSOK Stratis Kft. / Autonomy üzleti reggeli / Mezei Ferenc üzletág-igazgató

A szintaktikai keresés és a szemantikai keresés összevetése

Név: Neptun kód: április

Önálló labor feladatkiírásaim tavasz

Az információs portáloktól a tudásportálokig

Szemantikus technológiák területei. Rácz Gábor,

Korszerű oktatási környezet kialakítása az eenvplus projektben. Márkus Béla

Webes keres rendszerek. Webtechnológiák. Webes keres rendszerek. Webes keres rendszerek. Répási Tibor egyetemi tanársegéd

web2-es és web3-as szolgáltatások

SZEMANTIKUS WEB. Méréstechnika és Információs Rendszerek Tanszék

Bánki Zsolt István Csáki Zoltán Petőfi Irodalmi Múzeum Könyvtár és Informatika. Networkshop 2014 Pécs

ekörnyezetvédelmi szolgáltatások az INSPIRE keretében Márkus Béla Giorgio Saio

Pozícióinformáció. Sikeres helyfüggő szolgáltatások mobilra

Hozzávalók keresése és csatolása

BEVEZETÉS AZ INTERNET ÉS A WORLD WIDE WEB VILÁGÁBA. Kvaszingerné Prantner Csilla, EKF

A webanalitika változó világa 4 felvonásban

Ez a weboldal elég gyorsan betöltődik. A weboldal mérete (kilobyte) megfelelő. A betöltődő adatok száma elfogadható. Keresőbarát a weblap URL címe.

ADATTÁRHÁZ HATÉKONYSÁGNÖVELÉS, REDUNDANCIA CSÖKKENTÉS Frunza Zsolt ÜZLETI INTELLIGENCIA A JÖVŐ, AHOGY MI LÁTJUK

Steps Towards an Ontology Based Learning Environment. Anita Pintér Corvinno Technologia Transzfer Kft

TANANYAGTÁRHÁZAK SZEREPE AZ ELEARNINGBEN. Vágvölgyi Csaba - Papp Gyula. Kölcsey Ferenc Református Tanítóképző Főiskola Debrecen

Hely- és kontextusfüggő alkalmazások fejlesztését támogató keretrendszer mobil környezetben

BARANGOLÁS AZ E-KÖNYVEK BIRODALMÁBAN Milyen legyen az elektonikus könyv?

WWW Kliens-szerver Alapfogalmak Technológiák Terv. Web programozás 1 / 31

ADATROBBANÁS. A helyzet alulról január 21. Pajna Sándor. vezérigazgató

Önszerveződő adatbázisok

Alkalmazásokban. Dezsényi Csaba Ovitas Magyarország kft.

Térképek jelentése és elemzése

Név: Neptun kód: május 23. Komplex MI alkalmazások vizsga Rendelkezésre álló idő: 75 perc 1. Vizsgálja meg a következő RDF leírást:

AZ INTERNET ÉS KERESŐESZKÖZEI

SZABADKAI MŰSZAKI SZAKFŐISKOLA. E-mobil prezentáció dokumentációja SZABADKA, 2015.

Cvonline.hu Profil kereső

A NEMZETI KÖZNEVELÉSI PORTÁL ÉS A DIGITÁLIS TANANYAGELEMEK BEMUTATÁSA KERESÉS, LEJÁTSZÁS ÉS FELADATKÉSZÍTÉS AZ NKP-N

Az információs műveltség fejlesztése A könyvtárak szemléletváltása és feladatai a 21. században

Boros Andrea és Ignéczi Lilla Neumann-ház, Budapest. Networkshop 2004 konferencia Győr, április 4 7.

HELYI TANTERV / INFORMATIKA

OSINT. Avagy az internet egy hacker szemszögéből

URN használata hálózati dokumentumok azonosításában Országos Széchényi Könyvtár Könyvtár-informatikai M hely Budapest, június 12.

Networkshop Szemantikusan annotált tartalom létrehozása intelligens szövegfeldolgozó eszközök támogatásával. Héder Mihály MTA SZTAKI

Képek használata az oktatás hétköznapjaiban

BISNODE ADATBÁZIS SZOLGÁLTATÁSOK

Üzleti modellen alapuló webes tudásprezentáció

ESZTERHÁZY KÁROLY FŐISKOLA, EGER. Beszámoló könyvtári szakmai gyakorlatról

Adatbázis rendszerek. 4. előadás Redundancia, normalizálás

ÜZLETI I TELLIGE CIA - VIZUALIZÁCIÓ

Web harvesztelés. Automatikus módszerekkel

Online információkeresés. Dr. Nyéki Lajos 2016

IT biztonsági szintek és biztonsági kategorizálási minta

Zimbra levelező rendszer

6. Óravázlat. frontális, irányított beszélgetés. projektor, vagy interaktív tábla az ismétléshez,

R ++ -tree: an efficient spatial access method for highly redundant point data - Martin Šumák, Peter Gurský

A szavak hálójában: szabadszavas mélyhálókereső

Debreceni Egyetem Informatikai Kar

A Mazsola KORPUSZLEKÉRDEZŐ

OOP. Alapelvek Elek Tibor

Dinamikus geometriai programok

Bevezetés s a szemantikus technológi

Informatika 10. évf.

Fogalomtár bevezetése a Magyar Telekomnál

Gépi tanulás a gyakorlatban. Bevezetés

Adatbányászat és Perszonalizáció architektúra

Az Europeana felé tartó rögös úton

Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése

Három az egyben. Közös keresõ az elektronikus könyvtárban

A BLOCKCHAIN TECHNOLÓGIA A BIZTOSÍTÁSBAN MABISZ KONFERENCIA Dr. Kocsis Gergely Ügyvezető RowanHill Global Kft.

Egységes szolgáltatás kialakítása heterogén forrásokból - a Digitális Irodalmi Akadémia adatforrásainak integrálása portál környezetbe

Elosztott könyvtári rendszerek megvalósítása a Z39.50 és az OAI protokoll használatával

Adatbázis rendszerek. dr. Siki Zoltán

MMK-Informatikai projekt ellenőr képzés 4

Fejlett kereső és lekérdező eszközök egy elektronikus szakfolyóirathoz (IBVS)

Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Tematikus portálok szolgáltatása a Miskolci Egyetem közgyűjteményeiben (könyvtár, levéltár, múzeum)

Hozzáférés és újrahasznosítás

7. Óravázlat. frontális, irányított beszélgetés. projektor, vagy interaktív tábla az ismétléshez,

Beszámoló a 13. ECDL (European Conference on Digital Libraries) konferenciáról

Keresőmarketing ONLINE MARKETING III. ELŐADÁS KOVÁCS ISTVÁN. BME Menedzsment és Vállalatgazdaságtan Tanszék

Tartalom. Google szolgáltatásai. Googol Google. Története. Hogyan működik? Titka

A MISKOLCI EGYETEM HALLGATÓI TUDÁSTÁRA A KEZDETEKTŐL NAPJAINKIG. Sztermen Orsolya Lili, dr.vitéz Gáborné, Veréb Norbert

Motiváció Eszközök és eljárások Eredmények Távlat. Sass Bálint

Excel III. Haladó ismeretek

Tartalom. Előszó feladat: Fordítás a megszokott eszközökkel A számítógép hatékony használatáról... 18

Google AdWords és AdSense A Google hirdetési rendszere

Multimédiás adatbázisok

Excel IV. Haladó ismeretek. További fontos függvények Függvényhasználat ellenőrzése

Változások, tendenciák a bibliográfiai szolgáltatásban

Átírás:

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 0. A szemantikus Web

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 1. A hagyományos Web jellemzői Exponenciális sebességű gyarapodás: napi 3 milliárd tartalom megosztása, benne 250 millió kép, 200 millió tweet a Twitteren, stb. The Big Data: Hatalmas tárolt adatmennyiség: 1 milliárd kép, 23 Mrd Google-indexált weblap Különleges indexelő technikák a gyors kereshetőséghez

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 2. Hagyományos keresés a Weben Keresés speciális indexeléssel: A Google kb. 100 tényezőt elemez a weboldalon a PageRank számításakor, hogy megállapítsa, az oldal mennyire felel meg a keresési feltételeknek. Faktorok: az oldal népszerűsége, a keresett szó gyakorisága és pozíciója a weboldalon, egymáshoz való közelségük, a kereső személy profiljának aktuális jellemzői, stb.

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 3. Hagyományos keresés a Weben A Google szabadalmaztatott keresőtechnikát alkalmaz:

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 4. Hagyományos keresés a Weben A gond: A keresés jóformán csak szintaktikai elemeket tartalmaz. A jelentés szintjei: - szintaktikai - szemantikai - pragmatikus - intencionális Irma: Frédi ugyanúgy dohányzott, mint Te! Béni: Miért, mi van vele? Irma: Tüdőrák. Feldobta a bocskorát.

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 5. Hagyományos keresés a Weben Feldobta a bocskorát jelentése a különféle szinteken: - Szintaktikai: Múlt idejű állítmány és tárgy. - Szemantikai: Felhajította a lábbelijét. - Pragmatikai: Meghalt - Intencionális: Ne dohányozz, mert Te is úgy jársz! A hagyományos webkeresők (Google, Bing, Yahoo) gyakorlatilag csak szintaktikai szinten keresnek. Nem értik a kérdést, nem látnak a sorok mögé. Csak a szavak egyezését nézik. akar = akár

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 6. Hagyományos keresés a Weben A számítógép még nem érti, mit kérdezünk tőle Forrás: Szemantikus web, folkszonómia, taxonómia http://tarsadalominformatika.elte.hu/tananyagok/trendkutatas/lecke4_lap1.html

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 7. Hagyományos keresés a Weben A nemértés oka: A html dokumentumleíró nyelv, nem tárolja az információstruktúrát. Ahhoz, hogy a gép értse a kérdést, a tartalmakhoz járulékos adatokat, az adatokra vonatkozó metaadatokat kell csatolni. Metaadatok: az adat kategóriája, típusa, kapcsolódásai, forrása, stb. A metaadatok megteremtik az adatok kapcsolatbahozásának, besorolásának, szinonímája megtalálásának, stb. lehetőségét. A kereső mélyebb elemzéseket végezhet.

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 8. A komolyabb kérdések megválaszolása igényli a Weben tárolt adatok kombinálását: - az információösszetevők több oldalon elosztva találhatók meg - az információösszetevők eltérő adatbázisokban tárolódnak, stb. Pl. Ki a barátnője a G1BG3 legjobb fiú tanulójának? - barátnő a fotón - legjobb tanuló a Neptun nyilvántartásban. Az embereknek nem gond ilyen kérdések megválaszolása, mert - könnyen kezelik a hasonló jelentésű szavakat - könnyen értelmezik a képeket - boldogulnak hiányos, vagy sérült információkkal is.

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 9. Valamilyen más adatszervezésre van szükség a Weben: - Szemantikus Web-re! Mi a Szemantikus Web? Tim Berners Lee: olyan adattárolási forma, amely a nyers adatokat kiegészítő metaadatok révén a ráépülő alkalmazásokkal lehetővé teszi a tárolt adatok integrálását, az adatok által reprezentált jelentés megragadását és felhasználását. Meg kell jegyezni, hogy a mesterséges metaadat hozzáadással szemben vannak szkeptikus vélemények is, melyet a tárgy előadója is oszt, hiszen a jelentés benne van a szövegkörnyezetben, tágabb értelemben az adathoz kapcsolódó összes jellemző halmazában.

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 10. Az ördög a részletekben lakozik. - egy közös modellt kell a gépek számára nyújtani az adatok és kapcsolataik leírására, lekérdezéséhez, stb. - a fogalmak osztályozása nagyon komplex feladattá válhat bizonyos tudásterületeken, és ezek azok a szituációk, amikor az ún. ontológiák, tezauruszok, stb. elengedhetetlenek.

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 11. A szemantikus web létrehozása és keresés rajta 1. Képezzük le a változatos adatokat egy egységes absztrakt adatreprezentációval 2. Hozzuk kapcsolatba a kialakult reprezentációkat 3. Kezdjünk el lekérdezéseket az ily módon kialakult adatszerkezeteken! A metaadatok támogatják és teszik lehetővé ezt az eljárást.

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 12. Egyszerű példa könyvesbolt adatbázissal Adatkészlet A :

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 13. Az egységes szemléltetéshez használjunk RDS (Resource Description Framework) keretrendszert! Az RDS egy triplet, melynek elemei: alany, állítmány, tárgy. Az állítmányt helyettesítheti tulajdonság. Pl: Pista szereti Gizit Pista jegye jeles A tripleteket az alanytól a tárgy felé mutató, az állítmánnyal felcímkézett nyíllal szokták ábrázolni. Pista szereti Gizit

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 14. A könyvesbolti példa leképezése:

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 15. A gráf csomópontjai a weben fellelhető erőforrások: URI-k, Uniform Resource Identifier-ek, melyek lehetnek URL-ek, vagy szövegek. Egy gráf leképezheti csak egy részletét is az adathalmaznak. Adatkészlet F :

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 16. Reprezentáljuk a második adatkészletet:

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 17. Egyesítsük a lekérdezéshez az adatokat:

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 18. Egyesítsük a lekérdezéshez az adatokat.. Azonos Azonos erőforrás

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 19. Egyesített adatokkal:

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 20. Az A adatkészlet tulajdonosa most kérdezhet ilyet: Add meg a címét (Title) az Eredetinek (Original) Ez az információ nem található meg az A adatkészletben de megtalálható a hozzákötött F ben!

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 21. De több is kinyerhető: érezzük, hogy az a:author és az f:auteur ugyanaz. De egy automatikus egyesítés nem tudja ezt! Adjunk némi többlet információt az egyesített adatokhoz: - a:author ugyanaz mint f:auteur mindkettő egy Person -t azonosít - egy fogalmat, melyet a közösség már definiált: - egy Person egyértelműen azonosított a nevével és, mondjuk a homepage-ével - ez bizonyos erőforrások számára kategóriaként használható

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 22. Aknázzuk ki a többlet tudást!.

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 23. Végezzünk gazdagabb lekérdezést! - Az F most kérdezheti: donnes-moi la page d accueil de l auditeur de l originale - nos give me the homepage of the original s auteur Az információ nem található sem az A, sem az F adatkészletben - de az A és F egyesítése révén elérhetővé vált - hozzáadva három egyszerű állítást mint egy ragasztót.

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 24. Eltérő adatkészletekkel történő kombinálás A Person használatával pl. az adatkészletet más külső adatkészletekkel kombinálhatjuk. Például, a Wikipédiában található adat kinyerhető dedikált szoftvereszközökkel - pl. a dbpedia project már képes kinyerni az infobox információt a Wikipédiából

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 25. A Wikipédia adattal egyesítve.

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 26. A Wikipédia adattal egyesítve...

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 27. A Wikipédia adattal egyesítve...

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 28. Meglepő? Annak néz ki, de nem kellene meglepőnek lennie. Minden nap ez történt az automata erőforrások révén a Web használóknál. Az eltérés: egy kis többlet, hogy a gépek szintén meg tudják ezt csinálni.

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 29. Mit is csináltunk? Különféle adatkészleteket kombináltunk, amelyek - megtalálhatók valahol a weben, - eltérő formátumúak (mysql, Excel sheet, XHTML, stb.) - különböző neveket használnak a kapcsolatokra. Kombinálhattuk az adatokat, mert egyes URI-k azonosak voltak (jelen esetben az ISBN-ek) Hozzá tudtunk adni egy kis extra információt (ragasztóként), valószínűleg általános technikákat alkalmazva, melyet a közösség hozott létre Ezek eredményeként új kapcsolatokat találtunk és hívtunk elő.

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 30. És ez még többre is képes lehet Az egyesített adatkészletekhez többlet tudást adhatunk - pl. a teljes osztályozását különféle könyvtári adatoknak Ez az a terület, ahol az ontológiák, extra szabályok stb. szerephez jutnak És még erőteljesebb lekérdezések is elvégezhetők ezeknek köszönhetően.