Információ integráció (GAV példa) 6. Előadás. Méréstechnika és Információs Rendszerek Tanszék

Hasonló dokumentumok
Információ integráció (Datalog, Veder algoritmus, GAV példa) 6. Előadás

TSIMMIS egy lekérdezés centrikus megközelítés. TSIMMIS célok, technikák, megoldások TSIMMIS korlátai További lehetségek

Mediátor. Forrás leírás. Forrás fúzionálás/ Lekérdezés tervezés. Monitor. Végrehajtás. Válasz. Szolgáltatások. Web lapok. Strukturált adatok

Mediátor. Forrás leírás. Forrás fúzionálás/ Lekérdezés tervezés. Monitor. Végrehajtás. Válasz. Szolgáltatások. Web lapok. Strukturált adatok

Micskei Zoltán Strausz György. Méréstechnika és Információs Rendszerek Tanszék.

Tudásalapú információ integráció

Információ integráció (Szemantikus Web megközelítés a másik irányból) 5. Előadás

SZEMANTIKUS WEB. Integrációs és ellenőrzési technikák VIMIAC04, tavasz

Információ integráció Szemantikus Web megközelítés Alkalmazások

Név: Neptun kód: május 23. Komplex MI alkalmazások vizsga Rendelkezésre álló idő: 75 perc 1. Vizsgálja meg a következő RDF leírást:

Név: Neptun kód: április

1. Melyik szabvány foglalkozik dokumentumok tulajdonságainak megfogalmazásával? a. RDFS b. FOAF c. Dublin Core d. DBPedia

Adatbázis, adatbázis-kezelő

ADATBÁZIS-KEZELÉS - BEVEZETŐ - Tarcsi Ádám, ade@inf.elte.hu

Adatbázisok-1 előadás Előadó: dr. Hajas Csilla

Szemantikus Web Semantic Web A szemantikus web alkalmas megközelítés, illetve megfelel nyelvekkel, eszközökkel támogatja az intelligens információs

Adatbázis kezelés Delphiben. SQL lekérdezések

Szemantikus Web Semantic Web A szemantikus web alkalmas megközelítés, illetve megfelel nyelvekkel, eszközökkel támogatja az intelligens információs

Adattárház kialakítása a Szövetkezet Integrációban, UML eszközökkel. Németh Rajmund Vezető BI Szakértő március 28.

SZEMANTIKUS WEB. Méréstechnika és Információs Rendszerek Tanszék

Az adatbázisrendszerek világa

ÜZLETI I TELLIGE CIA - VIZUALIZÁCIÓ

Modell alapú tesztelés mobil környezetben

Programozás. Adatbázis-kezelés (alapok) Fodor Attila

Adatbázisok MSc. 12. téma. Ontológia és SPARQL

Adatbázis rendszerek 7. előadás State of the art

XML alapú adatbázis-kezelés. (Katona Endre diái alapján)

Név: Neptun kód: május 26., VIMIAC04 Integrációs és ellenőrzési technikák vizsga Rendelkezésre álló idő: 90 perc

modell, amiben csak bináris sok-egy kapcsolatok (link, memberowner,

Ficsor Lajos Általános Informatikai Tanszék Miskolci Egyetem

A szemantikus világháló oktatása

Ismeretalapú modellezés XI. Leíró logikák

S01-8 Komponens alapú szoftverfejlesztés 2

Adatbázis-kezelő rendszerek. dr. Siki Zoltán

Petőfi Irodalmi Múzeum. megújuló rendszere technológiaváltás

11. előadás Objektumorientált adatbázisok haladóbb ismeretek

5. Gyakorlat. 5.1 Hálós adatbázis modell műveleti része. NDQL, hálós lekérdező nyelv:

ABR ( Adatbázisrendszerek) 2. Előadás : Műveletek a relációs modellben

Adatbázis rendszerek. dr. Siki Zoltán

Microsoft SQL Server telepítése

Informatikai alapismeretek Földtudományi BSC számára

Adatbázis-lekérdezés. Az SQL nyelv. Makány György

Magas szintű adatmodellek Egyed/kapcsolat modell I.

Részletes szoftver tervek ellenőrzése

BGF. 4. Mi tartozik az adatmodellek szerkezeti elemei

Adatbányászat és Perszonalizáció architektúra

Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése

Célkitűzések Az Oracle10 g felépítésének, használatának alapszíntű megismerése

Enterprise JavaBeans 1.4 platform (EJB 2.0)

VII. Keretalapú ismeretábrázolás

Nyilvántartási Rendszer

Tartalomjegyzék. Tartalomjegyzék 1. Az SQL nyelv 1 Az SQL DDL alapjai 2

Testreszabott alkalmazások fejlesztése Notes és Quickr környezetben

Alkalmazásokban. Dezsényi Csaba Ovitas Magyarország kft.

Használati alapú és modell alapú tesztelés kombinálása szolgáltatásorientált architektúrák teszteléséhez az ipari gyakorlatban

Modellező eszközök, kódgenerálás

Multimédiás adatbázisok

RELÁCIÓS LEKÉRDEZÉSEK OPTIMALIZÁLÁSA. Marton József november BME TMIT

MVC. Model View Controller

CMDB architektúra megjelenítése SAMU-val Rugalmas megoldás. ITSMF Bekk Nándor Magyar Telekom / IT szolgáltatás menedzsment központ

Oracle adatkezelési megoldások helye az EA világában. Előadó: Tar Zoltán

KOMPUTER-ALGEBRA RENDSZEREK VERIFIKÁCIÓJA

Adatbázisok. 8. gyakorlat. SQL: CREATE TABLE, aktualizálás (INSERT, UPDATE, DELETE), SELECT október október 26. Adatbázisok 1 / 17

Modellkiválasztás és struktúrák tanulása

Szolgáltatásintegráció (VIMIM234) tárgy bevezető

Miskolci Egyetem Gépészmérnöki és Informatikai Kar Informatikai Intézet Alkalmazott Informatikai Intézeti Tanszék

A relációs adatmodell

Programozás. Bevezetés. Fodor Attila. Pannon Egyetem Műszaki Informatikai Kar Villamosmérnöki és Információs Rendszerek Tanszék

Adatbázismodellek. 1. ábra Hierarchikus modell

Bevezetés: az SQL-be

A relációs algebra egy speciális algebra, amely néhány egyszerű, de hathatós. operandusok. Egy reláció megadható a nevével vagy közvetlenül, sorainak

Tartalom DCOM. Történeti áttekintés. Történeti áttekintés. Történeti áttekintés. Történeti áttekintés

LOGISZTIKAI ADATBÁZIS RENDSZEREK JOIN, AGGREGÁCIÓ

SZEMANTIKUS WEB. Méréstechnika és Információs Rendszerek Tanszék

Adatbázis-kezelés alapok Adatbázisok című tárgyhoz, ismétlés kapcsán

Enterprise JavaBeans. Ficsor Lajos Általános Informatikai Tanszék Miskolci Egyetem. Az Enterprise JavaBeans

Rostás Sándor szds. MH GEOSZ Műszaki és információs osztály térképész főtiszt (ov. h.)

Adatmodellezés. 1. Fogalmi modell

S0-02 Típusmodellek (Programozás elmélet)

Gráfok mindenhol. x $ SZENDI-VARGA JÁNOS IOT SOCIAL NETWORKS FRAUD DETECTION MASTER DATA MANAGEMENT RECOMMENDATION ENGINES. Internet of Things

Önálló labor feladatkiírásaim tavasz

A szemantikus Web. Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 0.

Szemantikus technológiák területei. Rácz Gábor,

Szerializáció. Tóth Zsolt. Miskolci Egyetem. Tóth Zsolt (Miskolci Egyetem) Szerializáció / 22

Modellinformációk szabványos cseréje. Papp Ágnes, Debreceni Egyetem EFK

Sikerünk kulcsa: az információ De honnan lesz adatunk? Palaczk Péter

A Java EE 5 plattform

Osztott Objektumarchitektúrák

Szövegbányászati rendszer fejlesztése a Magyar Elektronikus Könyvtár számára

INFORMATIKA ÁGAZATI ALKALMAZÁSAI. Az Agrármérnöki MSc szak tananyagfejlesztése TÁMOP /1/A

Csima Judit szeptember 6.

Interaktív, grafikus környezet. Magasszintû alkalmazási nyelv (KAL) Integrált grafikus interface könyvtár. Intelligens kapcsolat más szoftverekkel

Aspektus-orientált nyelvek XML reprezentációja. Kincses Róbert Debreceni Egyetem, Informatikai Intézet

NETinv. Új generációs informatikai és kommunikációs megoldások

Adatok szűrése, rendezése

Lekérdezések az SQL SELECT utasítással

Szemantikus világháló a BME-n

Google App Engine az Oktatásban 1.0. ügyvezető MattaKis Consulting

RADPLAN. A Mentum Planet, Mentum Ellipse az InfoVista bejegyzett védjegye, minden jog fenntartva!

Átírás:

Információ integráció (GAV példa) 6. Előadás Méréstechnika és Információs Rendszerek Tanszék https://www.mit.bme.hu/oktatas/targyak/vimiac04 1

Szolgáltatáso Felhasználói lekérdezések megfogalmazása a mediált sémán. Adatok tárolva lokális sémában. Forrás leírás Ontológiák, Forrás és szolgáltatás leírások Teszt lekérdezések Weblapok Strukturált adatok A tárolt információ (tartalom) ismerete alapján megfogalmazható a leképezés a sémák között. A mediátor alkalmazza a leképezést a felhasználói kérdés lefordítására a forrás lekérdezésekre. Forrás fúzionálás Lekérdezés tervezés Számos cél együttese, Szolgáltatások kompozíciója, Forrás minőség, átfedés Szenzorok (soros adatok) Információ menedzser Válasz Végrehajtás Kezel: forrás és hálózati kapcsolatokat, futtatási bizonytalanságokat, újratervezést Monitor 2

Source Trust Ontologies; Source/Service Descriptions Probing Queries Services Webpages Structured data Virtuális integrációs séma Adatok a forrásokban maradnak Query Preference/Utility Model Answers Source Fusion/ Query Planning Needs to handle: Multiple objectives, Service composition, Source quality & overlap Executor Needs to handle Source/network Interruptions, Runtime uncertainity, replanning Replanning Requests Source Calls Updating Statistics Monitor Sensors (streaming Data) Lekérdezés végrehajtásakor: Releváns források meghatározása Lekérdezés szétválasztása forrásokra vonatkozó lekérdezésekre. Válaszok begyűjtése a forrásokból, és megfelelő kombinálása a válasz előállításához. Friss adatok A megoldás skálázható Mediátor: wrapper Adat forrás Felhasználói lekérdezés Fordító motor Optimalizáló Végrehajtó gép wrapper Adat forrás Mediált (globális) séma Adatforrás katalógus wrapper Adat forrás Garlic [IBM], Hermes[UMD];Tsimmis, InfoMaster[Stanford]; DISCO[INRIA]; Information Manifold [AT&T]; SIMS/Ariadne[USC];Emerac/Havasu[ASU] 3

Forrás mediátor relációs sémával szembeni elvárások Kifejező erő: hasonló adattartalommal rendelkező források megkülönböztetése, irreleváns források felismerése. Egyszerű bővíthetőség: tegyük könnyűvé források hozzáadását. Fordítás/átalakítás: felhasználói lekérdezés lefordítása forrásokon értelmezett lekérdezésekre hatékonyan és eredményesen. Vesztességmentesség: minden lehetséges adatelérés biztosítása Mediátor: wrapper Adat forrás Felhasználói lekérdezés Fordító motor Optimalizáló Végrehajtó gép wrapper Adat forrás Mediált (globális) séma Adatforrás katalógus wrapper Adat forrás Lekérdezés átalakítás Adott: Egy Q lekérdezés a mediátor sémára vonatkozóan Adat források leírása Létrehozandó: Egy Q lekérdezés az adat forrásokra vonatkozóan, amely: Q csakhelyes válaszokat ad a Q lekérdezéshez és Q minden lehetséges választ megtalál Q-hoz az elérhető forrásokból. 4

Fordítási/átfogalmazási probléma Adott: Egy Q lekérdezés a mediátor sémára vonatkozóan Adat források leírása Létrehozandó: Egy Q lekérdezés az adat forrásokra vonatkozóan, amely: Q csak helyes válaszokat ad aq lekérdezéshez és Q minden lehetséges választ megtalál Q hoz az elérhető forrásokból. Mediátor: Felhasználói lekérdezés Fordító motor Optimalizáló Végrehajtó gép wrapper wrapper Adat Adat forrás forrás Mediált (globális) séma Adatforrás katalógus wrapper Adat forrás 5

Forrás és felhasználói sémák reláció leírásának megközelítései Globális mediált sémák(global as view, GAV): a mediált séma kifejezése a forrásokra vonatkozó nézetek relációjaként Lokális mediált sémák (Local as view, LAV): forrás relációk kifejezése a mediált sémákon értelmezett relációkkal. Módszerek kombinációja? 6

GAV vs. LAV Nem moduláris Források hozzáadása módosítja a meglévő mediált séma definícióját Nehézkes lehet veszteségmentes mediátort készíteni. Lekérdezés átalakítás egyszerű Nézetek kibontását jelenti (polinomiális) Hierarchikus mediátor sémák létrehozása lehetséges Moduláris új forrás hozzáadása egyszerű Igen rugalmas a lekérdező nyelv közvetlenül alkalmazható a források leírására Lekérdezés átalakítás bonyolult Válaszokat a nézeteken keresztül kell előállítani (nem mindig megoldható) Hatékony, ha Kis számú, ritkán változó adatforrás van Feladat teljesen ismert a mediátor tervezésekor (pl. vállalati adatintegráció) Garlic, TSIMMIS, HERMES Hatékony, ha Sok, kevéssé korrelált forrás Források dinamikus hozzáadása és törlése Information Manifold, InfoMaster, Emerac, Havasu 7

Átalakítási algoritmusok Q(.) :- V1() & V2() Veder algoritmus S11 S12 S00 V1 S21 S22 S00 V2 Veder algoritmus Vedrek kombinációjából előállított terv Utána tartalmazási ellenőrzés S11() :- V1() S12 :- V1() S21() :- V2() S22 :- V2() S00() :- V1(), V2() Inverz szabályok Q(.) :- V1() & V2() V1() :- S11() V1() :- S12() V1() :- S00() V2() :- S21() V2() :- S22() V2() :- S00() Inverz szabályok Rész lekérdezések tervezés [Levy] P 1 contains P 2 if P 2 = P 1 [Duschka] 8

Példa integrátor rendszerekre Tsimmis Stanford IBM Manager of Multiple Information Sources Global as View (Gav) Mediátor nézetek a forrás nézetek feletti relációkként definiálva Megközelítés: Rugalmas adatmodell Általános lekérdező nyelv Egyedi eszközök

TSIMMIS Komponensek Adatmodell: OEM (Object Exchange Model) Lekérdező nyelv: LOREL (Lightweight Object REpository Language) Mediátor leírás: MSL (Mediator Specification Language) Wrapper leírás: WSL (Wrapper Specification Language)

TSIMMIS OEM Objektumok alkalmazása: Object Exchange Model A TSIMMIS adatmodellje önleíró (az objektum leíró információkat címkékben (label) helyezi el) Rugalmas Első rendű logikai megközelítés

TSIMMIS Objektum modell Objektum azonosító halmaz vagy string OID: label type value Értelmezhető (felhasználó által) halmaz vagy string

TSIMMIS OEM library set book set author string Aho title string Compilers

TSIMMIS OEM Elsőrendű predikátum logikai átírás lehetséges: 123 author string Aho author( T, Aho ) Objektum azonosító alapján elérhetőek (lekérdezhetőek) az elemek, akár az author vagy az Aho érték.

TSIMMIS LOREL Lekérdező nyelv: Lightweight Object REpository Language Egy OQL lekérdező nyelv OEM adatmodellhez A végfelhasználó elérése a TSIMMIS modellhez és az adatokhoz. Példa: select library.book.title from library where library.book.author = Aho

TSIMMIS LOREL Részleges illeszkedést megengedő szemantika: select R.A from R, S, T where R.A = S.A or R.A = T.A Csak akkor sikertelen (és nem tér vissza értékkel), ha T és S is üres.

TSIMMIS MSL (Mediator Specification Language) Mediátorok deklaratív leírása Objektum orientált, logikai leírás OEM adatmodellre épül

TSIMMIS MSL Lekérdezés library set Mediátor book set Mediátor author string Aho Wrapper Wrapper title string Compilers Adatforrás Adatforrás <booktitle X> :- <library { <book { <title X> <author Aho > } > } > @s1

TSIMMIS Wrapper ek Lekérdezés Wrapper-ek szerepe hasonló, mint az adatbázis meghajtóké A Wrapper-ek logikai leírása MSL nyelven történik Wrapper leírások formája: MSL template // action // Wrapper Mediátor Példa <books X> :- <library { X:<book {<title X> <author $AU>}> }>@s1 // sprintf(lookup-query, find author %s, $AU) // Mediátor Wrapper Adatforrás Adatforrás

Mediátor rendszer specifikálása Kliens Mediátor Mediátor leírás interpreter Mediátor leírás Wrapper Wrapper Wrapper generátor Forrás Forrás Wrapper specifikáció 7

Kihívás: Strukturálatlan források elemzése Félig struktúrált irreguláris mélyen beágyazott kereszthivatkozások Hiányos séma információ autonóm dinamikus Példák HTML lapok SGML dokumentumok Gén adatbázisok kémiai elemek könyvtári információk 21

Adatreprezentáció TSIMMIS Félig-strukturált adat reprezentáció Mediátor generálás Wrapper generálás Képességeket figyelembe vevő átírás 22

Félig strukturált információk reprezentálása OEM modellel Szemantikus objektum azonosító label <http://www/~doe, faculty, {&f1,&l1,&r1}> <&f1, first_name, John > <&l1, last_name, Doe > <&r1, rank, professor > Értékadás Atomi érték Strukturális objektum azonosító 23

OEM Gráf reprezentáció <http://www/~doe, faculty, {&f1,&l1,&r1}> <&f1, first_name, John > <&l1, last_name, Doe > <&r1, rank, professor > http://www/~doe faculty first_name John last_name Doe rank professor 24

OEM struktúra tetszőleges gráf reprezentációt megenged http://www/~smith faculty name Mary Smith project Air DB paper author author name Mary Smith title Thin Air DB http://www/~doe faculty first_name John last_name Doe rank professor 25

Áttekintés Félig-strukturált adat reprezentáció Mediátor generálás Mediátor specifikációs példák Nyelv kifejezőerő Megvalósítás és teljesítmény Wrapper generálás Képességeket figyelembe vevő átírás 26

Információ egyesítés faculty rank professor birthday April 1 papers... faculty rank professor papers... s1 person birthday April 1 s2 27

Mediátor specifikáció példa faculty rank professor birthday April 1 papers... <N faculty {<L V>}> :- <faculty {<name N> <L V>}>@s1 <N faculty {<L V>}> :- <person {<name N> <L V>}>@s2 faculty rank professor papers... s1 person birthday April 1 s2 28

Mediátor specifikáció példa: Szabályok törzsének elemei faculty rank professor birthday April 1 papers... <N faculty {<L V>}> :- <faculty {<name N> <L V>}>@s1 <N faculty {<L V>}> :- <person {<name N> <L V>}>@s2 faculty rank professor papers... s1 person birthday April 1 s2 29

Mediátor specifikáció példa: Szabályok fejének értelmezése John Doe faculty rank professor birthday April 1 papers... <N faculty {<L V>}> :- <faculty {<name N> <L V>}>@s1 <N faculty {<L V>}> :- <person {<name N> <L V>}>@s2 faculty rank professor papers... s1 person birthday April 1 s2 30

Szemantikusan azonosított objektum hozzáadása John Doe faculty rank professor birthday April 1 papers... <N faculty {<L V>}> :- <faculty {<name N> <L V>}>@s1 <N faculty {<L V>}> :- <person {<name N> <L V>}>@s2 faculty rank professor papers... s1 person birthday April 1 s2 31

Irreguláris és hiányzó információ John Doe Mary Smith faculty name Mary Smith project Air DB <N faculty {<L V>}> :- <faculty {<name N> <L V>}>@s1 s1 faculty rank professor birthday April 1 papers faculty s2 rank professor person papers faculty birthday April 1 name Mary Smith project Air DB 21

A második szabály további elemet rendel a nézet objektumaihoz John Doe faculty rank professor birthday April 1 papers... <N faculty {<L V>}> :- <faculty {<name N> <L V>}>@s1 <N faculty {<L V>}> :- <person {<name N> <L V>}>@s2 faculty rank professor papers... s1 person birthday April 1 s2 22

A nyelv kifejezőereje MSL nyelvvel megoldott problémák Irregularitások Hiányos struktúra információk Kereszthivatkozások kezelése Inkonzisztens és redundáns adat Tetszőleges illeszkedési kritérium 23

Mediátor leírás interpreter arhitektúra Eredmény Lekérdezés Lekérdezés átírás Logikai adatillesztés Költség alapú optimalizácó Mediátor leírás Lekérdezési terv Adatfeldolgozó gép Eredmények Lekérdezések a wrapperek felé 24

Lekérdezés átírás <N faculty {<salary S>}> :- :- <faculty {<name N> <salary S>}>@s1 <N faculty {<rankr>}> :- <person {<name N> <rank R>}>@s2 <well-paid {<name N> <salary X>}> :- <N faculty {<salary X> <rank assistant>}> AND X>65000 36

Lekérdezés átírás: feltételek átadása a források fele <N faculty {<salary S>}> :- :- <faculty {<name N> <salary S>}>@s1 <N faculty {<rankr>}> :- <person {<name N> <rank R>}>@s2 <well-paid {<name N> <salary X>}> :- <N faculty {<salary X> <rank assistant>}> AND X>65000 logical datamerge program <well-paid {<name N> <salary X>}> :- (<faculty {<name N> <salary X>}> AND X>65000)@s1 AND <person {<name N> <rank assistant>}>@s2 37

Lekötések átadása & Lokális join tervek s1 <salary X> :- <faculty {<name $N> <salary X>}> AND X>65000 s2 Lekötések átadása <name N>:-<person {<rank assistant>}> Lokális Join <a {<s X> <n N>}>:- <faculty {<name N> <salary X>}> AND X>65000 s1 N s2 <name N>:-<person {<rank assistant>}> 38

Lekérdezés dekomponálása ismeretlen eredet figyelembevételével <N faculty {<L V>}> :- <faculty {<name N> <L V>}>@s1 <N faculty {<L V>}> :- <person {<name N> <L V>}>@s2 <X faculty {<S Y>}> :- <X faculty {<birthday 1/20 > <S Y>}> 39

A terv figyelembe vesz minden lehetséges forrást a birthday értékére <N faculty {<L V>}> :- <faculty {<name N> <L V>}>@s1 <N faculty {<L V>}> :- <person {<name N> <L V>}>@s2 <X faculty {<S Y>}> :- <X faculty {<birthday 1/20 > <S Y>}> s1 s2 birthday name name birthday 40

Képesség alapú átírás architektura Lekérdezés Lekérdezés képességek leírása Komponens lekérdezés keresés Komponens (al)lekérdezések Terv összeállítás Tervek(részlegesen optimális) Terv finomítás Algebrailag optimális terv 48

TSIMMIS összefoglalás Infromáció integráció heterogén forrásokra Kihívások és megoldások Félig-struktúrát adatok & hiányzó séma információk Megfelelő lekérdezés definiáló nyelv és lekérdezés lefordítás tervezése Eltérő képességű források kezelése Lekérdezések speciális átalakítása Képesség alapú átírás 49