Információ integráció Szemantikus Web megközelítés Alkalmazások



Hasonló dokumentumok
Micskei Zoltán Strausz György. Méréstechnika és Információs Rendszerek Tanszék.

Mediátor. Forrás leírás. Forrás fúzionálás/ Lekérdezés tervezés. Monitor. Végrehajtás. Válasz. Szolgáltatások. Web lapok. Strukturált adatok

Mediátor. Forrás leírás. Forrás fúzionálás/ Lekérdezés tervezés. Monitor. Végrehajtás. Válasz. Szolgáltatások. Web lapok. Strukturált adatok

Információ integráció (GAV példa) 6. Előadás. Méréstechnika és Információs Rendszerek Tanszék

Információ integráció (Datalog, Veder algoritmus, GAV példa) 6. Előadás

Információ integráció (Szemantikus Web megközelítés a másik irányból) 5. Előadás

Tudásalapú információ integráció

SZEMANTIKUS WEB. Integrációs és ellenőrzési technikák VIMIAC04, tavasz

MOBIL CROWDSENSING ÉS BIG DATA TÁVKÖZLÉSI ÉS MÉDIAINFORMATIKAI TANSZÉK BUDAPESTI MŰSZAKI ÉS GAZDASÁGTUDOMÁNYI EGYETEM

Typotex Kiadó. Térinformatika. Detrekői Ákos jogutóda, Szabó György

3. HÉT: CRM RENDSZEREK A GYAKORLATBAN FUNKCIONALITÁSOK

Mi is az a metaadat? Gollnhofer Gábor - Meta Consulting Kft.

Project Management

Ahol az ERP véget ér hasznos kiegészítők

2014. október 14. Internet Hungary Adatrobbanás - Behálózva

INTELLIGENCIÁK A VEZETÉSBEN

2. HÉT: CRM RENDSZEREK A GYAKORLATBAN FUNKCIONALITÁSOK

Bank: minden tranzakciónál. Egyetemek: regisztráci. Emberi erőforr. források: alkalmazottak adatainak rögzr

Az informatika oktatás téveszméi

Egy SLA kialakításának gyakorlata fókuszban a nehézségek megoldása. Előadó: Oroszi Norbert. KÜRT Rt. Információ Menedzsment KÜRT Rt.

Egy El Classico tanulságai

evosoft Hungary Kft.

proability projekt Tananyagfejlesztés Toarniczky Andrea, PhD Primecz Henriett PhD Csillag Sára PhD

BMF NIK Mérnök informatikus mesterszak Alkalmazásmenedzsment szakirány

Pénzmosás és fellépés a terrorizmus ellen (változó szabályok) Dr. Király Júlia MNB Budapest, november 12.

FIFA EWS, CERN, NHS (UK) Érdekes Oracle Big Data és adattárház ügyféltörténetek Elemzések, csalás megelőzés, megtakarítások

Dr. Kulcsár Gyula. Virtuális vállalat félév. Projektütemezés. Virtuális vállalat félév 5. gyakorlat Dr.

Gazdálkodási modul. Gazdaságtudományi ismeretek II.

Párhuzamos programozás

INFORMÁCIÓS MEMORANDUM

Üzleti folyamatok rugalmasabb IT támogatása. Nick Gábor András szeptember 10.

Gépjármű finanszírozással kapcsolatos szabályozási stratégia elemei

Milyen segítséget tud nyújtani a döntéshozatalban a nem-hagyományos jelfeldolgozás?

Magas szintű programozási nyelvek 1. Előadás. Bevezetés. Espák Miklós. Juhász István jegyzete alapján

LOGISZTIKAI ADATBÁZIS RENDSZEREK SQL ALAPOK,

ITIL alapú szolgáltatás menedzsement megvalósítása a KELER Zrt-ben

Laponyi Attila T-Systems Magyarország. CRM mindenek felett

AZ ÖNÉRTÉKELÉS SZEREPE ÉS FOLYAMATA AZ INTÉZMÉNYFEJLESZTÉSBEN M&S Consulting Kft.

EPER E-KATA integráció

Számítógép hálózatok gyakorlat

Innováció és gazdaságfejlesztés

Az új Flex-Block lábazatrendszer

Átalakuló HR szervezet, változó Business Partneri szerepek

Az éves statisztikai összegezés STATISZTIKAI ÖSSZEGEZÉS AZ ÉVES KÖZBESZERZÉSEKRŐL A KLASSZIKUS AJÁNLATKÉRŐK VONATKOZÁSÁBAN

Néprajzi Múzeum. Új hely Új épület(ek) Új elképzelések. Museum

Programozás alapjai Bevezetés

RSM DTM Hungary Zrt. Cafeteria 2015: újratervezés? Milyen hatása lesz a cafeteriában bekövetkezett változásoknak a vállalati cafeteria rendszerekre

MULTIPONT PROGRAM. Hogyan építsünk fel egy teljes klub/loyalty rendszert?

#instagramads Az első tapasztalatok. Contact: Eva Drienyovszki Senior Search Specialist

Az Európai Unió regionális politikája III.

Közszolgálati egyéni teljesítményértékelés

Címzett: Markus Goddemeier Fax: +49 (0)

IBM BladeCenter a gyakorlatban

Az MSZ EN ISO 19011:2012 szabvány változásai. Támpontok az auditorok értékeléséhez Előadó: Turi Tibor, az MSZT/MCS 901 szakértője

I. Országgyűlés Nemzeti Választási Iroda

Linux Mint 8 telepítése

Gyakorlatok. VITMMA09 Okos város MSc mellékspecializáció

Struktúra Átalakítás és Fejlesztési Stratégia. Holló Imre

HÁLÓZATSEMLEGESSÉG - EGYSÉGES INTERNET SZOLGÁLTATÁS-LEÍRÓ TÁBLÁZAT

INFORMÁCIÓS MEMORANDUM

Fazekas Mihály Fővárosi Gyakorló Általános Iskola és Gimnázium

A TÁMOP KIEMELT PROJEKT KERETÉBEN KIALAKÍTOTT INFORMATIKAI RENDSZER

KÖZLEKEDÉSI ALAPISMERETEK (KÖZLEKEDÉS - ÜZEMVITEL, KÖZLEKEDÉS-TECHNIKA) KÖZLEKEDÉSI ALAPISMERETEK ÉRETTSÉGI VIZSGA II.

Tanúsítvány és hozzá tartozó kulcsok feltöltése Oberthur kártyára és Oberthur SIM termékre

Hőszivattyúk Makk Árpád Viessmann Akadémia. Viessmann Werke Hőszivattyúk. Chart 1

Marketing I. X. előadás. Beszerzési magatartás és ipari marketing. Dr. Bíró-Szigeti Szilvia egyetemi adjunktus BME-MVT

Boros Beáta projektmenedzser

Kissné dr. Akli Mária és Ferencz Zsolt

A SZERZŐDÉS TELJESÍTÉSÉRE VONATKOZÓ INFORMÁCIÓK

irányítószám: Ország: Magyarország

Az éves statisztikai összegezés STATISZTIKAI ÖSSZEGEZÉS AZ ÉVES KÖZBESZERZÉSEKRŐL A KLASSZIKUS AJÁNLATKÉRŐK VONATKOZÁSÁBAN

GOP PÁLYÁZATOK. Szabó Sándor András. pályázati és innovációs tanácsadó regisztrált pályázati tréner egyetemi oktató

MIT VÁR EL A PSZICHOLÓGUS A JÓ KRESZTŐL? ARANYOS JUDIT közlekedés szakpszichológus

Üzleti folyamatok újjászervezése. Fenyvesi István

A szerzõrõl... xi Bevezetés... xiii

2012. tavaszi félév Vésı Tamás

Autóipari beágyazott rendszerek. Fedélzeti elektromos rendszer

Vasúti információs rendszerek gyakorlat

A KÖZOP projekt rövid bemutatása

Egyre nagyobb profitot generálnak a mobiltelefonnal végzett vásárlások, és egyre többet hezitálunk vásárlás előtt

TERMÉK AJÁNLÁSA GO GUIDE KÉSZÜLJ FEL

7. Sulinet nyíltnap - Napirend

Miért válassza a tárhelyeinket?

Szervezeti formák bemutatása

Az épületautomatizálás szerepe az épületek energia teljesítményének növelésében

9. sz. melléklet Minőségi célértékek

Big Data A zettabájt korszak hajnala

Többfelhasználós adatbázis környezetek, tranzakciók, internetes megoldások

Olyan kétoldalú kimutatás, amely a vállalkozás vagyonának nagyságát, összetételét és eredetét mutatja meg egy adott időpontra vonatkozóan

TÁJÉKOZTATÓ A SZERZ DÉS MÓDOSÍTÁSÁRÓL I. SZAKASZ: A SZERZ DÉS ALANYAI I.1) AZ AJÁNLATKÉR KÉNT SZERZ D FÉL NEVE ÉS CÍME

INFORMATIKAI ALAPISMERETEK

Új fejlesztéseink (NAT 2012) Középiskolai fizika, kémia

Tájhasználati változások közösségi értékelése az ökoszisztéma szolgáltatások tükrében

Adattípusok. Szám: pozitív egész, egész, valós, dátum + idő,... Szöveg, Formázott szöveg Kép Hang Mozgókép+Hang

TANTÁRGYI ÚTMUTATÓ. Logisztika. tanulmányokhoz

Kalapos, sapka- és kesztyűkészítő


Tanulmányi keretrendszer az APPI-ban

OmniTouch 8400 Instant Communications Suite 4980 Softphone

Webes adatbázis-kezelés MySQL és PHP használatával

Átírás:

Információ integráció Szemantikus Web megközelítés Alkalmazások 1

Miért van szükségünk ilyesmire? (Alkalmazások) WWW: Összehasonlítás alapú vásárlás Portál építések több adatforrás felhasználásával B2B, elektronikus piacterek Tudomány és kultúra: Genetika: gén információk integrálása Asztrofizika: égi jelenségek gyűjtése. Kultúra: kulturális információs adatbázisok egységes elérése országhatárokon túl Vállalati adatintegráció Egy átlagos KNV 49 adatbázist alkalmaz és IT költségvetésének 30% át az adatintegrációra költi (US) 2

Csak szöveg volna a weben? A web jelentős része valójában strukturált A legtöbb web szerver mögött adatbázisok állnak Dinamikusan konvertálják az adatokat olvasható nyelvi formára <India, New Delhi> => The capital of India is New Delhi. Ha vissza tudnánk konvertálni lenne strukturált adatunk! (ki)csomagolók, csomagolók tanulása, stb Dinamikus lapokat is fel tudunk deríteni... Félig strukturált web (kialakulóban) Legtöbb lap részben strukturált (pl. XML) XML a szabvány a szintaktikára, ismert problémák az értelmezéssel Szolgáltatások Utazási szolgáltatások, vásárlások támogatása Érzékelők Tőzsdei árfolyamok, hőmérsékletek, jegyárak 3

Miért nem elég: Keresőgépek szövegalapú keresést végeznek Jól működik egyedi dokumentumokon Nem tudnak integrálni több dokumentumból származó információkat Nem képesek hatékony általánosításra Nem tudnak dokumentumokat és adatbázisokat összekapcsolni Az információ integráció célja strukturált és féligstrukturált információforrások együttes kezelése 4

Összehasonlítás alapú vásárlás? Hasonló De: Szélesebb fókusz Szélesebb spektruma az adatbázisoknak Szolgáltatások Új kihívás adattár nem működik Kézi forrásleírás, kezelés korlátai Netbot DealPilot.Com Junglee 5

Miért nem csak Közös séma hiánya Források heterogén sémákkal (és fogalmakkal, ontológiákkal) rendelkeznek Félig strukturált források Régi források Nem relációs sémák Eltérő elérési módok Query Független források (SQL) Nincs közös adminisztráció Answer Nem kezelt forrás tartalmi átfedések Nehezen előrejelezhető viselkedés Lekérdezés végrehajtás bonyolult Általában csak olvashatóak Ez lehet szerencsés is adatbázisok elosztott adatbázisok (relation) Database Manager (DBMS) -Storage mgmt -Query processing -View management -(Transaction processing) Bár terjednek a tranzakció kezelési megoldások a weben Database (relational) 6

Kitérő: Ivan Herman felvezetése aw3c konferencián 7

Szolgáltatások Forrás leírás Web lapok Strukturált adatok Forrás fúzionálás/ Lekérdezés tervezés Mediátor Szenzorok (soros adatok) Végrehajtás Monitor Válasz 8

Szolgáltatáso Felhasználói lekérdezések megfogalmazása a mediált sémán. Adatok tárolva lokális sémában. Forrás leírás Ontológiák, Forrás és szolgáltatás leírások Teszt lekérdezések Weblapok Strukturált adatok A tárolt információ (tartalom) ismerete alapján megfogalmazható a leképezés a sémák között. A mediátor alkalmazza a leképezést a felhasználói kérdés lefordítására a forrás lekérdezésekre. Forrás fúzionálás Lekérdezés tervezés Számos cél együttese, Szolgáltatások kompozíciója, Forrás minőség, átfedés Szenzorok (soros adatok) Információ menedzser Válasz Végrehajtás Kezel: forrás és hálózati kapcsolatokat, futtatási bizonytalanságokat, újratervezést Monitor 9

Hol az MI szerepe? Tanulás/bányászás -Forrás felkutatás -Forrás statisztikák -Wrapper tanulás Automata tervezés -Nyelvek tervezése -Szolgáltatások kompozíciója -Reaktív tervezés/ terv monitorozás Forrás leírás Ontológiák, Forrás és szolgáltatás leírások Forrás fúzionálás Lekérdezés tervezés Számos cél együttese, Szolgáltatások kompozíciója, Forrás minőség, átfedés Teszt lekérdezések Tudásreprezentáció - Ontológiák - Metaadatok - Következtetés - Lekérdező nyelvek Válasz Végrehajtás Kezel: forrás és hálózati kapcsolatokat, futtatási bizonytalanságokat, újratervezést Monitor 10

Forrás leírások Minden meta adat információt tartalmaz Forrás tartalom logikai leírása (könyvek, új autók). Forrás képességek (pl. SQL lekérdezés feltehető) Forrás teljesség (minden könyvet tartalmaz). Fizikai jellemzők (forrás, hálózat). Statisztikák az adatokról Source reliability Tükör források Frissítési frekvencia. Információ menedzser Lekérdezés Preferenciák/Eléérsi modell Válasz Forrás leírás Ontológiák, Forrás és szolgáltatás leírások Forrás fúzionálás Lekérdezés tervezés Számos cél együttese, Szolgáltatások kompozíciója, Forrás minőség, átfedés Végrehajtás Kezel: forrás és hálózati kapcsolatokat, futtatási bizonytalanságokat, újratervezést Teszt lekérdezések Újratervezési kérések Forrás elérések Statisztikák frissítése Monitor Szolgáltatások Weblapok Strukturált adatok Szenzorok (soros adatok) 11

Forrás elérések Hogyan kapunk n eseket Számos forrás strukturálatlan adatokat ad Néhány inherensen strukturálatlan, mások természetes nyelvi köntösben vannak Vissza kell csomagolni az adatokat Wrapper építés/információ kinyerés Kézi munka/fél automatikus 12

Forrás fúzió/ lekérdezés tervezés Feldolgozza a felhasználói lekérdezést és előállítja a végrehajtási tervet Költség és hatékonyság közti optimalizáció Forrás elérési korlátok kezelése Információ a forrásminőségről Forrás leírás Ontológiák, Forrás és szolgáltatás leírások Teszt lekérdezések Szolgáltatások Weblapok Strukturált adatok Információ menedzser Lekérdezés Preferenciák/Eléérsi modell Válasz Forrás fúzionálás Lekérdezés tervezés Számos cél együttese, Szolgáltatások kompozíciója, Forrás minőség, átfedés Végrehajtás Kezel: forrás és hálózati kapcsolatokat, futtatási bizonytalanságokat, újratervezést Újratervezési kérések Forrás elérések Statisztikák frissítése Monitor Szenzorok (soros adatok) 13

Monitoring/ Végrehajtás Lekérdezési terv alapján elvégzi a feladatot a forrásokon Forrás késleltetések kezelése Hálózati, tranziens kimaradások Forrás elérési korlátok Szükséges lehet újratervezések elvégzése Query Preference/Utility Model Answers Source Trust Ontologies; Source/Service Descriptions Source Fusion/ Query Planning Needs to handle: Multiple objectives, Service composition, Source quality & overlap Executor Needs to handle Source/network Interruptions, Runtime uncertainty, replanning Probing Queries Replanning Requests Source Calls Updating Statistics Monitor Services Webpages Structured data Sensors (streaming Data) 14

Méretek figyelembe vétele Hány forrást kell elérni? Mennyire autonómok ezek? Van ismeretünk a forrásokról? Strukturáltak az adatok? Csak lekérdezés lehetséges vagy módosítás is? Követelmények: pontosság, teljesség, teljesítmény, inkonzisztenciák kezelése Zárt vagy nyílt világ feltételezés? 15

Deduktív adatbázisok Relációkat predikátumokkal írjuk le. Relációk közti relációkat datalog szabályokkal írjuk le (Horn klózok, függvényszimbólumok nélkül) Lekérdezések megfelelnek egy datalog programnak Emprelated(Name,Dname) : Empdep(Name,Dname) Emprelated(Name,Dname) : Empdep(Name,D1), Emprelated(D1,Dname) 16

Kis forrás szám melletti integráció Forrás leírás Ontológiák, Forrás és szolgáltatás leírások Teszt lekérdezések Szolgáltatások Weblapok Strukturált adatok Általában ad hoc programozás: speciális eset megvalósítása minden esetre, sok konzultáció. Adattárházak: minden adat periódikus feltöltése az adattárházba. 6 18 hónap bevezetési idő Operációs és döntéstámogatási RDBMS elválasztás. (nem csak adatintegrációra megoldás). Teljesítmény jó, adat lehet, hogy nem friss;. Rendszeres adattisztítás szükséges. Lekérdezés Felhsználói lekérdezések Preferenciák/Eléérsi modell Forrás fúzionálás Lekérdezés tervezés Számos cél együttese, Szolgáltatások kompozíciója, Forrás minőség, átfedés Információ menedzser Végrehajtás Kezel: forrás és hálózati kapcsolatokat, futtatási Válasz bizonytalanságokat, újratervezést Újratervezési kérések Forrás elérések Statisztikák frissítése Monitor OLAP / Döntéstámogtás/ Adatkockák/ Adatbányászat Adat kinyerő programok Adatforrás Relációs adatbázis (tárház) Adat tisztítás Adat- Adatforráforrás Szenzorok (soros adatok) 17

Integrátor séma Felhasználói lekérdezések OLAP / Döntéstámogtás/ Adatkockák/ Adatbányászat Relációs adatbázis (tárház) Adat kinyerő programok Adat tisztítás Adatforrás Adatforrás Adatforrás 18

Source Trust Ontologies; Source/Service Descriptions Probing Queries Services Webpages Structured data Virtuális integrációs séma Adatok a forrásokban maradnak Query Preference/Utility Model Answers Source Fusion/ Query Planning Needs to handle: Multiple objectives, Service composition, Source quality & overlap Executor Needs to handle Source/network Interruptions, Runtime uncertainity, replanning Replanning Requests Source Calls Updating Statistics Monitor Sensors (streaming Data) Lekérdezés végrehajtásakor: Releváns források meghatározása Lekérdezés szétválasztása forrásokra vonatkozó lekérdezésekre. Válaszok begyűjtése a forrásokból, és megfelelő kombinálása a válasz előállításához. Friss adatok A megoldás skálázható Mediátor: wrapper Adat forrás Felhasználói lekérdezés Fordító motor Optimalizáló Végrehajtó gép wrapper Adat forrás Mediált (globális) séma Adatforrás katalógus wrapper Adat forrás Garlic [IBM], Hermes[UMD];Tsimmis, InfoMaster[Stanford]; DISCO[INRIA]; Information Manifold [AT&T]; SIMS/Ariadne[USC];Emerac/Havasu[ASU] 19

Virtuális integrátor architektúra Source Trust Ontologies; Source/Service Descriptions Probing Queries Services Webpages Structured data Mediátor: Felhasználói lekérdezés Fordító motor Mediált (globális) séma Query Source Fusion/ Query Planning Needs to handle: Multiple objectives, Service composition, Source quality & overlap Executor Needs to handle Source/network Interruptions, Answers Runtime uncertainity, replanning Preference/Utility Model Replanning Requests Source Calls Updating Statistics Monitor Sensors (streaming Data) Optimalizáló Végrehajtó gép Adatforrás katalógus wrapper Adat forrás wrapper Adat forrás wrapper Adat forrás Források: relációs adatbázisok, weblapok, szövegek. 20