Tudásalapú információ integráció



Hasonló dokumentumok
Micskei Zoltán Strausz György. Méréstechnika és Információs Rendszerek Tanszék.

Mediátor. Forrás leírás. Forrás fúzionálás/ Lekérdezés tervezés. Monitor. Végrehajtás. Válasz. Szolgáltatások. Web lapok. Strukturált adatok

TSIMMIS egy lekérdezés centrikus megközelítés. TSIMMIS célok, technikák, megoldások TSIMMIS korlátai További lehetségek

Mediátor. Forrás leírás. Forrás fúzionálás/ Lekérdezés tervezés. Monitor. Végrehajtás. Válasz. Szolgáltatások. Web lapok. Strukturált adatok

Microsoft SQL Server telepítése

Információ integráció (Szemantikus Web megközelítés a másik irányból) 5. Előadás

Petőfi Irodalmi Múzeum. megújuló rendszere technológiaváltás

Szemantikus Web Semantic Web A szemantikus web alkalmas megközelítés, illetve megfelel nyelvekkel, eszközökkel támogatja az intelligens információs

Információ integráció (GAV példa) 6. Előadás. Méréstechnika és Információs Rendszerek Tanszék

A webanalitika változó világa 4 felvonásban

Szemantikus Web Semantic Web A szemantikus web alkalmas megközelítés, illetve megfelel nyelvekkel, eszközökkel támogatja az intelligens információs

Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése

Infor PM10 Üzleti intelligencia megoldás

Információ integráció (Datalog, Veder algoritmus, GAV példa) 6. Előadás

Gazdasági informatika alapjai

TELJESÍTÉNYMÉRÉS FELHŐ ALAPÚ KÖRNYEZETBEN AZURE CLOUD ANALÍZIS

ADATTÁRHÁZ HATÉKONYSÁGNÖVELÉS, REDUNDANCIA CSÖKKENTÉS Frunza Zsolt ÜZLETI INTELLIGENCIA A JÖVŐ, AHOGY MI LÁTJUK

Szemantikus világháló a BME-n

Sikerünk kulcsa: az információ De honnan lesz adatunk? Palaczk Péter

Név: Neptun kód: április

VIR alapfogalmai. Előadásvázlat. dr. Kovács László

Elosztott könyvtári rendszerek megvalósítása a Z39.50 és az OAI protokoll használatával

Alkalmazásokban. Dezsényi Csaba Ovitas Magyarország kft.

1. Melyik szabvány foglalkozik dokumentumok tulajdonságainak megfogalmazásával? a. RDFS b. FOAF c. Dublin Core d. DBPedia

SDL Trados szervermegoldások. Szekeres Csaba SDL Trados partner M-Prospect Kft.

VÁLLALATI INFORMÁCIÓS RENDSZEREK. Debrenti Attila Sándor

Rendszermodernizációs lehetőségek a HANA-val Poszeidon. Groma István PhD SDA DMS Zrt.

Szemantikus technológiák területei. Rácz Gábor,

Az adatbázisrendszerek világa

Adattárház kialakítása a Szövetkezet Integrációban, UML eszközökkel. Németh Rajmund Vezető BI Szakértő március 28.

IMOLA. Integrált MOKKA2, ODR2 és OLA. Vándorgyűlés Szombathely, 2008 július 25. Monguz MTA SZTAKI konzorcium

Pentaho 4: Mindennapi BI egyszerűen. Fekszi Csaba Ügyvezető október 6.

Mezőgazdasági külső információs rendszerek fejlesztése

A felsőoktatási szolgáltatások rendszer szintű fejlesztése: diplomás pályakövetés és vezetői információs rendszerek (TÁMOP 4.1.3)

Adattárház tiszta alapokon Oracle Day, Budapest, november 8.

Ügyfél- és címadatok feldolgozása Talenddel

Szolgáltatás és Minőségfejlesztés a Corvinus Egyetemen Kiss György János Mogyorósi János

Az Országos Közegészségügyi Intézet IT fejlesztései

KÖVETKEZŐ GENERÁCIÓS NAGYVÁLLALATI TARTALOMKEZELŐ MEGOLDÁSOK Stratis Kft. / Autonomy üzleti reggeli / Mezei Ferenc üzletág-igazgató

Adatbázis rendszerek. dr. Siki Zoltán

ÜZLETI I TELLIGE CIA - VIZUALIZÁCIÓ

Név: Neptun kód: május 23. Komplex MI alkalmazások vizsga Rendelkezésre álló idő: 75 perc 1. Vizsgálja meg a következő RDF leírást:

Steps Towards an Ontology Based Learning Environment. Anita Pintér Corvinno Technologia Transzfer Kft

Intelligens partner rendszer virtuális kórházi osztály megvalósításához

A szemantikus Web. Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 0.

Üzleti és Közszolgálati informatika szakirányok. Tanszék

SZEMANTIKUS WEB. Integrációs és ellenőrzési technikák VIMIAC04, tavasz

A Jövő Internet Nemzeti Kutatási Program bemutatása

ADATBÁZIS-KEZELÉS - BEVEZETŐ - Tarcsi Ádám, ade@inf.elte.hu

Vállalati információs rendszerek I, MIN5B6IN, 5 kredit, K. 4. A meghirdetés ideje (mintatanterv szerint vagy keresztfélében):

Mesterséges Intelligencia Elektronikus Almanach. Konzorciumi partnerek

KOPI. KOPI Online Plágiumkereső és Információs Portál DSD. Pataki Máté MTA SZTAKI. Elosztott Rendszerek Osztály

TakarNet24. Szolgáltatások, aktuális helyzet. Weninger Zoltán FÖMI

Adatbázis-kezelő rendszerek. dr. Siki Zoltán

Üzletmenet folytonosság menedzsment [BCM]

Hely- és kontextusfüggő alkalmazások fejlesztését támogató keretrendszer mobil környezetben

Google App Engine az Oktatásban 1.0. ügyvezető MattaKis Consulting

DW 9. előadás DW tervezése, DW-projekt

Fekete Csaba Csongor Üzleti intelligencia vezető Citibank ZRt.

A szemantikus világháló oktatása

Fejlesztés, működtetés, felügyelet Hatékony infrastruktúra IBM szoftverekkel

Az alábbiak közül melyek a vállalati stratégia típusok?

Tartalomjegyzék. 1. Bevezető Az információs rendszerek világa Az információs rendszerek felépítése... 31

Hozzávalók keresése és csatolása

ETL keretrendszer tervezése és implementálása. Gollnhofer Gábor Meta4Consulting Europe Kft.

SAS szoftverek felhasználási lehetőségei a felsőoktatásban

Van-e ingyen-ebéd? Avagy mire elég a nyílt forráskodú Pentaho? Fekszi Csaba Ügyvezető október 4.

Dr. Sasvári Péter Egyetemi docens

Önálló labor feladatkiírásaim tavasz

ivir vezetői információs rendszer

Virtuális Obszervatórium. Gombos Gergő

2023 ban visszakeresné 2002 es leveleit? l Barracuda Message Archiver. Tóth Imre Kereskedelmi Igazgató Avisys Kft Barracuda Certified Diamond Partner

Elektronikus Információs és Nyilvántartási Rendszer a Doktori Iskolák fiatal kutatói részére

Multimédiás adatbázisok

Gazdálkodási modul. Gazdaságtudományi ismeretek II.

NETinv. Új generációs informatikai és kommunikációs megoldások

IBM felhő menedzsment

Adatbányászat és Perszonalizáció architektúra

Az adatok a vállalat kulcsfontosságú erőforrásai. Az információs rendszer adatai kezelésének két alapvető változata:

CityScape Városüzemeltetési rendszer

Nézetek és indexek. AB1_06C_Nézetek_Indexek - Adatbázisok-1 EA (Hajas Csilla, ELTE IK) - J.D. Ullman elıadásai alapján

Csima Judit szeptember 6.

Alkalmazkodjunk együtt a digitális változásokhoz! Mizsei Szabolcs XAPT digitális tanszformációs tanácsadó

Az információ hatalom. adatok. információ

AZ IKIR RENDSZER BEMUTATÁSA

Tipikus időbeli internetezői profilok nagyméretű webes naplóállományok alapján

Szolnoki Főiskola. Vezetői Információs Rendszer (VIR) Szabályzat

Jogosultság-monitorozó rendszer kialakítása

Adatbázisrendszerek 2. előadás: Alapfogalmak

Adattárházak. Méréstechnika és Információs Rendszerek Tanszék

Vezetői információs rendszerek

A MAGYAR NEMZETI MÚZEUM AGGREGÁTORI FELADATAI ÉS DIGITÁLIS SZOLGÁLTATÁS FEJLESZTÉSI TERVEI 2019

Kővári Attila, BI projekt

Az informáci. Forczek Erzsébet SZTE, ÁOK Orvosi Informatikai Intézet május

Informatikai alapismeretek Földtudományi BSC számára

Magic xpi 4.0 vadonatúj Architektúrája Gigaspaces alapokon

SZEMANTIKUS WEB. Méréstechnika és Információs Rendszerek Tanszék

Hálózati operációs rendszerek II.

Mobil Üzleti Intelligencia

Együttműködésben a külvilággal, együttműködésben a piaccal

Átírás:

Tudásalapú információ integráció (A Szemantikus Web megközelítés és a másik irány) Tanszéki értekezlet, 2008. május 14. 1

Miért van szükségünk ilyesmire? WWW: (Alkalmazások) Keresés a weben (pl. összehasonlítás alapú vásárlás) Portál építések több adatforrás felhasználásával B2B, elektronikus piacterek Tudomány és kultúra: Asztrofizika: égi jelenségek gyűjtése. Kultúra: kulturális információs adatbázisok egységes elérése országhatárokon túl Genetika: gén információk integrálása Vállalati adatintegráció Egy átlagos KNV 49 adatbázist alkalmaz és IT költségvetésének 30%-át az adatintegrációra költi (US, 2002) 2

Információ integráció Az információ integráció célja strukturált és félig-strukturált információforrások együttes kezelése, információigények egységes felületen történő kiszolgálása Területek: Intézmények (közép- és nagyvállalatok, államigazgatás) Web Megközelítési módok: Források kiegészítése (szemantikus web koncepció) Lekérdező eszközök fejlesztése (mediátor és információintegrációs rendszerek) 3

Szkeptikusoknak Miért nem elég: Keresőgépek szövegalapú keresést végeznek Jól működik egyedi dokumentumokon Nem tudnak integrálni több dokumentumból származó információkat Nem képesek hatékony általánosításra Nem tudnak dokumentumokat és adatbázisokat összekapcsolni 4

Szkeptikusoknak Összehasonlítás alapú vásárlás? Hasonló források De: Eltérő fókusz Eltérő a spektrumuk az adatbázisoknak Új kihívás Az adattár megközelítés nem működik Kézi forrásleírás, kezelés korlátai Netbot DealPilot.Com Junglee 5

Szkeptikusoknak Miért nem csak Közös séma hiánya Források heterogén sémákkal (és fogalmakkal, ontológiákkal) rendelkeznek Félig-strukturált források Régi források Nem relációs sémák Eltérő elérési módok Független források Nincs közös adminisztráció adatbázisok elosztott adatbázisok Adatbázis kezelés (DBMS) -Tároló kezelés - végrehajtás -Nézetek kezelése -(Tranzakció kezelés) (SQL) Válasz (adat rekordok) Nem kezelt forrás tartalmi átfedések Nehezen előre jelezhető viselkedés végrehajtás bonyolult Általában csak olvashatóak Ez lehet szerencsés is Terjednek a tranzakció kezelési megoldások a weben Adatbázis (relációs) 6

Az egyik irány A szemantikus web egy kiterjesztése a jelenlegi webnek, amelyben az információknak jól definiált jelentést adhatunk, lehetővé téve a gépek és felhasználók közti jobb együttműködést. A szemantikus web koncepció A szemantikus web elérhetővé teszi a tudást, mint a web a hypertextet. Tim Berners-Lee 7

A másik irány Forrás leírás Forrás fúzionálás/ tervezés Mediátor Web lapok Strukturált adatok Szenzorok (soros adatok) Végrehajtás Monitor Válasz 8

Felhasználói lekérdezések megfogalmazása a mediált sémán. Adatok tárolása lokális sémában. A tárolt információ (tartalom) ismerete alapján megfogalmazható a leképezés a sémák között. A mediátor alkalmazza a leképezést a felhasználói kérdés lefordítására a forrás elérésekhez. Információ menedzser Preferenciák/Eléérsi modell Válasz Forrás leírás Ontológiák, Forrás és szolgáltatás leírások Forrás fúzionálás tervezés Számos cél együttese, kompozíciója, Forrás minőség, átfedés Végrehajtás Kezel: forrás és hálózati kapcsolatokat, futtatási bizonytalanságokat, újratervezést Teszt lekérdezések Újratervezési kérések Forrás elérések Statisztikák frissítése Monitor Weblapok Strukturált adatok Szenzorok (soros adatok) 9

Kis forrás szám melletti integráció Általában ad-hoc programozás: speciális eset megvalósítása minden esetre, sok konzultáció. Adattárházak: minden adat periódikus feltöltése az adattárházba. 6-18 hónap bevezetési idő Operációs és döntéstámogatási RDBMS elválasztás. (nem csak adatintegrációra megoldás). Teljesítmény jó, adat lehet, hogy nem friss;. Rendszeres adattisztítás szükséges. Preferenciák/Eléérsi modell Forrás leírás Ontológiák, Teszt Forrás és lekérdezések szolgáltatás leírások Forrás fúzionálás tervezés Számos cél együttese, kompozíciója, Forrás minőség, átfedés Információ menedzser Végrehajtás Kezel: forrás és hálózati kapcsolatokat, futtatási Válasz bizonytalanságokat, újratervezést Újratervezési kérések Forrás elérések Statisztikák frissítése Monitor Adat kinyerő programok Adatforrás Felhsználói OLAP / Döntéstámogtás/ lekérdezések Adatkockák/ Adatbányászat Relációs adatbázis (tárház) Adat tisztítás Adat- Adatforráforrás Weblapok Strukturált adatok Szenzorok (soros adatok) 10

Virtuális integrációs séma Adatok a forrásokban maradnak végrehajtásakor: Releváns források meghatározása szétválasztása forrásokra vonatkozó lekérdezésekre. Válaszok begyűjtése a forrásokból, és megfelelő kombinálása a válasz előállításához. Friss adatok A megoldás skálázható Mediátor: wrapper Adat forrás Információ menedzser Felhasználói lekérdezés Fordító motor Optimalizáló Végrehajtó gép wrapper Adat forrás Preferenciák/Eléérsi modell Válasz Forrás leírás Ontológiák, Forrás és szolgáltatás leírások Forrás fúzionálás tervezés Számos cél együttese, kompozíciója, Forrás minőség, átfedés Végrehajtás Kezel: forrás és hálózati kapcsolatokat, futtatási bizonytalanságokat, újratervezést Mediált (globális) séma Adatforrás katalógus wrapper Adat forrás Teszt lekérdezések Újratervezési kérések Forrás elérések Statisztikák frissítése Monitor Weblapok Strukturált adatok Szenzorok (soros adatok) 11

Hol az MI szerepe? Tanulás/bányászás -Forrás felkutatás -Forrás statisztikák -Wrapper tanulás Automata tervezés -Nyelvek tervezése - kompozíciója -Reaktív tervezés/ terv monitorozás Preferenciák/Eléérsi modell Válasz Forrás leírás Ontológiák, Forrás és szolgáltatás leírások Forrás fúzionálás tervezés Számos cél együttese, kompozíciója, Forrás minőség, átfedés Végrehajtás Kezel: forrás és hálózati kapcsolatokat, futtatási bizonytalanságokat, újratervezést Teszt lekérdezések Tudásreprezentáció - Ontológiák -Metaadatok - Következtetés -Lekérdező nyelvek Újratervezési kérések Forrás elérések Statisztikák frissítése Monitor 12

Köszönöm a figyelmet! 13