Adatbázisrendszerek április 17.

Hasonló dokumentumok
Történet John Little (1970) (Management Science cikk)

Vezetői információs rendszerek

Adatmodellezés. 1. Fogalmi modell

Sikerünk kulcsa: az információ De honnan lesz adatunk? Palaczk Péter

ADATBÁZIS-KEZELÉS. Adatbázis-kezelő rendszerek

Vállalati információs rendszerek I, MIN5B6IN, 5 kredit, K. 4. A meghirdetés ideje (mintatanterv szerint vagy keresztfélében):

VÁLLALATI INFORMÁCIÓS RENDSZEREK. Debrenti Attila Sándor

Infor PM10 Üzleti intelligencia megoldás

Adatbázis rendszerek. dr. Siki Zoltán

Adattárházak. Méréstechnika és Információs Rendszerek Tanszék

Gazdasági informatika alapjai

Adatbázismodellek. 1. ábra Hierarchikus modell

ADATBÁZISOK, ADATTÁRHÁZAK

Adattárház tiszta alapokon Oracle Day, Budapest, november 8.

DW 9. előadás DW tervezése, DW-projekt

Adatbázis, adatbázis-kezelő

VIR alapfogalmai. Előadásvázlat. dr. Kovács László

Adatbázis-kezelés az Excel 2013-ban

INFORMATIKA ÁGAZATI ALKALMAZÁSAI. Az Agrármérnöki MSc szak tananyagfejlesztése TÁMOP /1/A

Van-e ingyen-ebéd? Avagy mire elég a nyílt forráskodú Pentaho? Fekszi Csaba Ügyvezető október 4.

ADATBÁZISOK ADATBÁZIS-KEZELŐ RENDSZEREK. Debrenti Attila

Térbeli és időbeli elemzések multidimenzionális szemléletben

Nyílt forráskódú integrált vállalatirányítási rendszerek. Pető István Vállalatirányítási rendszerek március 10.

I. RÉSZ. Tartalom. Köszönetnyilvánítás...13 Bevezetés...15

Több mint BI (Adatból üzleti információ)

RELÁCIÓS ADATBÁZISSÉMÁK. Egyed-kapcsolat modellről átírás

Adatbázis-kezelő rendszerek. dr. Siki Zoltán

ADATTÁRHÁZ HATÉKONYSÁGNÖVELÉS, REDUNDANCIA CSÖKKENTÉS Frunza Zsolt ÜZLETI INTELLIGENCIA A JÖVŐ, AHOGY MI LÁTJUK

Adatbázisok és adattárházak az információs rendszerek adatkezelői

ADATBÁZISOK, ADATTÁRHÁZAK

Magas szintű adatmodellek Egyed/kapcsolat modell I.

INFORMÁCI CIÓS ERŐFORRÁSOK ÉS RENDSZEREK

Tudásalapú információ integráció

április 24. INFO Savaria április 24. INFO Savaria április 24. INFO Savaria

TÁMOP /1/A projekt Regionális turisztikai menedzsment /BSc/ /Differenciált szakmai ismeretek modul/ Információs irodák menedzsmentje

Az információs rendszerek adatai

Informatikai alapismeretek Földtudományi BSC számára

Segítség, összementem!

Az információs rendszerek adatai

10. HÉT: ADATTÁRHÁZAK ÉS ÜZLETI INTELLIGENCIA

Kővári Attila, BI projekt

5. Gyakorlat. 5.1 Hálós adatbázis modell műveleti része. NDQL, hálós lekérdező nyelv:

ADATBÁZIS-KEZELÉS. Relációs modell

<Insert Picture Here> Közeli jövőkép az üzleti intelligenciáról

Data Vault 2.0 és az Oracle DW/BD referencia architektúra. Gollnhofer Gábor Meta Consulting Kft.

Szemléletmód váltás a banki BI projekteken

Data Vault adatmodellezés.

Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése

Név- és tárgymutató A, Á

Adatmodellezés, alapfogalmak. Vassányi István

Adatbázis-kezelés. alapfogalmak

Az információ hatalom. adatok. információ

Adatbányászat és Perszonalizáció architektúra

Valós idejű megoldások: Realtime ODS és Database In-Memory tapasztalatok

Teljeskörű BI megoldás a gyakorlatban IBM eszközök használatával, Magyarországon

Számítógépes döntéstámogatás. Döntések fuzzy környezetben Közelítő következtetések

Adatszerkezetek Adatszerkezet fogalma. Az értékhalmaz struktúrája

Struktúra nélküli adatszerkezetek

Informatikai rendszerek Vállalati információs rendszerek

Fájlrendszerek. A Windows operációs rendszerek fájlrendszere

A vállalkozás sikerének tényezi. Termék, szolgáltatás Erforrások Információtechnológia

1. előadás Alapfogalmak Modellezés, a Bachman-féle fogalomrendszer, adatmodell,

Magic xpi 4.0 vadonatúj Architektúrája Gigaspaces alapokon

Dr. Sasvári Péter Egyetemi docens

Microsoft SQL Server telepítése

Integráció az adatok szintjén

Az információ feldolgozás alapvetı módszerei Folyamat szemlélető információ feldolgozás A legfontosabb állomány struktúrák

KÖVETKEZŐ GENERÁCIÓS NAGYVÁLLALATI TARTALOMKEZELŐ MEGOLDÁSOK Stratis Kft. / Autonomy üzleti reggeli / Mezei Ferenc üzletág-igazgató

Név: Neptun kód: április

Self Service szekció. XXVIII. Budapesti Menedzsment és Controlling Fórum. Havas Levente. Budapest, május 26. IFUA Horváth & Partners

Analitikus adatfeldolgozás. Adattárház Adatkocka Adatbányászat

Adattárház kialakítása a Szövetkezet Integrációban, UML eszközökkel. Németh Rajmund Vezető BI Szakértő március 28.

KORMÁNYZATI SZEMÉLYÜGYI DÖNTÉSTÁMOGATÓ RENDSZER KÖFOP VEKOP 16

Számítógéppel segített karbantartás menedzsment

Nyilvántartási Rendszer

Adatbáziskezelés. Indexek, normalizálás NZS 1

Számítógépes döntéstámogatás. Bevezetés és tematika

Fogalmak: Adatbázis Tábla Adatbázis sorai: Adatbázis oszlopai azonosító mező, egyedi kulcs Lekérdezések Jelentés Adattípusok: Szöveg Feljegyzés Szám

Adatbázisok gyakorlat

AB1 ZH mintafeladatok. 6. Minősítse az állításokat! I-igaz, H-hamis

Indikátorok projekt modellhelyszínein. Domokos Tamás szeptember 13.

NETinv. Új generációs informatikai és kommunikációs megoldások

ALAPOK. 0 és 255 közé eső számértékek tárolására. Számértékek, például távolságok, pontszámok, darabszámok.

ADATBÁZIS-KEZELÉS ALAPOK I.

Tartalom. Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben.

Adatmodellek. 2. rész

TSIMMIS egy lekérdezés centrikus megközelítés. TSIMMIS célok, technikák, megoldások TSIMMIS korlátai További lehetségek

Vezetői információs rendszerek

Adattár. Adattár. Elemzések, modellezés. Adatszolgáltatás

BEVEZETÉS AZ ADATBÁZIS KEZELŐ RENDSZEREK ALKALMAZÁSÁBA. Az ADATBÁZIS logikailag összefüggő meghatározott szerkezetben tárolt adatok halmaza.

ADATTÁRHÁZ MENEDZSMENT ÉS METAADAT KEZELÉS

Szolgáltatás mérés/riportolás magas fokon Egy valós megoldás Pepsi berkekben

Fekete Csaba Csongor Üzleti intelligencia vezető Citibank ZRt.

30 MB INFORMATIKAI PROJEKTELLENŐR INFORMATIKAI RENDSZEREK INTEGRÁCIÓJA INTEGRÁCIÓS TECHNOLÓGIÁK (LEGACY RENDSZEREK, ADATOK, TÖRZSADAT MENEDZSMENT)

MS ACCESS 2010 ADATBÁZIS-KEZELÉS ELMÉLET SZE INFORMATIKAI KÉPZÉS 1

7. előadás. Karbantartási anomáliák, 1NF, 2NF, 3NF, BCNF. Adatbázisrendszerek előadás november 3.

TÁJÉKOZTATÓ SZEPTEMBER 15. ELŐADÓ: DR. SZEPESI GÁBOR OPERATÍV PROJEKTVEZETŐ

C programozási nyelv Pointerek, tömbök, pointer aritmetika

Informatika szigorlat 9-es tétel: Az adatbázis-kezelő rendszerek fogalmai

Szoftverarchitektúrák 3. előadás (második fele) Fornai Viktor

Átírás:

Adatbázisrendszerek Áttekintés az adattárházakról és az OLAP-ról 2018. április 17.

Az adattárházak célja 2 A számítási kapacitások állandó növekedése és az analitikai eszközök és módszerek egyre összetettebbé (szofisztikáltabbá) válása eredményezte azt a fejlődést, amely az adattárházakban kulminálódott. A hagyományos adatbázisok nem csak az adatok hozzáférésére optimalizáltak, hanem emellett az adatok integritását is biztosítják, illetve ezen két szempont között egyensúlyoznak. Legtöbbször az adattárház felhasználóknak csak olvasási hozzáférésre van szükségük, azonban ennek a hozzáférésnek gyorsnak kell lenni még nagy mennyiségű adat esetén is.

Az adattárházak célja 3 Az adattárház elemzésekhez szükséges adatok többsége több adatbázisból jön, továbbá ezek az elemzések ismétlődőek és előrejelezhetőek, így lehetséges speciális szoftverekkel ezeknek a követelményeknek megfelelni. Nagy szükség van olyan eszközökre, amelyek információval látják el a döntéshozókat azért, hogy gyorsan és megbízhatóan hozzanak döntéseket histórikus adatokra alapozva. Ezeket a képességeket adattárházakkal és közvetlen analitikus feldolgozással (online analytic processing - OLAP) érhetjük el.

Az adattárház definíciója 4 W.H. Inmon adattárház definíciója Az adattárház adatok téma-orientált, integrált, nemváltozó, időbélyeggel rendelkező összessége a menedzsment döntéseinek támogatására.

Alap 5 Az adattárházaknak olyan megkülönböztető k vannak, amelyek főként a döntéstámogatási alkalmazásokból következnek. A hagyományos adatbázisok tranzakciósak. kal kapcsolatos alkalmazások: Az OLAP - Online Analytical Processing (közvetlen anaĺıtikus feldolgozás) kifejezést adattárházakból származó komplex adatok elemzésére használjuk. A DSS - Decision Support Systems (döntéstámogatási rendszerek), melyeket EIS - Executive Information Systems (vezetői információs rendszerek)-nek is neveznek a szervezetek vezető döntéshozóit támogatják abban, hogy képesek legyenek összetett és fontos döntések meghozatalára. Az adatbányászat (data mining) a tudásfeltárás egy fontos eszköze, amely során előre nem várt új tudáshoz jutunk.

Az adattárház koncepcionális szerkezete 6 Adattisztítás és újraformázás OLAP Adatbányászat

Összehasonlás tradicionális adatbázisokkal 7 Az adattárházakat főként a gyors adatelérésre optimalizálják. A hagyományos adatbázisok tranzakciósak és egyaránt optimalizáltak az adatelérési mechanizmusok és a konzisztencia biztosítása tekintetében. Az adattárházak nagyobb hangsúlyt helyeznek a histórikus adatokra mivel fő céljuk idősorok és trend elemzések támogatása. A tranzakciós adatbázisokkal szemben az adattárházak nem változnak abban az értelemben, hogy ha egy adat egyszer oda bekerült, akkor az ott is marad változatlan formában az,,idők végezetéig. A tranzakciós adatbázisokban a tranzakció az a mechanizmus, amely megváltoztatja az adatbázist. Ezzel szemben az adattárházakban az információ durván szemcsézett és a frissítési politika alaposan megválasztott, általában inkrementális jellegű.

Az adattárházak 8 Többdimenziós koncepcionális nézet Általános dimenziókezelés Korlátlan dimenzió és aggregációs szint Dimenziók közötti műveletek korlátlansága Dinamikus ritka mátrixok kezelése Kliens-szerver architektúra Többfelhasználós támogatás Hozzáférhetőség Átláthatóság Intuitive adatmanipuláció Konzisztens riportoló képesség Flexibilis riportolás

osztályozása 9 Általában az adattárházak egy vagy két nagyságrenddel nagyobb méretűek mint a forrás adatbázisok (még ezek együttesénél is). A teljes adattömeg kérdéses, leginkább attól függ, hogy az alábbi adattárház típusok közül melyiket választjuk: Vállalati adattárház, amely általában egy nagy projekt és nagy idő és erőforrás ráfordítást igényel. Virtuális adattárház, amely operatív adatbázisok különböző nézeteit nyújtja, amely nézeteket a hatékony elérés céljából fizikailag is létrehozunk. Adatpiac, amely a szervezet egy jól meghatározott részét célozza meg, amelyre viszont erősen fókuszál (pl. marketing osztály stb.).

10 A hagyományos adatbázisok általában kétdimenziós adatokkal foglalkoznak (adattábla, adatmátrix, reláció). Azonban a többdimenziós adattároló modellekben a lekérdezés hatékonysága jobb. Az adattárházak képesek kihasználni ennek a tulajdonságnak az előnyeit, mivel ők nemváltozóak, a végrehajtandó elemzés jól előrejelezhető.

11 Két- illetve többdimenziós adatszerkezetek Kétdimenziós: táblázat, adattábla Többdimenziós: adatkocka (hiperkocka) A többdimenziós modellek előnyei: egyes dimenziók előtérbe helyezése forgatással (pivoting) könnyen hagyja magát hierarchikusan szemlélni az ún. felgönygyöĺıtés (roll-up) és lefúrás (drill-down) műveletekkel. az adatok közvetlenül lekérdezhetőek bármilyen dimenzió kombinációban összetett adatbázis lekérdezések útján.

Többdimenziós sémák 12 A többdimenziós sémákat az alábbiak felhasználásával specifikálhatjuk: Dimenzió-tábla, amely a dimenziók attribútumainak rekordjaiból áll. Tény-tábla, amelynek minden rekordja egy rögzített tény adat. Ez a tény mért vagy megfigyelt változókból áll és a dimenzió táblákra mutató pointerekkel azonosítjuk őket. A tény-tábla tartalmazza az adatokat és a dimenziókat az adatokbeli rekordok azonosítására. Az általánosan használt többdimenziós sémák a következők: Csillag séma, amely egy tény-táblát és minden dimenzióhoz egy egyszerű táblát tartalmaz. Hópehely séma, amely a csillag-séma egy olymódon továbbfejlesztett változata, amely dimenzió-táblák egy hierarchiáját tartalmazza.

Többdimenziós sémák 13 Tény konstelláció olyan táblák halmaza, amelyek ugyanazon dimenziók között osztoznak. A tény konstellációk behatárolják az adattárházbeli lehetséges lekérdezéseket. Indexelés. Az adattárházak indexelést használnak a nagy hatékonyságú elérés támogatására. A bitmap indexelés módszere bitvektorokat használ az indexelendő tartomány minden értékére. 1-et írunk a j-edik pozicióba, ha a j-edik rekord rendelkezik az adott értékkel, egyébként pedig 0-t. Elsősorban alacsony számosságú tartományokon működik jól. Pl.: 100 E rekord és 4 attribútumérték esetén 4 db 100 E hosszú bitvektor (12.5Kb, összesen 50Kb) jön létre. A join idexelés a hagyományos elsődleges-külső kulcs kapcsolatot valósítja meg hatékonyan a dimenzió-táblák és a tény-tábla között.

14 Az adattárház építőinek széles áttekintéssel kell bírniuk az adatárház későbbi használatáról. A tervezésnek támogatnia kell az ad-hoc lekérdezéseket. Alkalmas sémát kell választani ahhoz, hogy visszaadjuk az előrejelzett használatot. Az adattárház-építés lépései: Az adatok összegyűjtése az adattárház számára. Annak biztosítása, hogy az adattárolás hatékonyan találkozik a lekérdezési követelményekkel. Teljes áttekintés nyújtása arról a környezetről, ahol az adattárház majd működni fog.

Az adatok összegyűjtése 15 Az adatokat több, heterogén forrásból kell kinyerni. Az adatokat formázni kell az adattárház számára a konzisztencia biztosításához. Az adatokat tisztítani kell az érvényesség biztosításához. Nehéz automatikus eljárást találni. Visszacsatolás, az adatok frissítése tisztított adatokkal. Az adatokat az adattárház adatmodelljéhez kell illeszteni. Az adatokat be kell tölteni az adattárházba. Fontos a frissítési politika helyes megtervezése.

16 Tároljuk le az adatokat az adattárház adatmodelljének megfelelően. Hozzuk létre és tartsuk karban a szükséges adatszerkezeteket. Hozzuk létre és tartsuk karban a megfelelő elérési utakat. Gondoskodjunk az időben változó adatokról amint új adatokat adunk az adattárházhoz. Támogassuk az adattárház adatok naprakészre hozását. Frissítsük az adatokat. Tisztítsuk az adatokat. A használat megtervezése. Az adatmodell illeszkedése. A használható adatforrások. A metaadat komponens tervezése. Moduláris komponens tervezése. A menedzselhetőség és a változás megtervezése.

17 gönygyöĺıtés (roll-up) lefúrás (drill-down) pivot slice - dice rendezés szelekció származtatott attribútumok