Data Vault adatmodellezés.

Hasonló dokumentumok
Data Vault 2.0 és az Oracle DW/BD referencia architektúra. Gollnhofer Gábor Meta Consulting Kft.

Döbrönte Zoltán. Data Vault alapú adattárház - Fél óra alatt. DMS Consulting Kft.

Adattárház tiszta alapokon Oracle Day, Budapest, november 8.

Sikerünk kulcsa: az információ De honnan lesz adatunk? Palaczk Péter

Adatmodellezés. 1. Fogalmi modell

Adattárház kialakítása a Szövetkezet Integrációban, UML eszközökkel. Németh Rajmund Vezető BI Szakértő március 28.

Oracle SQL Developer Data Modeler és a DW adatmodellezés. Gollnhofer Gábor Meta Consulting Kft.

Modern adattárház építés Data Vault alapokon. Gollnhofer Gábor Meta Consulting Kft.

Név- és tárgymutató A, Á

BEVEZETÉS AZ ADATTÁRHÁZ AUTOMATIZÁLÁSBA

Adatbázis-kezelés. alapfogalmak

Fogalomtár bevezetése a Magyar Telekomnál

ELMÉLET ÉS GYAKORLAT

Több mint BI (Adatból üzleti információ)

ABAP dictionary objektumok SAP adatmodell Táblák kezelése. Az SAP programozása 1. Tarcsi Ádám

Ügyfél- és címadatok feldolgozása Talenddel

Szemléletmód váltás a banki BI projekteken

Példa Többértékű függőségek, 4NF, 5NF

Adattárház automatizálási tapasztalatok a Generali Biztosítóban

Teljeskörű BI megoldás a gyakorlatban IBM eszközök használatával, Magyarországon

Szabálykezelés a gyakorlatban

KKV Adattárház. Presented to: Adattárház Fórum 2014 Date: Június 5, Presented by: Csippán János IT Director

Adatbázis, adatbázis-kezelő

I. RÉSZ. Tartalom. Köszönetnyilvánítás...13 Bevezetés...15

Adatminőség a mindennapokban

Adatbázis rendszerek I

Adatbázis rendszerek. 4. előadás Redundancia, normalizálás

Segítség, összementem!

Adatbázisrendszerek április 17.

Adattárház és BigData Szimbiózisa. Baranyi Szabolcs IM Technical Sales

Agilis adattárház építés a gyakorlatban. Gollnhofer Gábor Meta4Consulting Europe Kft.

Adatbázisok gyakorlat

Mezők viszonya a relációs adatbázis tábláiban

DW 9. előadás DW tervezése, DW-projekt

Adatmodellezés, alapfogalmak. Vassányi István

Adatbázisok. 4. gyakorlat. Adatmodellezés: E-K modellb l relációs adatbázisséma. Kötelez programok kiválasztása szeptember 24.

ADATBÁZISOK. 4. gyakorlat: Redundanciák, funkcionális függőségek

Gazdasági informatika II (SZIE GTK GVAM 1. évfolyam) 2009/2010. tanév 2. félév

Adatbázis tervezés normál formák segítségével

ADATTÁRHÁZAK MINŐSÉGBIZTOSÍTÁSA

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

2011. November 8. Boscolo New York Palace Budapest. Extrém teljesítmény Oracle Exadata és Oracle Exalogic rendszerekkel

ETL keretrendszer tervezése és implementálása. Gollnhofer Gábor Meta4Consulting Europe Kft.

a nyers adatokat relációs formátumúvá alakítja felkutatja és feloldja az adatelem meghatározásokban az esetleges pontatlanságot/bizonytalanságot

Függőségek felismerése és attribútum halmazok lezártja

Exadata hibrid oszlopos adattömörítés automatizálása; DB 12c partition merge

Tárolóhely csökkentés és folyamatoptimalizáció archiválással

Adatbázisok. 1. gyakorlat. Adatmodellezés október október 1. Adatbázisok 1 / 42

11. Gyakorlat Adatbázis-tervezés, normalizálás. Redundancia: egyes adatelemek feleslegesen többször is le vannak tárolva

Adatbázisok. 3. gyakorlat. Adatmodellezés: E-K modellb l relációs adatbázisséma. Kötelez programok kiválasztása szeptember 21.

NETinv. Új generációs informatikai és kommunikációs megoldások

VvAaLlÓóSs IiıDdEeJjȷŰű OoDdSs goldengate alapokon a magyar telekomban

Ropogós - Oracle BI EE 12C

Több felhasználó párhuzamosan olvashatja, bővítheti, módosíthatja és törölheti az adatokat Az adatok konzisztenciájának és biztonságának biztosítása

Elosztott rendszer architektúrák

Vodafone ODI ETL eszközzel töltött adattárház Disaster Recovery megoldása. Rákosi Péter és Lányi Árpád

Adatbányászat és Perszonalizáció architektúra

Adatbázis rendszerek Ea: A rendes állapot. Normalizálás

Statisztika I. 2. előadás. Előadó: Dr. Ertsey Imre

6. Gyakorlat. Relációs adatbázis normalizálása

HATÉKONY ETL FOLYAMATOK WORKSHOP

Tudásalapú információ integráció

Adatbázis rendszerek. 5. előadás Adatbázis tervezés. Koppányi Zoltán

Hálózati réteg. WSN topológia. Útvonalválasztás.

Hogyan növelje kritikus üzleti alkalmazásainak teljesítményét?

Csima Judit BME, VIK, november 9. és 16.

Könyvtári nyilvántartás

Adatbázis rendszerek. 5. előadás Adatbázis tervezés. Koppányi Zoltán

Adatbázis alapú rendszerek

A FEJEZET CÉLJA. RDA a gyakorlatban. A relációs adatelemzés alkalmazásához kapcsolódó gyakorlati kérdések megvizsgálása:

RELÁCIÓS ADATBÁZISSÉMÁK. Egyed-kapcsolat modellről átírás

SQL OLAP 2. óra. Multi-dimenzionális adatmodell. A normalizált relációs modell bonyolult a felhasználók számára

Microsoft SQL Server telepítése

Big Data az adattárházban

TÁMOP Szolnoki Főiskola VIR rendszerterv. Szolnoki Főiskola. TÁMOP Vezetői Információs Rendszer. Rendszerterv. Verziószám: 1.

KORMÁNYZATI SZEMÉLYÜGYI DÖNTÉSTÁMOGATÓ RENDSZER KÖFOP VEKOP 16

László Zsuzsanna Vezérigazgató. Integra Zrt. Budapest, 1037 Kiscelli utca

Kővári Attila, BI projekt

Adatbázis rendszerek. 3. előadás Adatbázis tervezés

Kővári Attila C SŐ. Minta (Csak az 1-3 fejezetet tartalmazza)

Oracle adatkezelési megoldások helye az EA világában. Előadó: Tar Zoltán

Adatbázis használat I. 1. gyakorlat

Újdonságok. Jancsich Ernő Ferenc

NORMALIZÁLÁS. Funkcionális függés Redundancia 1NF, 2NF, 3NF

Az információ hatalom. adatok. információ

ADATTÁRHÁZ MENEDZSMENT ÉS METAADAT KEZELÉS


Adatbázisok gyakorlat

2 az 1-ben MT adattárházak egyesítése. Koncz Béla, IQSymposium

Eredmények rövid összefoglalása

BI megoldás a biztosítói szektorban

Hogyan teremtsünk értéket strukturálatlan adatokból?

Adatbázis rendszerek. dr. Siki Zoltán

Adatbázisok 1. Az egyed-kapcsolat modell (E/K)

Újdonságok Nexus Platformon

BGF. 4. Mi tartozik az adatmodellek szerkezeti elemei

Pentaho 4: Mindennapi BI egyszerűen. Fekszi Csaba Ügyvezető október 6.

INGATLANVAGYON-KATASZTER SZAKRENDSZER

Vasúti és kapcsolódó elektronikus jegyrendszer fejlesztése a MÁV Csoportban Garamvölgyi Erzsébet projektvezető, MÁV SZK Zrt.

TakarNet24. Szolgáltatások, aktuális helyzet. Weninger Zoltán FÖMI

Átírás:

Data Vault adatmodellezés Nemeth.Zoltan@iqpp.hu

Új adattárház adatmodellezési módszer Dan Linstedt nevéhez fűződik Ismérvei Részletes, tételes adatok Történetiség kezelése Data Vault Üzleti területek köré csoportosított táblák kapcsolata 3NF és csillag séma hibrid megközelítése Bővíthető, skálázható, konzisztens Alternatív név: Common Foundational Integration Modelling Architecture 1990-ben kezdődött, 2000-ben publikálva

Poén gyilkolás Előnyök Optimális helyigény, normalizált, redundancia mentes Egyszerű tölthetőség (realtime töltés!) Elemtípustól függő három lépésű függőség Masszívan párhuzamosítható Minimális migrációval, rugalmasan bővíthető Alapadat betöltésre kiváló! Hátrányok Legalább kétszer több tábla, sok join. Komplex számításokat, adattisztítást nem támogatja.

Hub (csomópont) Üzleti kulcsok + helyettesítő kulcsok Link (kapcsoló) Több üzleti entitás közötti N:M kapcsolatot megtestesítő összefüggés Satellite (leíró) Koncepció A Hub vagy Link leíró attribútumai vagy e HUB_SAT és LINK_SAT

3NF modell Értékesítő tétel 7 tábla ebből 2 táblát nem feltétlenül kell fizikailag tárolni

Csillagséma Dimenzió Dátum dimenzió tétel Értékesítő Dimenzió Dimenzió 5 tábla

Data Vault modell tulajdonságok Értékesítő tétel 10 tábla Értékesítő tétel tulajdonságok

HUB HUB Mezők: Helyettesítő kulcs (RK) Üzleti kulcsok (ID) valódi, egyedi, forrásrendszeri kulcs Első töltés időpontja, forrása Egyszer töltjük mikor létrejön Nem időfüggő volt, valaha egy üzleti kulcs HUB_SAT Mezők HUB kulcs (RK) Érvényesség kezdete-vége Attribútumok Historikusan töltjük (SCD2) Több SAT-ot felvehetünk Eltérő időfüggőség Forrásonkénti attribútumoknak (pl.: eltérő székhelycímek)

LINK LINK Mezők: Helyettesítő kulcs (SK) HUB vagy LINK kulcsok Első töltés időpontja, forrása Egyszer töltjük mikor létrejön Nem időfüggő volt, valaha több üzleti kulcs között összefüggés LINK_SAT Mezők Link kulcs (SK) Érvényesség kezdete-vége Attribútumok Historikusan töltjük (SCD2) LINK időfüggését is megmutatja Értékesítő tétel tétel tulajdonságok

HUBok töltése HUB_SAT és LINK töltése ETL függőség LINK_SAT töltése Értékesítő Értékesítő tulajdonságok tétel tétel tulajdonságok

Teljes ETL Adatpiac csillagséma Komplex számítások Adattisztítás Business Rule, KPI, Aggregation Quality - Cleansing Data Vault betöltés DW MAP betöltés Integrációs lépések Integráció Stage betöltés

Adattisztítás Ne a DW rétegben végezzük el a tisztítást, ETL betöltés közben! Tisztitott adatokat külön HUB_SAT-ba tölthetjük Hozzunk létre dimenzió hierarchiát a tisztított adatokra Normalizált cím Forrás cím1 Forrás cím2 Forrás 1 attribútumok e Forrás 2 attribútumok e Tiszta Attribútumok e

3NF Szülő-gyerek kapcsolat (1-N) = kapcs. kapcs. Vadhajtások Data Vault Projekt Személy Szervezet Projekt = Projekt link Személy Szervezet Projekt link

Összefoglaló Alkalmazás független Részletes, tételes adatok Strukturális változásra és gyors betöltésre optimalizált Nehezen implementálható Alapadat betöltésre kiváló! Komplex számításokat, integrációt, adattisztítást direktben nem támogatja külön megoldandó feladat További info: http://datavaultacademy.com http://danlinstedt.com/about/data-vault-basics/ http://www.tdan.com http://geneseeacademy.com