Döbrönte Zoltán. Data Vault alapú adattárház - Fél óra alatt. DMS Consulting Kft.



Hasonló dokumentumok
Data Vault 2.0 és az Oracle DW/BD referencia architektúra. Gollnhofer Gábor Meta Consulting Kft.

Adattárház kialakítása a Szövetkezet Integrációban, UML eszközökkel. Németh Rajmund Vezető BI Szakértő március 28.

Oracle SQL Developer Data Modeler és a DW adatmodellezés. Gollnhofer Gábor Meta Consulting Kft.

BEVEZETÉS AZ ADATTÁRHÁZ AUTOMATIZÁLÁSBA

ADATTÁRHÁZ MENEDZSMENT ÉS METAADAT KEZELÉS

Adattárház tiszta alapokon Oracle Day, Budapest, november 8.

Data Vault adatmodellezés.

KKV Adattárház. Presented to: Adattárház Fórum 2014 Date: Június 5, Presented by: Csippán János IT Director

Modern adattárház építés Data Vault alapokon. Gollnhofer Gábor Meta Consulting Kft.

Amit mindig is tudni akartál a Real Application Testing-ről. Földi Tamás Starschema Kft.

Oracle GoldenGate Studio Nagyon rövid bemutató. Quick Talk. Gollnhofer Gábor

Valós idejű megoldások: Realtime ODS és Database In-Memory tapasztalatok

Célkitűzések Az Oracle10 g felépítésének, használatának alapszíntű megismerése

Konszolidáció és költségcsökkentés a gyakorlatban. Az Országos Tisztifőorvosi Hivatal Oracle adatbázis konszolidációja

BIRDIE. Business Information Reporter and Datalyser. Előadó: Schneidler József

Használati alapú és modell alapú tesztelés kombinálása szolgáltatásorientált architektúrák teszteléséhez az ipari gyakorlatban

Ügyfél- és címadatok feldolgozása Talenddel

ADATBÁZIS-KEZELÉS - BEVEZETŐ - Tarcsi Ádám, ade@inf.elte.hu

Adatbányászat és Perszonalizáció architektúra

Sikerünk kulcsa: az információ De honnan lesz adatunk? Palaczk Péter

ETL keretrendszer tervezése és implementálása. Gollnhofer Gábor Meta4Consulting Europe Kft.

Vodafone ODI ETL eszközzel töltött adattárház Disaster Recovery megoldása. Rákosi Péter és Lányi Árpád

Fogalomtár bevezetése a Magyar Telekomnál

Adattárház automatizálási tapasztalatok a Generali Biztosítóban

Exadata, a világ leggyorsabb adatbázisgépe

Segítség, összementem!

Nagy bonyolultságú rendszerek fejlesztőeszközei

Data Integrátorok a gyakorlatban Oracle DI vs. Pentaho DI Fekszi Csaba Ügyvezető Vinnai Péter Adattárház fejlesztő február 20.

Teljeskörű BI megoldás a gyakorlatban IBM eszközök használatával, Magyarországon

DW 9. előadás DW tervezése, DW-projekt

Vállalati információs rendszerek I, MIN5B6IN, 5 kredit, K. 4. A meghirdetés ideje (mintatanterv szerint vagy keresztfélében):

Oracle E-Business Suite üzemeltetés a Rába Járműipari Holding Nyrt.-nél

Oracle Enterprise Metadata Management

Adatmodellezés. 1. Fogalmi modell

Szemléletmód váltás a banki BI projekteken

2011. November 8. Boscolo New York Palace Budapest. Extrém teljesítmény Oracle Exadata és Oracle Exalogic rendszerekkel

HATÉKONY ETL FOLYAMATOK WORKSHOP

Oracle TTS migrációs technológia használata

Országgyűlés Hivatala Exadata a törvényhozásban

Tárolóhely csökkentés és folyamatoptimalizáció archiválással

SAP BUSINESSOBJECTS PROFITABILITY AND COST MANAGEMENT (PCM) BEMUTATÁSA

RapidAnalytics Enterprise Edition bevezetés a Telenor Magyarországnál. Szakács Balázs - Telenor Magyarország Szücs Imre United Consult

VvAaLlÓóSs IiıDdEeJjȷŰű OoDdSs goldengate alapokon a magyar telekomban

Autóipari beágyazott rendszerek. Komponens és rendszer integráció

Eseményvezérelt alkalmazások fejlesztése II 12. előadás. Objektumrelációs adatkezelés (ADO.NET) Giachetta Roberto

Adattárház és BigData Szimbiózisa. Baranyi Szabolcs IM Technical Sales

A hibrid DB cloud biztonsági eszköztára. Kóródi Ferenc Budapest,

Infor PM10 Üzleti intelligencia megoldás

Alternatív adatbázisok Gráfadatbázisok

Agilis adattárház építés a gyakorlatban. Gollnhofer Gábor Meta4Consulting Europe Kft.

TOGAF elemei a gyakorlatban

Toborzás a Linkedin és okosórák korában A toborzás, mint ügyfélkapcsolat kezelés

Bevezetés: az SQL-be

Data Governance avagy adatvagyon kezelés Rövid bevezető. Gollnhofer Gábor DMS Consulting

A szoftver-folyamat. Szoftver életciklus modellek. Szoftver-technológia I. Irodalom

Exadata hibrid oszlopos adattömörítés automatizálása; DB 12c partition merge

Data Governance avagy adatvagyon kezelés Rövid bevezető. Gollnhofer Gábor DMS Consulting

I. RÉSZ. Tartalom. Köszönetnyilvánítás...13 Bevezetés...15

Indexek és SQL hangolás

Az adatok a vállalat kulcsfontosságú erőforrásai. Az információs rendszer adatai kezelésének két alapvető változata:

Oracle E-Business Suite auditok tapasztalatai. Gáspár Gyula Senior Manager Oracle License Management Services, Central Europe április 6.

Fekete Csaba Csongor Üzleti intelligencia vezető Citibank ZRt.

SQLServer. SQLServer konfigurációk

VÁLLALATI INFORMÁCIÓS RENDSZEREK. Debrenti Attila Sándor

Automatikus tesztgenerálás modell ellenőrző segítségével

Név- és tárgymutató A, Á

Az indexelés újdonságai Oracle Database 12c R1 és 12c R2

INFORMATIKAI PROJEKTELLENŐR 30 MB. Dr. Horváth Gábor KLASSZIKUS ADATTÁRHÁZAK MMK- Informatikai projektellenőr képzés

Titkosítás mesterfokon. Tíz évvel a titkosítás után. Előadó: Tóthi Dóra Kovárczi Béla András

Ficsor Lajos Általános Informatikai Tanszék Miskolci Egyetem

WebCenter. Online jóváhagyás és együttműködés. Gönczi Zsolt Október

GDi Esri Magyarország Felhasználói Konferencia Timár Gábor: Konkurens adatfeldolgozás ArcGIS rendszerben

Az alkalmazás minőségbiztosítás folyamata Fókuszban a teszt-automatizálás

Szoftver-technológia II. Szoftver újrafelhasználás. (Software reuse) Irodalom

Adatbázis-kezelő rendszerek. dr. Siki Zoltán

Hatékony iteratív fejlesztési módszertan a gyakorlatban a RUP fejlesztési módszertanra építve

Microsoft SQL Server telepítése

Windows Server 2012: a felhő OS

Az adatbázisrendszerek világa

<Insert Picture Here> Migráció MS Access-ről Oracle Application Express-re

NAGY TELJESÍTM. Szerzők Dévai. István Automatizálási. és s Alkalmazott Informatikai Tanszék

IBM SPSS Modeler 18.2 Újdonságok

Újdonságok. Jancsich Ernő Ferenc

SQLServer. Particionálás

Mérésadatgyűjtő rendszer Oracle Database Appliance alapon. Szabad Miklós vezérigazgató-helyettes XperTeam ZRt. Budapest, Róbert Károly krt. 59.

1. JELENTKEZŐ ADATBÁZIS MODUL

Petőfi Irodalmi Múzeum. megújuló rendszere technológiaváltás

ProofIT Informatikai Kft Budapest, Petzvál J. 4/a

Az adatvagyon kezelés és a metaadatok. Gollnhofer Gábor DMS Consulting

Adatbázis rendszerek. dr. Siki Zoltán

Windows rendszeradminisztráció és Microsoft szerveralkalmazások támogatása. 5. óra. Kocsis Gergely, Supák Zoltán

Egészítsük ki a Drupal-t. Drupal modul fejlesztés

A Birdie riport készítő és terjesztő rendszer segíti. Megoldás: Birdie. A Birdie előnyei

Multimédiás adatbázisok

INFORMATIKAI PROJEKTELLENŐR 30 MB. Dr. Horváth Gábor KLASSZIKUS ADATTÁRHÁZAK MMK- Informatikai projektellenőr képzés

Orvosi készülékekben használható modern fejlesztési technológiák lehetőségeinek vizsgálata

BI modul a lízing üzletágban márc. 21. Előadó: Salamon András

2023 ban visszakeresné 2002 es leveleit? l Barracuda Message Archiver. Tóth Imre Kereskedelmi Igazgató Avisys Kft Barracuda Certified Diamond Partner

DW/BI rendszerek kialakítása bevezetői szemszögből. Gollnhofer Gábor - Meta Consulting Kft.

K&H Központosított felhasználó adminisztráció gyakorlati megvalósítása

Átírás:

Data Vault alapú adattárház - Fél óra alatt Döbrönte Zoltán DMS Consulting Kft. 1

Miről lesz szó Adattárház automatizálás Hol alkalmazható a leghatékonyabban Célok, funkcionalitás, előnyök Data Vault modellezés a történetkezelt rétegben DW tervezés és fejlesztés automatizálás Forrás elemzés és modell generálás ETL generálás 2

A DW automatizálás helye az architektúrában Oracle IM & Big Data Referencia Architektúra Forrás: Oracle Information Management & Big Data Reference Architecture 3

Modell alapú DW tervezés/fejlesztés automatizálás DW tervezés automatizálás célja: Az adattárházak tervezésének támogatása Az adattárház specifikus modellezési elemek kezelése ETL tervezés jobb támogatása Fejlesztés automatizálás célja: DW fejlesztés gyorsítása Egyenletes, jó minőségű megoldás készítés támogatása Hatékony, jó minőségű ETL kód generálás Funkciócsoportjai Forrásmodell elemzés DW modell és ETL generálás 4

A kialakított megoldás funkcionalitása Adattárház modell generálás Data Vault módszertan szerinti modell (automatikus elemzés és tervezői beállítások alapján) Stage és DW szintű táblák Kulcsok (PK,FK,BK) és szekvenciák/identity oszlopok Alap metaadat oszlopok (auditálhatósághoz) Fizikai modell (Oracle, MSSQL) és névütközések feloldása ETL elemek/eljárások generálása Mapping (tábla, oszlop szintű) információk (impact/lineage) ETL view-k és SQL eljárások Format/control fájlok (fájl alapú töltésekhez) DW futtató keretrendszerhez szükséges metaadatok 5

DW modell és ETL tervezés támogatás Tervezői előnyök Jobb minőségű, átfogó, részletes tervek készítése Adatbázis és ETL tervezés egy helyen Beépített minőség-ellenőrzés Gyorsabb, hatékonyabb tervezés Kiemelt DW specifikus elemek DW best-practice választólisták Részletes dokumentáció generálás Testre szabható, egyszerűen bővíthető 6

DW modell és ETL tervezés támogatás Fejlesztői előnyök Gyors fejlesztést tesz lehetővé 1-2 hét alatt működőképes pilot/1.verzió készíthető Futtatható kód A generálás eredménye azonnal felhasználható Egységes, hibamentes és jól strukturált kód Rövidebb a funkcionális tesztelés Kisebb idő- és erőforrásigény Könnyű továbbfejleszteni, módosítani a generált kódot Teljeskörű DW modell és dokumentáció Hatás (impact) és lineage elemzés a teljes adatfolyamon 7

Miről lesz szó Adattárház automatizálás Hol alkalmazható a leghatékonyabban Célok, funkcionalitás, előnyök Data Vault modellezés a történetkezelt rétegben DW tervezés és fejlesztés automatizálás Forrás elemzés és modell generálás ETL generálás 8

Modell alapú adattárház generálás Data Vault (DV) módszertan áttekintése Lényege, hogy különválasztja az üzleti egyed azonosítókat (Hub) ezek kapcsolatait (Link) és az ezeket leíró adatokat (Satellite/Link Satellite) 9

Modell alapú adattárház generálás DV módszertan előnyei Teljes történetiségkezelést biztosít, auditálható A folyamatosan változó üzleti szabályok, kalkulációk akár visszamenőleges futtatásához is biztosítja az alapadatokat Megvalósítja a különböző forrású adatok integrációját Alkalmas extrém nagy adatmennyiség kezelésére, nagyfokú párhuzamosíthatóság a betöltéseknél Agilis fejlesztést, követést tesz lehetővé Könnyen bővíthető újabb forrásrendszerekkel, adatkörökkel Egyszerű, tipizálható, generálható ETL eljárások Gyors implementáció 10

Data Vault több forrás integrációja 11

Miről lesz szó Adattárház automatizálás Hol alkalmazható a leghatékonyabban Célok, funkcionalitás, előnyök Data Vault modellezés a történetkezelt rétegben DW tervezés és fejlesztés automatizálás Forrás elemzés és modell generálás ETL generálás 12

DV modell generálás Lépések áttekintése Interfészmodell összeállítása A forrásrendszerből kinyerendő adatelemek azonosítása => interfészspecifikáció => interfészmodell összeállítása Kiinduló forrásmodell beállítása, paraméterezése DV stereotype-ok beállítása az interfészmodellen DW réteg modellek előállítása IFACE, LANDING, STAGE modellek DV modell ETL generálás LANDING, STAGE, DV rétegek 13

DV modell generálás Interfészmodell 14

DV modell generálás Interfészmodell Miket kell azonosítani a forrásrendszer modellen: PK Primary Key, elsődleges kulcs BK Business Key, üzleti kulcs FK Foreign Key, idegen kulcs forrásrendszeri történetiségkövető attribútumok 15

Kiinduló forrásmodell előállítása: Manuális lépések Manuális átállítások, hogy a kívánt DV modell álljon elő HUB több kulcs - integráció hivatkozások használhatják a BK helyett a PK-t (pl. Product) SAT tervezés forrásrendszer / frissítási gyakoriság / karakterisztika jelleg szerint LNK tervezés melyik entitásból legyen HUB-ok és LNK-k (pl. SalesOrderDetail) melyik kapcsolatok kerüljenek egy LNK-be, melyek külön (pl. SalesOrderHeader) REF táblák jelölése (pl. ProductCategory) Forrásrendszeri történetet kezelő attribútumok jelölése a generált kód ősfeltöltő része fogja ezt felhasználni 16

DV modell generálás Kiinduló forrásmodell előállítása 17

DV modell generálás DW réteg modellek előállítása DV 18

DV modell generálás DW réteg modellek előállítása Az eredmény: Tábla struktúrák PK & BK kulcsok, driving key, referenciák (FK) Mappingek 19

ETL generálás Adatbázisobjektumok generálása ETL eljárások generálása Extraktáló eljárások Stage eljárások DV töltő eljárások ODS töltő eljárások 20

Generált ETL eljárás minta 21

További lehetőségek Üzleti nézetek (view), lehet akár materializált is 22

További Oracle specifikus lehetőségek A generálás eredménye: Tábladefiníciók kulcsokkal, szekvenciákkal PL/SQL kódok Az eredmény emiatt: bármilyen Oracle Edition alatt használható A rendelkezésre álló Oracle Edition függvényében: beállíthatók egyéb fizikai tárolási paraméterek (pl.: táblaterek, partíciók) RAC-on is futtatható további hozzányúlás nélkül Adatbázis parallel futtatási képessége is kihasználható 23

Összefoglalás Data Vault modellezés és DW automatizálás Alkalmazása: Klasszikus DW architektúrában elsősorban a történeti adattár rétegig 99%-ban azonnal használható generált adatmodell és ETL kódok A üzleti felhasználók által lekérdezhető DM réteghez ETL előkészíthető Előnyei: Agilis és rugalmas, a Data Vault miatt egy üzleti igény változása a lehető legkisebb módosítást vonja maga után Gyors reakció az üzleti igények kielégítésére Nagy teljesítmény, a magas fokú párhuzamosíthatóság miatt Jó minőségű, egységes kódok a template-ek és generálás miatt A kódok a rendelkezésre álló bármely Oracle Edition alatt használhatók, a választott Edition előnyeinek kihasználása mellett 24

Kérdések & válaszok zoltan.dobronte@datagovernance.hu 25

Bónusz Oracle DB Standard Edition (SE) és DW Adattárházhoz is használható az SE, de nincs: Parallel query Tömörítés Particionálás Bitmap index Mat.view query rewrite HeatMap Virtual Private Database (VPD) és Fine-grained Auditing (FGA) stb. 26

Bónusz Oracle DB Standard Edition 2 Szeptember elejétől van a DB 12.1.0.2 verzióval Standard Edition Two (SE2) A Standard Edition és Standard Edition 1 (SE/SE1) decembertől nem lesz és support/patch-ek is csak 2016. aug-ig Változtak a licenc feltételek: az SE2 ára az SE árával egyező (drágább mint SE1) minimum named user szám emelkedett: 5-ről (SE/SE1) 10-re (SE2 és ez szerverenként) max. 2 node (SE: 4node) és csak 1 foglalat/node RAC benne marad, de max. 2 foglalat (azaz pl. 2 node x 1 foglalat) csökkentett párhuzamos futás: max. 16 CPU thread (ha RAC, akkor 2x8) egy jó összefoglaló ábra: http://www.xynomix.com/oracle-standard-edition-2-what-you-need-know 27