ETL keretrendszer tervezése és implementálása. Gollnhofer Gábor Meta4Consulting Europe Kft.



Hasonló dokumentumok
HATÉKONY ETL FOLYAMATOK WORKSHOP

BEVEZETÉS AZ ADATTÁRHÁZ AUTOMATIZÁLÁSBA

Data Integrátorok a gyakorlatban Oracle DI vs. Pentaho DI Fekszi Csaba Ügyvezető Vinnai Péter Adattárház fejlesztő február 20.

ADATTÁRHÁZ MENEDZSMENT ÉS METAADAT KEZELÉS

Sikerünk kulcsa: az információ De honnan lesz adatunk? Palaczk Péter

DW/BI rendszerek kialakítása bevezetői szemszögből. Gollnhofer Gábor - Meta Consulting Kft.

Microsoft SQL Server telepítése

Adattárház tiszta alapokon Oracle Day, Budapest, november 8.

Oracle Enterprise Metadata Management

Teljeskörű BI megoldás a gyakorlatban IBM eszközök használatával, Magyarországon

Van-e ingyen-ebéd? Avagy mire elég a nyílt forráskodú Pentaho? Fekszi Csaba Ügyvezető október 4.

BI modul a lízing üzletágban márc. 21. Előadó: Salamon András

IIR Internal Audit 2011 Hogyan segítheti az IT háttér a hatékony kockázatkezelést?

Adattárház automatizálási tapasztalatok a Generali Biztosítóban

Oracle SQL Developer Data Modeler és a DW adatmodellezés. Gollnhofer Gábor Meta Consulting Kft.

VvAaLlÓóSs IiıDdEeJjȷŰű OoDdSs goldengate alapokon a magyar telekomban

Oracle GoldenGate Studio Nagyon rövid bemutató. Quick Talk. Gollnhofer Gábor

Fogalomtár bevezetése a Magyar Telekomnál

Új komponens a Talend Palettán: Starschema SAP Connector. Csillag Péter, Földi Tamás Starschema Kft.

I. RÉSZ. Tartalom. Köszönetnyilvánítás...13 Bevezetés...15

Vizuális adatelemzés - Gyakorlat. Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék

Folyamatok rugalmas irányítása. FourCorm Kft.

Újdonságok az AX2012-ben! Hauserné Kozák Veronika

Jogosultság-monitorozó rendszer kialakítása

Adatbányászat és Perszonalizáció architektúra

Az adatvagyon kezelés és a metaadatok. Gollnhofer Gábor DMS Consulting

KKV Adattárház. Presented to: Adattárház Fórum 2014 Date: Június 5, Presented by: Csippán János IT Director

Önkiszolgáló BI Az üzleti proaktivítás eszköze. Budapest,

Integrációs mellékhatások és gyógymódok a felhőben. Géczy Viktor Üzletfejlesztési igazgató

Petőfi Irodalmi Múzeum. megújuló rendszere technológiaváltás

Data Vault 2.0 és az Oracle DW/BD referencia architektúra. Gollnhofer Gábor Meta Consulting Kft.

Adattárház és BigData Szimbiózisa. Baranyi Szabolcs IM Technical Sales

Self service reporting fogások, technikák és megoldások controllereknek, nem csak Excel alapon

Tudásalapú információ integráció

Segítség, összementem!

Hogyan növelje kritikus üzleti alkalmazásainak teljesítményét?

Árki Kornél. IDC Business Intelligence Roadshow 2009

SAP BUSINESSOBJECTS PROFITABILITY AND COST MANAGEMENT (PCM) BEMUTATÁSA

Integráció az adatok szintjén

Kontrolling támogató rendszer bevezetése a NISZ-ben

MMK-Informatikai projekt ellenőr képzés 4

Crossplatform mobil fejlesztőkörnyezet kiválasztását támogató kutatás

BIRDIE. Business Information Reporter and Datalyser. Előadó: Schneidler József

TriDoc Easy document management

Amit mindig is tudni akartál a Real Application Testing-ről. Földi Tamás Starschema Kft.

Valós idejű megoldások: Realtime ODS és Database In-Memory tapasztalatok

Több mint BI (Adatból üzleti információ)

Személyügyi nyilvántartás szoftver

Döbrönte Zoltán. Data Vault alapú adattárház - Fél óra alatt. DMS Consulting Kft.

Infor PM10 Üzleti intelligencia megoldás

ProofIT Informatikai Kft Budapest, Petzvál J. 4/a

Az információ hatalom. adatok. információ

Alkalmazás technológiai frissítés migrációs és üzemeltetési tapasztalatok

Miért jobb az IdMatrix? Átállás más IdM rendszerekről

Adatbázis rendszerek 7. előadás State of the art

Pentaho 4: Mindennapi BI egyszerűen. Fekszi Csaba Ügyvezető október 6.

Enterprise extended Output Management. exom - Greendoc Systems Kft. 1

Az ErdaGIS térinformatikai keretrendszer

30 MB INFORMATIKAI PROJEKTELLENŐR INFORMATIKAI RENDSZEREK INTEGRÁCIÓJA INTEGRÁCIÓS TECHNOLÓGIÁK (LEGACY RENDSZEREK, ADATOK, TÖRZSADAT MENEDZSMENT)

ADATBÁZIS-KEZELÉS - BEVEZETŐ - Tarcsi Ádám, ade@inf.elte.hu

Integrált Kampánymenedzsment Rendszer kialakítása

S&T &T Unit Un is Magyar o szág szág Kf t november 5.

Rendszermodernizációs lehetőségek a HANA-val Poszeidon. Groma István PhD SDA DMS Zrt.

ELMÉLET ÉS GYAKORLAT

Big Data adattárházas szemmel. Arató Bence ügyvezető, BI Consulting

Adattárház kialakítása a Szövetkezet Integrációban, UML eszközökkel. Németh Rajmund Vezető BI Szakértő március 28.

Program verzió:

Seacon Access and Role Management

Műszaki dokumentációkezelés az ELO-ban Ajkai Elektronikai Kft. esettanulmánya

A Birdie riport készítő és terjesztő rendszer segíti. Megoldás: Birdie. A Birdie előnyei

VIR alapfogalmai. Előadásvázlat. dr. Kovács László

Speciális ügyfélkapcsolati igények Önkiszolgáló ügyfelektől az előfizető nyilvántartásig

FusionR EDM. Professzionális elektronikus dokumentumkezelés

<Insert Picture Here> Közeli jövőkép az üzleti intelligenciáról

Big Data az adattárházban

Nyílt forráskódú irodai programkomponensek vállalati környezetbe való integrációjának vizsgálata és implementációja

A webanalitika változó világa 4 felvonásban

Fekete Csaba Csongor Üzleti intelligencia vezető Citibank ZRt.

SDL Trados szervermegoldások. Szekeres Csaba SDL Trados partner M-Prospect Kft.

Kővári Attila, BI projekt

BI FÓRUM Üzleti Intelligencia Osztály Motto: szenvedélyünk az adat

Oracle9i Alkalmazás Szerver Üzleti folyamat integráció. Molnár Balázs Vezető értékesítési konzultáns Oracle Hungary

Nagyvállalati adatintegráció és adatkezelés

Lakossági Hitelkezelési Rendszer (LHR) ismertető

Titkok. Oracle adatbázisok proaktív es reaktív védelmi eszközei. Mosolygó Ferenc, vezetı technológiai tanácsadó. <Insert Picture Here>

IT Szolgáltatás Menedzsment az oktatási szektorban - 90 nap alatt költséghatékonyan

Név- és tárgymutató A, Á

RapidAnalytics Enterprise Edition bevezetés a Telenor Magyarországnál. Szakács Balázs - Telenor Magyarország Szücs Imre United Consult

Projektmenedzsment tréning

Agilis adattárház építés a gyakorlatban. Gollnhofer Gábor Meta4Consulting Europe Kft.

Üzleti folyamatok automatizálása

HecPoll a vezérlő rendszer

MICROSOFT DYNAMICS AX ÜZLETI ANALÍZIS

GDi Esri Magyarország Felhasználói Konferencia Timár Gábor: Konkurens adatfeldolgozás ArcGIS rendszerben

Data Governance avagy adatvagyon kezelés Rövid bevezető. Gollnhofer Gábor DMS Consulting

Ügyfél- és címadatok feldolgozása Talenddel


Data Governance avagy adatvagyon kezelés Rövid bevezető. Gollnhofer Gábor DMS Consulting

KnowledgeTree dokumentumkezelő rendszer

Informatikai alapismeretek Földtudományi BSC számára

Átírás:

ETL keretrendszer tervezése és implementálása Gollnhofer Gábor Meta4Consulting Europe Kft.

Tartalom Bevezetés ETL keretrendszer: elvárások és hogyan készítsük A mi keretrendszerünk Bevezetési tanulságok Készítsünk vagy vegyünk? Összefoglalás 2 DW Open 2013-2013.02.20.

Bevezetés Az adattárház sematikus felépítése, adatfolyamai Adatforrások Staging terület Történeti adattárház Felhasználói elérés Értékesítés Pénzügy Érkeztetés és transzformáció terület SF 1 Elemi történeti adattár (DW Data Warehouse) Témakör orientált adatpiacok (DM Data Mart) D 1 D 2 D 3 D 6 D 7 FACT 2 D 8 Fix és paraméterezett riportok Ad-hoc riportok, elemzések CRM Dokumentum kezelés SD 2 ST 3 FACT 1 D 4 D 5 D 1 D 3 D 1 D 5 D 6 Vezetői portál Adminisztráció, monitoring Külső adatok Gyártás Audit Trail Interfaces Mappings FACT 3 D 4 D 2 Kötelező jelentések Analitikus CRM Kézi adatforrások (xls, csv) Meta adatok META 1 META 2 Tulajdonosi riportok Data mining Mapping karbantartás Törzsadat karbantartás (master data) Metaadat karbantartás 3 DW Open 2013-2013.02.20.

Bevezetés - ETL alapok Mi az ETL? Honnan lehet szerezni ilyet? ETL? Extract, Transform & Load = kinyerés, átalakítás, betöltés ELT?, ELTL?, stb. Nemcsak DW, hanem egyéb adatintegrációs feladatoknál is Alapvető megoldási lehetőségek ETL eszköz használata Az összes adatbázis gyártónak van saját ETL eszköze: IBM (DataStage), MS (SSIS), Oracle (OWB, ODI), SAP (BODI), Talend, Pentaho, stb. Specialisták, csak ETL eszközt gyártanak: Attunity, Informatica, Wherescape, stb. Kézzel fejlesztett eljárások (SQL, Java, Perl, C, stb.) 4 DW Open 2013-2013.02.20.

Bevezetés - ETL alapok ETL funkciók Adatforrások, célok fájl (csv, xml, stb.), közvetlen adatbázis kapcsolat (natív, ODBC, JDBC, stb.), webservice, aszinkron kapcsolatok (messaging, replikáció) Elérési módok Push: adatforrás küldi az adatot, célrendszer csak fogadja Pull: a célrendszer olvassa ki az adatot, adatforrás csak biztosítja Frissítési módok batch, micro-batch, tranzakciós 5 DW Open 2013-2013.02.20.

Bevezetés - ETL alapok Fejlesztés, üzemeltetés támogatás Fejlesztés támogatás Intuitív felület, gyorsan elsajátítható Hatékony fejlesztést teszt lehetővé, moduláris, scriptelhető Csoportos fejlesztés támogatása, verziókezelés Impact és linage támogatás Üzemeltetés támogatás Több környezet támogatása (fejlesztői, teszt, éles) Folyamatok ütemezése, automatikus és kézi indítás, leállítás Monitorozás és statisztikák pl. mikor, mi futott, milyen eredménnyel 6 DW Open 2013-2013.02.20.

Tartalom Bevezetés ETL keretrendszer: elvárások és hogyan készítsük A mi keretrendszerünk Bevezetési tanulságok Készítsünk vagy vegyünk? Összefoglalás 7 DW Open 2013-2013.02.20.

Az ETL keretrendszerrel szembeni elvárások Funkcionális elvárások Tegye lehetővé a felsorolt ETL funkciók használatát Legyen rugalmas, könnyen kialakítható, módosítható, integrálható Legyen könnyen vezérelhető, karbantartható, monitorozható Legyen gyorsan bevezethető Technológiai elvárások Támogassa mind a kézi, mind az ETL eszközökkel való fejlesztést Legyen technológia független Op.rendszer, adatbázis, ETL eszköz, riporting eszköz Ne kerüljön sokba! 8 DW Open 2013-2013.02.20.

Hogyan készítsünk ETL keretrendszert? Követelmények pontosítása Támogatandó funkciók, környezet, eszközök Ne legyenek irreális elvárásaink! Inkrementális kialakítás Pl. inputok érkeztetése, ETL eljárások monitorozása, vezérlés Metaadat vezérelt megoldás legyen! Scope- és változáskezelés Folyamatosan jönnek az új ötletek, még mi kellene, stb. Dokumentáljunk Az ETL fejlesztőknek és üzemeltetőknek ismerni/használni kell a keretrendszert! 9 DW Open 2013-2013.02.20.

Tartalom Bevezetés ETL keretrendszer: elvárások és hogyan készítsük A mi keretrendszerünk Bevezetési tanulságok Készítsünk vagy vegyünk? Összefoglalás 10 DW Open 2013-2013.02.20.

A mi keretrendszerünk Felépítése 4 modul (Alap, Vezérlés, Monitorozás, Statisztika) Metaadat vezérelt Kb. 30 meta tábla, view-k és tárolt eljárások Standard függvény és eljárás hívásokkal érhető el Technológia független Élesben működő verziók: Windows és Linux op.rendszer; Microsoft SQL Server és Oracle adatbázis; MS Integration Services, OWB és kézi SQL eljárások A DW folyamatok teljes spektrumát képes lefedni Adatkinyeréstől a riport publikálásig Tetszés szerinti számú layert támogat (pl. forrásstage DW DM kocka riport) 11 DW Open 2013-2013.02.20.

A mi keretrendszerünk Extrák Lazán csatolt, aszinkron vezérlés Az adatok rendelkezésre állása, a beállított prioritások, az ETL eljárások függőségei (egymástól és adatoktól) alapján Paraméterben állítható párhuzamos futások Várható rekordszámok kezelése Az ETL futásoknál várható rekordszámok és a tényleges rekordszámok tárolása, összehasonlítása, elemzése Historikus elemzési lehetőségek Pl. mikor mi futott, mennyi ideig, mennyi adatot mozgatott Metaadatok karbantartása SQL függvény hívásokkal és/vagy Excel táblázatból Hátulról az ETL eszköz és az adatbázis saját metaadataiból 12 DW Open 2013-2013.02.20.

A mi keretrendszerünk ETL metaadatok feltöltése 13 DW Open 2013-2013.02.20.

A mi keretrendszerünk Futási statisztika 14 DW Open 2013-2013.02.20.

Tartalom Bevezetés ETL keretrendszer: elvárások és hogyan készítsük A mi keretrendszerünk Bevezetési tanulságok Készítsünk vagy vegyünk? Összefoglalás 15 DW Open 2013-2013.02.20.

Bevezetési tanulságok Készüljünk a nem tisztességesen viselkedő folyamatokra, ill. fejlesztőkre A keretrendszer, az ETL eszköz és az adatbáziskezelő metaadatainak szinkronizálása, keresztellenőrzése Automatizáljunk, amennyire lehet Induló metaadatok feltöltése hátulról (DB és/vagy ETL) ETL eljárások generálása (a megfelelő naplózással generálás és futás) Historikus metaadatok betöltése, importálása Sok munkát igényel, főleg az adatok konszolidálása, integrálása Jól kell ismerni a használt adatbázis kezelő és ETL eszköz metaadat lehetőségeit! 16 DW Open 2013-2013.02.20.

Tartalom Bevezetés ETL keretrendszer: elvárások és hogyan készítsük A mi keretrendszerünk Bevezetési tanulságok Készítsünk vagy vegyünk? Összefoglalás 17 DW Open 2013-2013.02.20.

Készítsünk vagy vegyünk? Vegyünk A komoly gyártók ETL eszközei elég jól felszereltek adminisztráció, metaadat kezelés, riportok témakörben Gyors, nem kell fejleszteni, csak integrálni Általában az ETL eszköz része (néha feláras kiegészítő) Készítsünk Teljesen a mi igényeinknek megfelelő lesz Nem homogén technológiák használata esetén előnyös Gyártó, technológia független megoldást szeretnénk (kezeli ha pl. ETL eszközt váltunk) Fejlesztést jelent, annak minden kockázatával és költségével 18 DW Open 2013-2013.02.20.

Tartalom Bevezetés ETL keretrendszer: elvárások és hogyan készítsük A mi keretrendszerünk Bevezetési tanulságok Készítsünk vagy vegyünk? Összefoglalás 19 DW Open 2013-2013.02.20.

Összefoglalás Lehet technológia független ETL keretrendszert építeni Mielőtt belekezdünk érdemes: Kitalálni, hogy mire akarjuk használni Megnézni az ETL eszközünk képességeit Körülnézni a piacon hasonló megoldások után Nekünk sikerült és nem bántuk meg 20 DW Open 2013-2013.02.20.

Kérdések? gabor.gollnhofer@meta4consulting.eu blog.adatmodellezes.hu 21 DW Open 2013-2013.02.20.