Adattárház alapú vezetői információs rendszerek



Hasonló dokumentumok
Adattárházak. Gajdos Sándor, TMIT ősz

Sikerünk kulcsa: az információ De honnan lesz adatunk? Palaczk Péter

BEVEZETÉS AZ ADATTÁRHÁZ AUTOMATIZÁLÁSBA

DW/BI rendszerek kialakítása bevezetői szemszögből. Gollnhofer Gábor - Meta Consulting Kft.

Adatbázisok analitikus környezetben. Adatbázisok elmélete 4. előadás Gajdos Sándor

Vezetői információs rendszerek

Adattárház tiszta alapokon Oracle Day, Budapest, november 8.

I. RÉSZ. Tartalom. Köszönetnyilvánítás...13 Bevezetés...15

ADATTÁRHÁZ MENEDZSMENT ÉS METAADAT KEZELÉS

Infor PM10 Üzleti intelligencia megoldás

Tudásalapú információ integráció

VIR alapfogalmai. Előadásvázlat. dr. Kovács László

Történet John Little (1970) (Management Science cikk)

Component Soft és tovább

VvAaLlÓóSs IiıDdEeJjȷŰű OoDdSs goldengate alapokon a magyar telekomban

Szolgáltatás Orientált Architektúra a MAVIR-nál

VÁLLALATI INFORMÁCIÓS RENDSZEREK. Debrenti Attila Sándor

Vállalati információs rendszerek I, MIN5B6IN, 5 kredit, K. 4. A meghirdetés ideje (mintatanterv szerint vagy keresztfélében):

Ami a vízesésen túl van

Adatbányászat és Perszonalizáció architektúra

A webanalitika változó világa 4 felvonásban

Oracle9i Alkalmazás Szerver Üzleti folyamat integráció. Molnár Balázs Vezető értékesítési konzultáns Oracle Hungary

DW 9. előadás DW tervezése, DW-projekt

Valós idejű megoldások: Realtime ODS és Database In-Memory tapasztalatok

Adatbázisrendszerek április 17.

Kővári Attila, BI projekt

A cloud szolgáltatási modell a közigazgatásban

Data Vault adatmodellezés.

Data Vault 2.0 és az Oracle DW/BD referencia architektúra. Gollnhofer Gábor Meta Consulting Kft.

Adatmodellezés. 1. Fogalmi modell

Több mint BI (Adatból üzleti információ)

Szoftveripar és üzleti modellek

Tartalom. Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben.

IT Szolgáltatás Menedzsment az oktatási szektorban - 90 nap alatt költséghatékonyan

Oracle SQL Developer Data Modeler és a DW adatmodellezés. Gollnhofer Gábor Meta Consulting Kft.

2011. November 8. Boscolo New York Palace Budapest. Extrém teljesítmény Oracle Exadata és Oracle Exalogic rendszerekkel

Projekt siker és felelősség

Név- és tárgymutató A, Á

Gazdasági informatika alapjai

ELMÉLET ÉS GYAKORLAT

Maradandó digitális transzformációk Oracle HOUG Konferencia 2018

30 MB INFORMATIKAI PROJEKTELLENŐR

ETL keretrendszer tervezése és implementálása. Gollnhofer Gábor Meta4Consulting Europe Kft.

SAS szoftverek felhasználási lehetőségei a felsőoktatásban

Autóipari beágyazott rendszerek Dr. Balogh, András

dimeb Dinet Logisztika Kft Technológia munkavédelmi szakembereknek és szolgáltatóknak. Hatékonyság - Minőség - Innováció.

Hatékony iteratív fejlesztési módszertan a gyakorlatban a RUP fejlesztési módszertanra építve

Szemléletmód váltás a banki BI projekteken

Döbrönte Zoltán. Data Vault alapú adattárház - Fél óra alatt. DMS Consulting Kft.

Segítség, összementem!

IRÁNYTŰ A SZABÁLYTENGERBEN

Adattárház kialakítása a Szövetkezet Integrációban, UML eszközökkel. Németh Rajmund Vezető BI Szakértő március 28.

Bevezetés: Mi a CRM? A tervezési fázis helye és szerepe a CRM implementációs projektekben Jógyakorlatok: mire figyeljünk a CRM tervezés közben.

Dr. Sasvári Péter Egyetemi docens

Van-e ingyen-ebéd? Avagy mire elég a nyílt forráskodú Pentaho? Fekszi Csaba Ügyvezető október 4.

Pentaho 4: Mindennapi BI egyszerűen. Fekszi Csaba Ügyvezető október 6.

ÉLET A FELHŐBEN - HATÉKONYSÁGNÖVELÉS CLOUD TECHNOLÓGIÁVAL. Baranyi Fanni Microsoft Online Szolgáltatások Értékesítési Szakértő

Papp Attila. BI - mindenkinek

Fogalomtár bevezetése a Magyar Telekomnál

Dr. FEHÉR PÉTER Magyarországi szervezetek digitális transzformációja számokban - Tények és 1trendek

ADATTÁRHÁZ HATÉKONYSÁGNÖVELÉS, REDUNDANCIA CSÖKKENTÉS Frunza Zsolt ÜZLETI INTELLIGENCIA A JÖVŐ, AHOGY MI LÁTJUK

Data Governance avagy adatvagyon kezelés Rövid bevezető. Gollnhofer Gábor DMS Consulting

Versenyelőnyszerzés az intelligens megoldások korában. Rehus Péter, SWG CEE, IS brand igazgató November 5.

Data Governance avagy adatvagyon kezelés Rövid bevezető. Gollnhofer Gábor DMS Consulting

Szabálykezelés a gyakorlatban

Teljeskörű BI megoldás a gyakorlatban IBM eszközök használatával, Magyarországon

Dr. Klein Lajos Richter Gedeon Nyrt.

MOBILITÁS VÁLLALATI KÖRNYEZETBEN MEGOLDÁS KONCEPCIÓ

Big Data az adattárházban

Self Service szekció. XXVIII. Budapesti Menedzsment és Controlling Fórum. Havas Levente. Budapest, május 26. IFUA Horváth & Partners

Önkiszolgáló BI Az üzleti proaktivítás eszköze. Budapest,

Copyright 2012, Oracle and/or its affiliates. All rights reserved.

1 Copyright 2011, Oracle and/or its affiliates. All rights reserved. Insert Information Protection Policy Classification from Slide 7

INFORMÁCI CIÓS ERŐFORRÁSOK ÉS RENDSZEREK

Mi a VoxCTRL? A JobCTRL különböző szolgáltatási területeiről érkezett hangrögzítési igényeknek megfelelően alakítottuk ki a VoxCTRL modult.

Árki Kornél. IDC Business Intelligence Roadshow 2009

A szoftver-folyamat. Szoftver életciklus modellek. Szoftver-technológia I. Irodalom

Seacon Access and Role Management

Konszolidáció és költségcsökkentés a gyakorlatban. Az Országos Tisztifőorvosi Hivatal Oracle adatbázis konszolidációja

Innovatív trendek a BI területén

KÖVETKEZŐ GENERÁCIÓS NAGYVÁLLALATI TARTALOMKEZELŐ MEGOLDÁSOK Stratis Kft. / Autonomy üzleti reggeli / Mezei Ferenc üzletág-igazgató

Az INSPIRE előírásai szerinti hazai téradatok szolgáltatásának, forgalmazásának megoldandó kérdései. GIS OPEN konferencia

Hogyan építsünk jó webáruházat? dr. Nyeste Gábor fps webügynökség ügyvezető

<Insert Picture Here> Közeli jövőkép az üzleti intelligenciáról

Logisztikai. ellátási lánc teljes integrálására. Logisztikai szolgáltatók integrációja. B2B hálózatokhoz a FLUID-WIN projektben.

BIRDIE. Business Information Reporter and Datalyser. Előadó: Schneidler József

Nagyvállalati térinformatika a Telenornál

A szak specializációi

MICROSOFT DYNAMICS AX ÜZLETI ANALÍZIS

Gazdálkodási modul. Gazdaságtudományi ismeretek II.

PMO Érettségi szint és versenyelőny. Kovács Ádám

Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése

Szolgáltatási szint és performancia menedzsment a PerformanceVisor alkalmazással. HOUG konferencia, 2007 április 19.

Üzleti tervezés. Kis- és középvállalkozások. Anyagi és pénzügyi folyamatok. Ügyvezetés I. és II. Értékesítés. Beszerzés 8. Raktár 7.

Mobil Üzleti Intelligencia

Üzleti és Közszolgálati informatika szakirányok. Tanszék

Vállalati folyamatok támogatása ELO-val Beszerzés management

Adattárházak. Méréstechnika és Információs Rendszerek Tanszék

KÖZPONTI OKOSHÁLÓZATI MINTAPROJEKT

Amit mindig is tudni akartál a Real Application Testing-ről. Földi Tamás Starschema Kft.

Átírás:

Adattárház alapú vezetői információs rendszerek Gajdos Sándor gajdos@tmit.bme.hu Adatbázisok haladóknak 2012. 2012. szeptember 11.

Bevezető Fő kérdések: Mitől lesz egy adattárház projekt sikeres? Mik a legfontosabb általános tudnivalók egy ilyen rendszerről? Szemléletváltás, szemléletformálás kritikus Más módszertan Más eredménytermékek Más technológia Nincs kitaposott út

Tartalom Adattárház fogalmak, elhelyezés Egy kis adattárház történelem Érettség megítélése Projekt előkészítése Adattárház architektúrák Dimenziós modellezés Az ETL egyes fontosabb kérdései

Alapfogalmak I. Adattárház (Inmon definíciója)

Alapfogalmak I. Adattárház, mint döntéstámogató eszköz helye Döntéstámogató rendszerek Kommunikáció-orientált Adat-orientált Dokumentáció-orientált Tudás-orientált Modell-orientált

Alapfogalmak II. Üzleti intelligencia (BI) (EPICOR, 2005): Az olyan tudás, amikor már a megtörténés pillanatában tudjuk, hogy mi folyik egy adott területen, birtokunkban vannak a tények a folyamatok megértéséhez, és megvan a képességünk, hogy gyorsan tegyünk is valamit, ha szükséges. The art of science of knowing what the heck is going on with your business as it is happening, having the facts to understand it and support it, and having the ability to quickly do something about it.

Üzleti intelligencia II. A gyakorlatban: Alapfogalmak II. Konzerv riportok Rendszeres riportok OLAP elemzések Ad-hoc lekérdezések Adatbányászat A felhasználószám csökken

A szükségletek hierarchiája (Maslow) Avagy: mi működteti az embereket A vállalatok rengeteg energiát ölnek abba, hogy fokozzák alkalmazottaik lelkesedését. Ez igazán szép tőlük, de nézzünk szembe a tényekkel - dolgozni nem jó. Ha az emberek annyira szeretnének dolgozni, ingyen is csinálnák. Azért kell megfizetni az emberek munkáját, mert a munka messze nem tartozik az elképzelhető legkellemesebb időtöltések közé. Az ésszerű vállalat tudja, hogy az alkalmazottak akkor lelkesednek a legjobban a munkájukért, ha segítünk nekik, hogy minél hamarabb abbahagyhassák azt. Scott Adams: Dilbert elv. SHL Hungary Kft. 2001 És mi működteti a vállalatokat?

Alapfogalmak III. OLTP vs. analitikus rendszerek Eddig: az adatbázis a világ egy hű leképezése, amely az aktuális állapotot tükrözi gyakori update Most: mikor mi volt a rendszer állapota? Milyen változások jellemezték? lekérdezésekre használják, a trendekre akarunk következtetni. Bármit le lehet kérdezni, de mit érdemes? Operatív dolgozók lekérdezései vezetők lekérdezései

Alapfogalmak III. OLTP vs. analitikus rendszerek II. Jellegzetes a dimenziós modellezés - a lekérdezés orientált megközelítés klasszikus módszere Tudni kell, hogy mit elemzek, minek a függvényében Tények Dimenziók Konform dimenziók fogalma, adattárház busz szerepe és jelentősége Vallásháborúk az alkalmazás módjáról A felhasználói réteg szinte mindig dimenziós

Alapfogalmak III. OLTP vs. analitikus rendszerek III. Aggregátumok Előre kiszámított, majd eltárolt lekérdezés eredménye, amely a tényadatokat összegzi a dimenziókban található hierarchiáknak megfelelően. Az adattárház teljesítménye kézben tartásának egyik leghatékonyabb eszköze Lehetséges aggregátumok száma általában igen nagy aggregátum menedzsment

Alapfogalmak IV. Metaadatok Adat az adatról Alapvetően befolyásolja a használhatóságot mind lekérdezhetőség, mind üzemeltethetőség szempontjából Fajtái: Technikai (pl. sémaadatok) Szemantikai (üzleti jelentések) Adminisztrációs (pl. betöltések adatai) Navigációs (pl. aggregátumdefiníciók)

Kis adattárház/döntéstámogatás történelem I. `60: batch riportok, papírkötegek nehéz a megfelelő adatot megtalálni egy nagy halom papírban, lassú a kérés kiszolgálása, nehéz az adatok további feldolgozása `70: terminál alapú rendszerek nehézkes felhasználói lekérdezések, gyenge felhasználói interfész, gyenge integráció az irodai szoftverekkel, adatforrások gyenge integrációja `80: PC alapú hozzáférés és EIS (Executive Inf. Systems) grafikus interfészek, de zavaros adatok, inkonzisztens kódok, bonyolult adatbázis sémák, kevés historikus adat `90: adattárházak megoldja a korábban nyitva maradt problémák legtöbbjét. Kezdetben kliens szerver megoldások, desktop OLAP, később web technológiák. `00: valós idejű rendszerek Minimális késleltetés, stratégiai mellett operatív döntéstámogatás is. `10: mobil hozzáférés Hozzáférés bárhonnan, bármikor, akár a legfrissebb adatokhoz/elemzésekhez

Kis adattárház történelem II. Megjelenés tipikus sorrendje: 1. Kereskedelem 2. Távközés 3. Pénzügyi szektor 4. Államigazgatás, költségvetési intézmények

Érettség megítélése Viszonylag magas a sikertelen projektek aránya Érettség objektív megítélése fontos Lakmusz teszt (több száz projekt tanulsága alapján, forrás: Kimball) Erős üzleti szponzor: 60 % Valós üzleti motiváció: 15% Technológia - üzleti vezetés partnersége: 5% Meglévő analitikus kultúra: 5% Különböző megvalósíthatósági szempontok: 15% Nem mindenható, de...

1. Adattárház megvalósítási módszertanok I. Hadden-Kelly HP Open Warehouse Oracle Warehouse Methodology Ralph Kimball-é SAS

Hadden-Kelly

Ralph Kimball módszertana

1. Adattárház megvalósítási módszertanok II. Konklúzió: általános jellemző a fázisok definiálása és az iteratív szemlélet Előnyei: 1. Megvalósítási kockázat csökkentése 2. Megvalósult részek korábbi kiaknázása 3. Humán erőforrások egyenletesebb terhelése 4. Hasznosulás mértékének növekedése a fokozatos rendszerbeállítással 5. Lehetőség a megrendelői oldal fokozatos bevonására a megvalósításba Hátránya: Valamivel nagyobb átfutási idő, ill. ráfordításigény

2. Kezdeti munkamegosztás a megrendelő és szállító szervezet között Ha a megrendelői oldal vállalja az... üzleti igények részletes specifikálását: élőmunka-igényes, spec. erőforrásokat igényel, de + csökkenti mindkét oldal kockázatát, így a vállalási árat. adatforrások felmérését, adatok minőségbiztosítását: spec. erőforrásokat igényel, jelentős ráfordításigényű + csökkenti a megrendelői oldal kockázatát

Projekt előkészítése II. Konklúzió: minél pontosabban érdemes tudni, hogy Mit (üzleti igények meghatározása) Miből (forrásadatok felmérése, minőségbiztosítása) (Hogyan (technológiai elvárások)). Ezek eldöntése is rábízható a szállítóra, de ez növeli a projekt kockázatát (idő, szkóp bizonytalanság) a szállítói kockázattal együtt növeli a költségeket.

Projekt előkészítése III. Milyen követelményeket fogalmazzunk meg az adattárházzal kapcsolatban? Teljesítmény Meghatározott elemző eszközök támogatása Skálázhatóság Adatbiztonság Működés biztonság Egyszerű karbantartás (ld. fenntartási költségek)

DW architektúrák Rendszertervezési döntés, amely általában nem könnyen változtatható meg Fontosabb szempontok, amiket figyelembe kell venni. Mire jók a különböző architektúrák? Kommunikáció Tervezés Tanulás Hatékonyságnövelés és újrahasznosítás

Architektúrák Koncepcionális architektúra Adat(konzisztencia) architektúra Front-end architektúra és back-end architektúra Eszközarchitektúra (HW, SW) Üzemeltetési architektúra Biztonsági architektúra...

Koncepcionális architektúra főbb elemei forrásrendszerek adatkinyerés-integrálás állomásoztató terület (staging area, SA) elemi adattár (detailed storage, DS) szakterületi adattár (data mart) metaadattár (üzemi adattár (operational data store, ODS)) megjelenítés támogatás

Koncepcionális architektúra főbb fejlődési fázisai Nem tervezett döntéstámogatás Szemantikailag integrált szakterületi adattárak Virtuálisan integált szakterületi adattárak Függő szakterületi adattárak (hub and spoke architektúra)

Külső adatforrások Nem tervezett döntéstámogatás Metaadat Piaci részesedés 1. operatív adatforrás Ügyfelek n. operatív adatforrás Megrendelések n+1. operatív adatforrás Elosztás Kinyerő transzformáció Kinyerő transzformáció Kinyerő transzformáció Szakterületi adattár Értékesítés és marketing Metaadat Szakterületi adattár A megrendelés életciklusa Metaadat Szakterületi adattár Elosztás Hozzáférési jelentés eszközei Böngésző OLAP/ROL adatok EIS/DS App. 4GL

Külső adatforrások Metaadat Szakterületi adattárak szemantikai integrálása Piaci részesedés 1. operatív adatforrá s Ügyfelek n. op eratív adatforrá s Rendelése k OLT P Szemantikai integrálási folyamat Szakterületi adattár Értékesítés és marketing Metaadat Szakterületi adattár M egrendel és él etc iklusa Metaadat Szakterületi adattár Értékesítés Értékesítés Web böngésző Adatbányászat ROLAP/OLAP EI S/DSS Riportok Hozzáféré s (API-k, Middlewar e) Elosztás Elosztás

Piaci részesedés 1. operatív adatfor rás Ügy fel ek n. operatív adatfor rás Megrende lése k n+1. operatív adatfor rás Külső Adatforrások Szemantikai integr ációs folyamat Metaadat Szakterületi adattá r Értékesítés és ma r ke ting Megrendel és életciklusa Metaadat Szakterületi adattár Metaadat Szakterületi adattár Virtuálisan integrált szakterületi adattárak M I D D L E W A R E Web böngésző Adatbányászat ROLAP/OLAP EIS/DSS Riportok Hozzáférés (API-k, Middleware) Metaadat Elosztás Elosztás Adattárház-adminis ztráci ó

300 250 200 150 100 50 0 300 250 200 150 100 50 1 2 3 4 5 6 7 8 0 2 3 4 5 6 7 8 Piaci részesedés 1. operatív adatforrás Ügyfelek n. operatív adatforrás M egr endel ések n+1. operatív adatforrás Elosztá s Külső adatforrások Szeman tikai és fizikai integrálás Interme diate Data Store Közbülső adattár Függő szakterületi adattár (hub-and-spoke architektúra) Részletes Adattárház Metaadat Szakterületi adattár Hál ózat Metaadat Szakterületi adattár Pénzügy Metaadat Szakterül eti adattár Mark eti ng Web böngésző Adatbányászat ROLAP/OLAP 4GL eszközök EI S/DSS Riportok Hozzáférés (API -k, Mi ddl eware) Értékesítés Értékesítés

Dimenziós modellezés Dimenziós modellezés előnyei: lekérdezése könnyen optimalizálható a modell bővítése viszonylag egyszerű laikusok által is könnyen lekérdezhető

Négylépéses dimenziós modellezés 1. Üzleti folyamat azonosítása 2. Tényadat granularitásának megválasztása 3. Dimenziók azonosítása 4. Tények azonosítása

1. Üzleti folyamat izolálása Példák: szolgáltatás használata, hitelek igénylése és felvétele, bevételek alakulása, kinnlevőségek, rendelések személyzeti ügyek számlázás javítások és reklamációk, stb.

2. Tényadat granularitásának megválasztása milyen részletes adatok tárolását támogatjuk túl részletes: sok adat, nagy diszkigény, nagy CPU igény (különösen a betöltések során) nem elég részletes: elemzéseket akadályozhat meg

3. Dimenziók azonosítása Mi alapján akarjuk rendezni, lekérdezni, csoportosítani a tényadatokat? Sok és részletes dimenzió - változatosabb analízisek Dimenziók azonosítása szigorúan az adatok használata (ld. üzleti igények) alapján Dimenzió lesz minden, ami... Inkább szöveges attribútumok, de lehet numerikus is

4. Tények azonosítása Az elemzendő mennyiségek konkrét meghatározása (pl. eladási ár Ft-ban, darabszám, átlagos kisker. ár, ) Általában folytonos értékkészletűek és numerikusak.

Dimenziós tervezési elvek Pontosan ismerni és érteni az adatokat Dimenziós táblák: leíró attribútumok, akár 50 is, a rekordok hossza kevéssé kritikus. Ténytáblák: a rekordok legyenek rövidek Konform dimenziókban gondolkodunk Minden dimenziónak legyen surrogate (anonym, kiegészítő, jelentés nélküli, mesterséges) kulcsa.

Surrogate kulcs Előnyei: méretcsökkentés a ténytáblában forrásrendszeri kulcs változásaitól függetlenek leszünk az entitások időbeli változásait is le tudjuk így írni Hátránya: újra kell kulcsolni a tény és dimenziós rekordokat (jelentős betöltési többletteher)

Dimenziós tábla tervezés A felesleges dimenziók teljesítményveszteséget eredményeznek. A dimenziós adatok nem feltétlenül nyerhetők ki valamely forrásrendszerből. Az idő, termék, hely, ügyfél a leggyakoribb dimenziók

Állapot- és esemény-tények Esemény-tény: egyetlen időponthoz kapcsolódik Állapot-tény: két időpont (kezdete, vége) Új tényrekord beszúrása egy másik lezárásával jár alacsonyabb hatékonyság valószínűbb információvesztés (ld. később) Általában egymásba átalakíthatók Kik, mikor, hol, mit, stb. vásároltak Kik azok a vásárlók, akiknek van Melyek azok a termékek, amelyeket eladtak A lekérdezések hatékonysága erősen különböző!

Ha a dimenzió is változik idővel ( slowly changing dimensions, SCD) Pl. az valaki költözik, címe megváltozik 1. régi rekord felülírása 2. old mező képzése a dim. táblában 3. új rekord a dim. táblában a surrogate kulcs új értékével