Adattárházak. Fekete Zoltán. BI&W termékmenedzser Oracle Hungary



Hasonló dokumentumok
Adatbányászat és Perszonalizáció az Oracle9i-ben

Az Oracle 9i Platform az. e-üzleti Intelligencia. szolgálatában. Radnai Szabolcs. BI&W üzletág vezető Oracle Corporation

Adatbányászat az Oracle9i-ben. Fekete Zoltán vezető termékmenedzser

Adatbányászat és Perszonalizáció architektúra

Sikerünk kulcsa: az információ De honnan lesz adatunk? Palaczk Péter

Microsoft SQL Server telepítése

BI megoldás a biztosítói szektorban

Oracle adatbányászati platform. Fekete Zoltán vezető termékmenedzser

<Insert Picture Here> Közeli jövőkép az üzleti intelligenciáról

Infor PM10 Üzleti intelligencia megoldás

Oracle Enterprise Manager: Az első teljesértékű felhő üzemeltetési megoldás

Palaczk Péter A marketing folyamatok adattárház alapú támogatása

Üzleti intelligencia - eszközöktől a megoldásokig

Vezetői információs rendszerek

I. RÉSZ. Tartalom. Köszönetnyilvánítás...13 Bevezetés...15

ADATBÁZIS-KEZELÉS - BEVEZETŐ - Tarcsi Ádám, ade@inf.elte.hu

webalkalmazások fejlesztése elosztott alapon

SAP BUSINESSOBJECTS PROFITABILITY AND COST MANAGEMENT (PCM) BEMUTATÁSA

SAS Enterprise BI Server

Adatbázisrendszerek április 17.

A webanalitika változó világa 4 felvonásban

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

Data Vault 2.0 és az Oracle DW/BD referencia architektúra. Gollnhofer Gábor Meta Consulting Kft.

Vállalati információs rendszerek I, MIN5B6IN, 5 kredit, K. 4. A meghirdetés ideje (mintatanterv szerint vagy keresztfélében):

BEVEZETÉS AZ ADATTÁRHÁZ AUTOMATIZÁLÁSBA

Valós idejű megoldások: Realtime ODS és Database In-Memory tapasztalatok

Tartalom. Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben.

Big Data az adattárházban

Analitikus CRM. Radnai Szabolcs

Amit mindig is tudni akartál a Real Application Testing-ről. Földi Tamás Starschema Kft.

Segítség, összementem!

BI modul a lízing üzletágban márc. 21. Előadó: Salamon András

Data Integrátorok a gyakorlatban Oracle DI vs. Pentaho DI Fekszi Csaba Ügyvezető Vinnai Péter Adattárház fejlesztő február 20.

ADATTÁRHÁZ MENEDZSMENT ÉS METAADAT KEZELÉS

Component Soft és tovább

Oracle9i Alkalmazás Szerver Üzleti folyamat integráció. Molnár Balázs Vezető értékesítési konzultáns Oracle Hungary

A tudás handrendbe állítása, azaz SPSS PES

Adattárház kialakítása a Szövetkezet Integrációban, UML eszközökkel. Németh Rajmund Vezető BI Szakértő március 28.

Papp Attila. BI - mindenkinek

Újdonságok az AX2012-ben! Hauserné Kozák Veronika

Van-e ingyen-ebéd? Avagy mire elég a nyílt forráskodú Pentaho? Fekszi Csaba Ügyvezető október 4.

The Power To Develop. i Develop

Klotz Tamás earchitect Oracle

<Insert Picture Here> Teljeskörűen modernizált HR rendszer a Szerencsjáték Zrt-nél

Gazdasági informatika alapjai

Fekete Csaba Csongor Üzleti intelligencia vezető Citibank ZRt.

Konszolidáció és költségcsökkentés a gyakorlatban. Az Országos Tisztifőorvosi Hivatal Oracle adatbázis konszolidációja

Tudásalapú információ integráció

Pentaho 4: Mindennapi BI egyszerűen. Fekszi Csaba Ügyvezető október 6.

VIR alapfogalmai. Előadásvázlat. dr. Kovács László

Globális trendek lokális stratégiák. Kovács András

Oracle SQL Developer Data Modeler és a DW adatmodellezés. Gollnhofer Gábor Meta Consulting Kft.

Self service reporting fogások, technikák és megoldások controllereknek, nem csak Excel alapon

2011. November 8. Boscolo New York Palace Budapest. Extrém teljesítmény Oracle Exadata és Oracle Exalogic rendszerekkel

Multimédiás adatbázisok

IT trendek és lehetőségek. Puskás Norbert

I. CRM elmélete és gyakorlata. II. Stratégiai elemek. III. Strukturális megoldások

Az információ hatalom. adatok. információ

VvAaLlÓóSs IiıDdEeJjȷŰű OoDdSs goldengate alapokon a magyar telekomban

Virtuális Obszervatórium. Gombos Gergő

Az indexelés újdonságai Oracle Database 12c R1 és 12c R2

Adattárház tiszta alapokon Oracle Day, Budapest, november 8.

IBM SPSS Modeler 18.2 Újdonságok

Ágazati Vezetői Információs Rendszer koncepciója

ÜZLETI I TELLIGE CIA - VIZUALIZÁCIÓ

Big Data adattárházas szemmel. Arató Bence ügyvezető, BI Consulting

Adattárház és BigData Szimbiózisa. Baranyi Szabolcs IM Technical Sales

<Insert Picture Here> Az archiválás megközelítése az ILM felől (Information Lifecycle Management)

Testreszabott alkalmazások fejlesztése Notes és Quickr környezetben

Web-fejlesztés NGM_IN002_1

Név- és tárgymutató A, Á

CMDB architektúra megjelenítése SAMU-val Rugalmas megoldás. ITSMF Bekk Nándor Magyar Telekom / IT szolgáltatás menedzsment központ

ETL keretrendszer tervezése és implementálása. Gollnhofer Gábor Meta4Consulting Europe Kft.

Self Service szekció. XXVIII. Budapesti Menedzsment és Controlling Fórum. Havas Levente. Budapest, május 26. IFUA Horváth & Partners

A hierarchikus adatbázis struktúra jellemzői

Mosolygó Ferenc értékesítési konzultáns

Oracle E-Business Suite auditok tapasztalatai. Gáspár Gyula Senior Manager Oracle License Management Services, Central Europe április 6.

Adattár. Adattár. Elemzések, modellezés. Adatszolgáltatás

Szolgáltatás Orientált Architektúra a MAVIR-nál

GE ITSG Industrial Technology Services Group

Kővári Attila, BI projekt

Az alábbiak közül melyek a vállalati stratégia típusok?

Változások előtt hol áll a banki (adat)elemzés? Nándorfi György

Célkitűzések Az Oracle10 g felépítésének, használatának alapszíntű megismerése

Alkalmazásokban. Dezsényi Csaba Ovitas Magyarország kft.

Seacon Access and Role Management

Hatékony csoportmunka

BI kicsiknek és nagyoknak

Döbrönte Zoltán. Data Vault alapú adattárház - Fél óra alatt. DMS Consulting Kft.

Több mint BI (Adatból üzleti információ)

Vizuális adatelemzés - Gyakorlat. Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék

Hogyan növelje kritikus üzleti alkalmazásainak teljesítményét?

Exadata, a világ leggyorsabb adatbázisgépe

Versenyelőnyszerzés az intelligens megoldások korában. Rehus Péter, SWG CEE, IS brand igazgató November 5.

VÁLLALATI INFORMÁCIÓS RENDSZEREK. Debrenti Attila Sándor

Fejlesztés, működtetés, felügyelet Hatékony infrastruktúra IBM szoftverekkel

Jogosultság-monitorozó rendszer kialakítása

Teljeskörű BI megoldás a gyakorlatban IBM eszközök használatával, Magyarországon

április 24. INFO Savaria április 24. INFO Savaria április 24. INFO Savaria

Integrált Kampánymenedzsment Rendszer kialakítása

Átírás:

Adattárházak Fekete Zoltán BI&W termékmenedzser Oracle Hungary

Adattárházak Bevezetés Oracle infrastruktúra A betöltési oldal - ETL Jelentések OLAP Adatbányászat

Üzleti környezet A kihívások... Dereguláció Technológiai lehetoségek Globalizáció Piac ismeret Az üzletmenet megértése Verseny Rövid ideig fennálló versenyelonyök Ügyfél lojalitás változása

Adattárház Az üzlet a vállalat versenyképességének növeléséhez kéri az informatika hozzájárulását Több információt igényel az ügyfelekrol, piacokról és ugyanakkor a belso muködésrol is Integráltságot követel meg, egy alapvetoen funcionalitás és üzletágak szerint széttagolt informatikai környezetben

Rakjuk össze az adatokat Adat és tudás INTEGRÁCIÓ sok adat egy forrás mindenkinek Ido! Infrastruktúra BI alap

Adattárház elemzésre optimalizált, nem tranzakciókra Terület orientált témákra koncentrál Integrált sok forrás, konzisztens formátum Nem változékony ami bekerült, nem változik Idoben változó hosszú idon át gyujtött adatok

Adattárház, elemzésre optimalizált OLTP Komplex adatstr., 3NF Kevés Indexek Adattárház Többdimenziós adatstr. Sok Sok Join-ok Néhány Normalizált Duplikált adat Denormalizált Ritka Származtatott, aggregált adat Gyakori

OLTP Jól tervezheto Gyakori módosítás Normalizált Bevitel, kis keresések Hetek, hónapok Terhelés Adat módosítás Séma Muveletek Történeti adatok Adattárház Ad-hoc, rugalmas Betöltés ütem. Felh. nem mód. Nem / részben normalizált Nagy keresések Idosorok, trendek

Csillag séma

Az Oracle infrastruktúra

Új üzleti intelligencia irányvonal Oracle 9i az E-üzleti intelligencia alapja Operatív adat E-Business Intelligencia csomag Oracle9i Reports Discoverer Web adat Warehouse Builder ETL Infrastructure and OLAP Services and Data Mining 9i Application Server BI Beans Külso adat Portal CWM Metadata

Oracle9i az e-üzleti intelligencia platformja

Oracle9i Database egyetlen üzleti intelligencia adatszerver Relációs ETL OLAP Adatbányászat M e t a d a t a

Oracle9i Alkalmazás szerver Futtatja az összes üzleti intelligencia lakalmazást Portál M e t a d a t a Lekérdezés és Jelentéskészítés BI komponensek Webhely elemzés

ETL Extraction, Transformation, Load

Oracle Warehouse Builder Tervezés és alkalmazás automatizálás 2 A cél DW tervezése 3 Forrás és cél összekapcsolása 1 Forrás def. 4 5 Kód generálás Warehouse létrehozása Relational Files Legacy Applications Oracle9i 6 Adatkinyerés és transzformáció

Oracle Warehouse Builder 3i Kiterjesztett tervezési környezet Fejlesztett mappelés Többlépcsos Több cél tábla Kifejezés építo (Expression Builder) Transzformációs elemkészlet Komplex text források feldolgozása PL/SQL visszafejtés

ETL Infrastruktúra 9i egy eroteljes transzformációs motorrá válik Adat változás érzékelés Külso táblák Tábla függvények Multi-tábla insert Upsert Felfüggesztett parancsvégrehajtás Párhuzamos adat pipeline Oracle9i ETL Infrastruktúra

Külso táblák Külso adatok mint adatbázis táblák jelennek meg metaadat definiálás DDL utasításokkal adatbázisból közvetlenül elérheto SQL, PL/SQL, Java nyelveken nincs szükség ideiglenes tárolásra (staging) állományok párhuzamos feldolgozása szükségtelenné teszi az állományok felszabdalását Csak olvasásra alkalmasak, nem indexelhetok

Tábla függvények stage 1 stage 2 T 1 T 2 forrás Transzformáció köztes tárolókkal Helyette... cél T 1 T 2 T 1 T 2 forrás T 1 T 2 cél Adatcsövezett, párhuzamos transzformáció

Lekérdezési teljesítmény The best approach for every query integrált átfogó Materialized Views Parallel Operations Query Optimizer Partitioning Index & Join Methods

Mi a Particionálás Tulajdonságok Táblák és indexek kisebb, jobban menedzselheto részekre bonthatóak. Haszon Menedzselhetoség: oszd meg és uralkodj technika a nagy objektumok kezeléséhez Teljesítmény: : partíció kihagyás Elérhetoség: : partíció függetlenség Transzparens s az alkalmazásoknak Jan Application SQL Sales Feb Mar CREATE TABLE sales (sales_id NUMBER, time_idid DATE, customer_id NUMBER, product_id NUMBER, sales_amountamount NUMBER) PARTITION BY RANGE (time_id) (PARTITION jan00 VALUES LESS THAN '01-FEB-2000', PARTITION feb00 VALUES LESS THAN 01-MAR-2000', PARTITION mar00 VALUES LESS THAN '01-APR-2000');

Jelentések, adatelemzés

Az adattárház felhasználása Eltolódás a magasabb hozzáadott érték felé Stratégiai Üzleti intelligencia Elemzés Menedzselt Ad Hoc lekérdezés Kivételkeresés Reaktív Jelentéskészítés

Önkiszolgáló adatpublikálás Lekérdezett adatok átadása az Expressnek Lefúrás a Discovererbe Discoverer Lekérdezés definiciók átadása a Reportsnak Express Adatbányászat Jelentések készitése az Express adataiból Reports

Standard és ad-hoc jelentések Melyik a 10 legnyereségesebb vásárlónk 2001. szeptemberben? Melyek azok a területek, ahol a legmagasabb a terv-tény eltérés? Mi volt az értékesítés megoszlása csatornák szerint? Kik azok a szállítók, akik idoben szállítottak és nem merült fel minoségi probléma? Hogyan alakultak a mérési veszteségek az elmúlt évben és mi volt a megoszlásuk?...

Oracle 9i AS Üzleti Intelligencia Lekérdezés és jelentéskészítés Portál Jelentéskészítés és lekérdezés BI komponensek Web Lap elemzés Oracle9i AS Discoverer Egyszeruen használható lekérdezo és elemzo eszköz nagy teljesítmény igényekre Reports Hatékony vállalati jelentéskészíto megoldás internetes és hagyományos adatpublikálásra

Oracle9iAS Reports Alkalmazás szerver alapú jelentéskészítés Kiterjedt információ publikálás Browser Email Wireless A jelentések dinamikusan készülnek a szerveren Batch idozítés Kimeneti cache Futásideju tesreszabás (XML) Web Listener 9iAS Reports Engine Engine Engine Multi Tiered Server Engine

Discoverer Ad-hoc lekérdezés és elemzés az IAS-ban 9iAS Internetes kliensek: Discoverer Viewer: HTML kliens támogatás Szélesköru felhasználásra Discoverer Plus: Pure Java, Firewall támogatás Power User számára Admininisztrátor EUL metaadat elokészítés az IDS része Discoverer Plus Discoverer Viewer

On-line Analytical Processing OLAP

OLAP követelmények Hagyományos elemzo alkalmazások Komplex analitikus lekérdezések és tervezés Azonnali válaszok Nagy számú konkurens felhasználó On-line üzleti intelligencia követelmények Nagymértékben skálázható Nyílt elérés Menedzselhetoség

Többdimenziós adatbázis - Az adatelemzési és tervezési szempontok, azaz dimenziók: projektek,termékek, alapanyagok, szervezeti felépítés, kategória (fokönyvi sorok), ido - A dimenziók elemei hierarchiákba csoportosíthatók (pl. év-negyedév-hónap). - A dimenziókra adatkockák és üzleti modellek épülnek. - Származtatott értékek. Termék Szervezet - Riport, grafikon, munkalap. termelési terv Idoszak Termék

Multidimenziós tárolás A végfelhasználók saját logikai nézete Termék manager nézete Szervezet Telep 3 Telep 2 Telep 1 Termék Termék1 Termék2 Termék3 Termék4... Telephely igazgató nézete Q1 Q2 Q3 Q4 Idoszak ügyintézo nézete Pénzügyi igazgató nézete

Az adatok egyszeru lépésekkel választhatók ki Több hierarchia Lefúrási lehetoség Kiválasztás szint, tulajdonság, család alapján Kivételkeresés Legjobb n, legrosszabb n Egyezéses kiválasztás

Felhasználói infrastruktúra Biztonság Elérési jogok Adatelosztás Elore definiált jelentések Ad-hoc elemzések Web, adatbevitel is

Oracle Financial Analyzer

Oracle Financial Analyzer: szélesköru kontrolling funkciók Elemzés Döntési forgatókönyvek ( Mi lenne ha elemzés ) Idosoros elemzés, trend felállítás, mutatók Tervezés Null és bázis tervezés Fentrol le, lentrol fel tervezés Gördülo tervezés Terv változatok, összehasonlítás Ellenorzés Egyszeru terv-tény-elorejelzés összehasonlítás Kivétel keresés OFA-Fokönyv kapcsolat

Az OLAP alap: Express Server

Express Server Az Oracle Express a világ legskálázhatóbb és leggyorsabb OLAP szervere. Az Express APB-1 OLAP világcsúcsot meg sem közelítik más szállítók. Lekérdezés, számítás, aggregálás...

OLAP hátrányok ma Multidimenziós adatbázis Replikált adat Többlet adminisztráció Elérhetetlen az SQL kliensek számára Korlátozott skálázhatóság Relációs adatbázis Részbeni OLAP megoldás

OLAP Services Mi ez, és mit csinál? Elemzo függvényeket és kalkulációkat ad az adatbázishoz Multimenzionális moldell biztosít Túlmutat az SQL lehetoségein Fejlesztési platformot biztosít az elemzo alkalmazások számára Adat kezelést, API felületet és fejleszto eszközöket biztosít Nem csak egy back end adatbázis szolgáltatás

Analitikus alkalmazás platform Oracle Business Intelligence Beans Gyors alkalmazás fejlesztés Elemzésre kész Oracle9i OLAP Services Oracle9i Java OLAP API Predictive analysis functions Skálázható adattár Integrált meta adatok Summary management SQL elemzo függvények

Oracle9i OLAP Services Business Intelligence Beans OLAP Services Java OLAP API Metadata Provider SQL Generator Query Processor Multidimensional Engine Metadata Provider Metadata Data Data Metadata Oracle Relational Database Data Warehouse - Query and Reporting Analytic Workspace Forecasts Models Allocations Consolidations Scenarios Custom Functions

Adatbányászat

Mi az adatbányászat? Röviden, az adatbányászat rejtett minták és kapcsolatok feltárása az adattömegben, a jobb üzleti döntések elosegítésére -- Robert Small, Two Crows

Adatbányászati feladatok Az ügyfél viselkedés megértése Sok adat gyors vizsgálata Jobb modellek építése BI létrehozás CRM adatok elemzése Az ügyfél kapcsolatok javítása

Adatbányászattal integrált megoldások Az adatokban rejtett információ gyors felszínre hozása Az Oracle adatbányászat prediktív és klasztering komponensei a részletes adatokból adnak információt Teljessé teszi az adattárház megoldásokat Növeli az IT infrastruktúra értékét és csökkenti a megtérülés idejét

Egy példa - tanuljunk a múltból Az adattárházból: válogassuk le az összes (leíró és viselkedési) részlet adatot az elozo évben elvándorolt ügyfelekrol Használjunk adatbányászatot: milyen közös jellemzokkel rendelkeznek ezek az (volt) ügyfelek és súlyozzuk az egyes jellemzoket az elvándorlás szempontjából Használjunk kampány menedzsment eszközöket: válogassuk le jelenlegi ügyfeleink közül azokat, akik megfelelnek a felismert (elvándorló) tulajdonsághalmaznak - hiszen ok esélyesek az elvándorlásra - és indítsunk akciót ezen ügyfelek lojalitásának növelésére

Döntési fák Fák (gráf) az adatösszefüggéseket szemléltetik Statisztikai módszerek alapján épülnek fel Tipikus alkalmazások Vásárlók / válaszolók Hibázók / csalók / elvándorlók Jövedelem > 80,000 Ft/hó Nem Igen Akt. munkahely > 5 év Magas tartozás Igen Nem Igen Nem Alacsony k. Nagy k. Nagy k. Alacsony k. Hiteligénylési kockázat becslése

Neurális hálózatok Az idegrendszer biológiai komplexitását az idegsejtek kapcsolatait hivatott modellezni Fekete doboz, A modellek nehezen szemléltethetoek Lineáris és nem lineáris problémákat is képes modellezni Kezelni kell a túltanulást 1 W 13 W 23 W 14 3 W 36 W 15 4 W 46 6 2 W 24 W 25 5 W 56

Modell típusok Klasszifikációs és regressziós fák (C&RT) Klasszifikáció és predikció bináris, többosztályú és folytonos változókra Csökkenés függvények: gini és entropy Nyeso függvények: cost és gini Maximum csúcs szám és suruség függvények a fa méret szabályozáshoz Eloszlás és költség opciók Neurális hálózatok Egyszeru tanítás, tanítás és tesztelés, kereszt-validálás Tanítás és teszteléshez automatikus megállás Klasszifikáció és predikció bináris, többosztályú és folytonos változókra Aktivációs függvények: sigmoid, hypertangent és linear Tanítási algoritmusok: conjugate gradient, modified Newton, steepest descent, backpropagation és genetikus algoritmus neurális hálózatok optimizálásához Cost függvények: square, pnorm és information divergence k-legközelebbi szomszédok (Memória alapú dönt.) Tanítható k-legközelebbi szonszédok Klasszifikáció és predikció bináris, többosztályú és folytonos változókra Szomszédok száma és bias opciók? Klasztering k-közép módszer, centroidok Input mezokre felhasználó által definiált súlyok Interaktív grafikus elemzés Szabályok Induction Tree Tree + - - + + + + + + +? - - - - - - Neural Nets Net + - - + + +? + + + + - - - - - - k-nearest Neighbors Match - + - + + +? + + + - + - - - - - Clustering Cluster????????????????

OMO Data Mining eredmények - Lift ábra LIFT

Data Mining az Oracle9i Database-be ágyazva Több algoritmus Naïve Bayes (osztályozás) - supervised Association Rules (asszociáció) - unsupervised Fejlodés: C&RT, neurális hálózatok, SOM... Alapértelmezett és részletes paraméterezés Több féle predikció Adott esemény valószínusége A legvalószínubb esemény Data Mining

Predikció és klasszifikáció Korábban rejtett információk a hívóközpont kezelonek. Predikció és valószínuség.

Oracle9i Perszonalizáció Valós ideju ajánlási motor Valós ideju ajánlási motor, 1:1 marketing kapcsolatok eléréséhez az Interneten Cross-selling és up-selling Web lap tartalom testreszabás, pl. hirdetések Tradicionális adatbányászat + Valós ideju Session környezet

Oracle9i Personalization architektúra Javaslat kérés Web Application Recommendation Engine Farms Mobile Application Hello! We have Recommendations recommendations for you. Call Center Application Predictív modellek Campaign Management Historikus adatok

Ismét a rejtett összefüggések...... az elemzok szerepe

Integráció a BI Portál segítségével Vállalati jelentéskészítés Ad-Hoc Lekérdezés és elemzés Weblap elemzés Sokoldalú elemzés