10. HÉT: ADATTÁRHÁZAK ÉS ÜZLETI INTELLIGENCIA Dr. Danyi Pál Egyetemi docens, BME 2015-16 I. FÉLÉV DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT 1
MIS RENDSZEREK: ALKALMAZÁS-TECHNOLÓGIA-ADAT MIS rendszerek: DSS, EIS, AI, BI, BA, ACRM, riportolás Technológiák: AI, BI, BA Adatbázis technológiák: (Relációs) adatbázis rendszerek (DBMS), adattárház (DW), adatpiac 2015-16 I. FÉLÉV DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT 2
AZ ADATTÁRHÁZAK DW (Data Warehouse), adatraktár: egy szervezet összes információs adatának összesített rendszere, ahol adatok téma-orientált, integrált, időfüggő, nem felejtő adatbázisa, ami támogatja a menedzsment döntéshozatali folyamatait. Olyan felépítésű, hogy segítse az üzleti intelligencia funkciók minél eredményesebb megvalósítását. Nem feltétel a redundancia-mentesség Feladatok: Adatok gyűjtése különböző forrásokból Másolatok készítése Adatok tisztítása Adatok tárolása Kategorizálás OLTP DW OLAP 2015-16 I. FÉLÉV DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT 3
ADATTÁRHÁZAK ÉS ADATPIACOK CÉLJA Az adattárházak (adatraktárak) és adatpiacok segítenek megoldani azokat a problémákat, amikor hiányzó vagy inkonzisztens adatai vannak a szervezetnek. Segítenek továbbá szabványosítani az adatformátumokat a tranzakciós adatok és a külső féltől vásárolt adatok között is. Ezek az eszközök kifejezetten adatelemzések és adatbányászat számára készítenek elő, tárolnak és menedzselnek adatot. OLTP Fig 9-15 Components of a Data Warehouse DW OLAP Forrás: http://www.slideshare.net/mgraham213/business-intelligence-systems 2015-16 I. FÉLÉV DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT 4
ADATTÁRHÁZAK ÉS ADATPIACOK KÖZÖTTI KÜLÖNBSÉG Az adattárházak (DW) tranzakciós (működési) adatokat és vásárolt adatokat tárolnak. A DW megtisztítja és feldolgozza az adatokat, ha szükséges. Az egész szervezetet szolgálja. Az adatpiac kisebb, mint a DW, és egy üzleti szervezet vagy egy szűkebb területre vonatkozik. Funkcionalitásában megegyezik a DW-zal. Fig 9-18 Data Mart Examples Forrás: http://www.slideshare.net/mgraham213/business-intelligence-systems 2015-16 I. FÉLÉV DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT 5
RAW DATA This figure shows raw data before any reporting operations are used. 2015-16 I. Forrás: FÉLÉV http://www.slideshare.net/mgraham213/business-intelligence-systems DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT 6
The figure on the left shows the raw sales data sorted by customer names. The figure on the right shows data that s been sorted and grouped. Sales Data, Sorted by Customer Name & Sales Data Sorted by Customer Name Grouped by Number of Orders & Purchase Amount Forrás: http://www.slideshare.net/mgraham213/business-intelligence-systems 2015-16 I. FÉLÉV DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT 7
This figure shows even better information that s been filtered and formatted according to specific criteria. Fig 9-5 Sales Data Filtered to Show Repeat Customers 2015-16 I. Forrás: FÉLÉV http://www.slideshare.net/mgraham213/business-intelligence-systems DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT 8
RFM Analysis allows you to analyze and rank customers according to purchasing patterns as this figure shows. R = how recently a customer purchased your products F = how frequently a customer purchases your products M = how much money a customer typically spends on your products The lower the score, the better the customer. Forrás: http://www.slideshare.net/mgraham213/business-intelligence-systems 2015-16 I. FÉLÉV DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT 9
MIS RENDSZEREK: ALKALMAZÁS-TECHNOLÓGIA-ADAT MIS rendszerek: DSS, EIS, AI, BI, BA, ACRM, riportolás Technológiák: AI, BI, BA Adatbázis technológiák: (Relációs) adatbázis rendszerek (DBMS), adattárház (DW), adatpiac 2015-16 I. FÉLÉV DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT 10
EGYES RENDSZEREK FUNKCIÓT ÉS TECHNOLÓGIÁT IS JELENTENEK AI rendszerek BI rendszerek Big Data Funkció szerint Fordító, képfelismerő, arcfelismerő alkalmazás, humán robot, kiterjesztett valóság, szakértői rendszer, stb. Kereső rendszerek, OLAP, üzleti elemzés Big data szolgáltatások, Nagy elemzések, Gyors adatfeldolgozás Technológia szerint Neuronhálók, Evolúciós (genetikai) algoritmusok, Fuzzy rendszerek, Logikai programozás Riportolás Adatbányászat, Tudás menedzsment NoSQL, Hadoop és MapReduce, Storm 2015-16 I. FÉLÉV DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT 11
ÜZLETI INTELLIGENCIA (BI) ESZKÖZÖK ÉS TECHNOLÓGIÁK Az üzleti intelligencia (BI) rendszer egy olyan információrendszer, ami üzleti intelligencia (BI) eszközöket alkalmaz, hogy létrehozzon és szolgáltasson információt. A BI eszközök olyan számítógépes programok, amelyek bizonyos BI technikákat alkalmaznak. A technikákat 3 féleképpen kategorizáljuk: Riportoló eszközök: adatot olvasnak be, feldolgozzák azokat, és olyan strukturált riportokba formázzák az adatokat, amelyeket a felhasználó látni kíván. Elsősorban értékelésre használják. Adatbányász eszközök: statisztikai algoritmusokat használva dolgozzák fel az adatokat, mintákat és kapcsolatokat keresnek és előrejelzést tesznek az eredmények alapján. Tudásmenedzselő eszközök: munkatársi tudást (folyamatleírásokat, kapcsolatokat, összefüggéseket, okosságokat ) tárolnak, és elérhetővé teszik az érdeklődők számára. Itt az adatok forrása az emberi tudás. 2015-16 I. FÉLÉV DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT 12
ÜZLETI INTELLIGENCIA (BI) FUNKCIÓK Információkeresés lekérdezéseken keresztül Riportolás: teljesítménymérés, mutatószámok (KPI-k) Online analitikus feldolgozások (OLAP) Üzleti elemzés (analitika): magyarázó és előrejelző modellezés főleg statisztikai alapokon Figyelmeztető ( alert ) eszköz 2015-16 I. FÉLÉV DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT 13
OLAP FUNKCIÓK ÉS AZ OLAP ADATKOCKA-MODELL Aggregáció: dimenziók mentén összegzés Lefúrás: az aggregáció ellentéte, pl. havi bontás (DRILL DOWN) Forgatás: dimenzió felcserélése (más nézet) Szelekció: egy dimenzióban értékre szűrés Szeletelés: egy dimenzió lekötése, részkocka kivágása 2015-16 I. FÉLÉV DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT 14
OLAP VS OLTP OLTP (On-line Transaction Processing) Napi üzletmenet működése Repülőgépes helyfoglaló rendszerek OLAP (On-line Analytical Processing) Féléves, éves trendek alapján előre jelezni Döntéshozatal Jellemzők OLTP OLAP Felhasználó Adminisztrátorok Menedzserek Időszerűség Aktuális állapot Korábbi állapot Gyakoriság Folyamatos Alkalomszerű Rekordszám ~ 10 ~ 100-1000 Teljesítmény Gyors Lassabb Kívánt adatok Meghatározott Bizonytalan Művelet Adatmódosítás Adatlekérdezés 2015-16 I. FÉLÉV DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT 15
Dimensions which are characteristics of a measure. In the figure below a dimension is Product Family. Fig 9-7 OLAP Product Family by Store Type Forrás: http://www.slideshare.net/mgraham213/business-intelligence-systems 2015-16 I. Félév Dr. Danyi Pál - Információmenedzsment 16
A presentation like what you saw in the prior slide is often called a OLAP cube or a cube. Know that an OLAP cube and a OLAP report are the same thing Users can alter the format of a report Its possible to Drill down into the available data Forrás: http://www.slideshare.net/mgraham213/business-intelligence-systems 2015-16 I. Félév Dr. Danyi Pál - Információmenedzsment 17
Drilled down by store location and store type Forrás: http://www.slideshare.net/mgraham213/business-intelligence-systems 2015-16 I. Félév Dr. Danyi Pál - Információmenedzsment 18
Further drilled down to just stores in California Forrás: http://www.slideshare.net/mgraham213/business-intelligence-systems 2015-16 I. Félév Dr. Danyi Pál - Információmenedzsment 19
ADATBÁNYÁSZAT (DATA MINING) Definíció Előre nem sejthető minták, törvényszerűségek, összefüggések keresése nagy adatbázisokban ( TUDÁS feltárás) Módszerek Asszociációk Tej és kenyér; Skoda és Philips. Minek van értelme? Szekvenciák keresése Benzin és hús; alkohol és bébiétel? Csoportok keresése Szakácskönyvek: 20-40 év közötti nők Feltétel Adat forrás adat (kiválasztás) tisztított adat transzformált adat minták (adatbányászat) értékelés - tudás 2015-16 I. FÉLÉV DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT 20
ADATBÁNYÁSZATI TECHNIKÁK 1. Klaszteranalízis Nem jellemző egyedek elhagyása Korreláló változók elhagyása (életkor születési idő helyett) Változók összevonása (1 főre eső árbevétel) fogadott hívások [perc] Ultra kommunikatívak Nem kommunikálók indított hívások [perc] 2015-16 I. FÉLÉV DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT 21
ADATBÁNYÁSZATI TECHNIKÁK 2. Döntési fa eljárás Regressziós eljárás Neurális hálók Példa: 35 év feletti, jól kereső, régi ügyfél teljes minta <35 >35 nem vásárolt vásárolt életkor jövedelem <200000 >200000 <16 hónap >24 hónap mióta ügyfél? 2015-16 I. FÉLÉV DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT 22
ADATBÁNYÁSZATI TECHNIKÁK 3. Mesterséges intelligencia technikák, pl. gépi tanulás technikák: Neurális hálók Big Data technikák? (A technikák, módszerek keverednek, ahogy újabb és újabb problémák, igények merülnek fel.) 2015-16 I. FÉLÉV DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT 23
BI RENDSZEREK SPECIÁLIS FAJTÁI Analitikus ügyfélkapcsolat rendszer CRM Nem termékhez vevőt, hanem vevőhöz terméket Adatbányászati alkalmazásai: Ügyfél szegmentáció és ügyfélmegtartás BI ACRM CRM Kockázatmenedzsment Csalások felderítése és megakadályozása Direkt marketing Keresztértékesítés Vállalati teljesítménymenedzsment EPM (Enterprise Performance Mgmt) Olyan rendszer, mely a vállalati teljesítmény mérésére használt mutatók alakulását követi nyomon. Pl.: Eladások egy időszakban Befektetett tőke megtérülése ROI Befektetés megtérülési ideje 2015-16 I. FÉLÉV DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT 24
Köszönöm a figyelmet! 2015-16 I. FÉLÉV DR. DANYI PÁL - INFORMÁCIÓMENEDZSMENT 25