Bevezetés - Az üzleti intelligencia fogalma KUTATÁSI TANULMÁNY ADATBÁNYÁSZATI MEGOLDÁSOK FEJLESZTÉSI IRÁNYA - OLAP TECHNOLÓGIÁJÚ MEGOLDÁSOK BEVEZETHETŐSÉGÉNEK ELEMZÉSE 1 (106)
Bevezetés - Az üzleti intelligencia fogalma Tartalomjegyzék 1 Bevezetés - Az üzleti intelligencia fogalma... 7 2 A szervezeti és informatikai stratégia illesztése... 8 2.1 Az üzleti intelligencia szerepe az információellátásban... 10 2.2 Hajtóerők az üzleti intelligencia technológiai fejlődésében:... 11 2.3 Stratégiai teljesítménymenedzsment eszközök... 12 2.4 A folyamat-kontrolling mint az informatikai és vállalati stratégia illesztése 13 2.4.1 A folyamat-kontrolling szabályozóköre... 15 2.5 Üzleti intelligencia szervezeti keretei és irányítása... 16 2.6 Egy üzleti intelligencia rendszer klasszikus adatáramlási architektúrája... 17 2.7 Adat, információ, tudás és az információs igény... 17 2.8 Mutatószám rendszer (Scorecarding)... 18 2.9 Üzleti, vállalati teljesítmény kezelés (Business Performance Management) 18 3 OLAP alapfogalmai... 18 3.1 Az OLTP és az OLAP... 19 3.2 Dr. Codd s OLAP szabályai... 20 3.3 Adatkocka - Többdimenziós elemzés alapfogalmai... 23 3.4 Műveletek a többdimenziós adatelemzésben... 24 3.5 OLAP elemzések lehetősége költséges adattárház nélkül... 27 4 Az adatbányászat elméleti háttere... 27 4.1 Az adatbányászat fontossága... 27 4.2 Az adatbányászat definíciója... 27 4.3 Adatbányászati rendszer architektúrája... 28 4.4 A SEMMA módszertan (SAS Enterprise Miner)... 29 4.4.1 Mintavételezés (Sampling)... 30 4.4.2 Feltárás (Exploration)... 30 4.4.3 Módosítás (Modification)... 32 4.4.4 Modellezés (Modeling)... 33 4.4.5 Értékelés (Assessment)... 34 4.5 CRISP-DM (CRoss Industry Standard Process for Data Mining)... 35 4.6 Adatbányászati módszerek... 36 4.7 Az adatbányászati technikák csoportosítása... 36 4.8 Felhasználási területek... 37 4.9 Előrejelző elemzések... 38 4.10 Statisztikai regresszió... 38 4.10.1 Lineáris regresszió... 38 4.10.2 Nemlineáris regresszió... 39 4.11 Döntési fák... 40 4.11.1 CART algoritmus... 41 4.11.2 CHAID... 42 4.12 Adatbányászati modellek... 43 4.12.1 Gépi tanulás... 43 4.12.2 Felügyelt tanulás... 44 4.12.3 Nem felügyelt tanulás... 45 4.12.4 Neurális hálózatok... 46 2 (106)
Bevezetés - Az üzleti intelligencia fogalma 4.12.5 Mesterséges neurális hálózatok... 46 4.12.6 Mesterséges neuron... 46 4.12.7 A Kohonen háló... 48 4.12.8 A SOM algoritmus... 49 4.12.9 Memóriában végzett következtetés (Memory-based reasoning (MBR)) 50 4.12.10 Genetikus algoritmusok... 50 4.13 Leíró elemzések... 51 4.13.1 Klaszterelemzés... 52 4.13.2 Nem hierarchikus klaszterképzés... 52 4.13.3 Asszociáció elemzés (Kapcsolat elemzés)... 53 4.13.4 Adatmegjelenítő eljárások... 54 4.14 Fuzzy-rendszerek... 54 4.15 Szövegbányászat... 55 4.16 Világháló bányászat - Web mining... 55 5 Hagyományos statisztikai területek és adatbányászat... 56 5.1 Statisztika kontra adatbányászat... 56 5.2 Adatbányászat által nyújtott korszerűbb megközelítések... 57 5.2.1 Mesterséges intelligencia és az adatbányászat... 57 6 Néhány kereskedelmi forgalomban kapható üzleti intelligencia rendszer (BI).. 58 6.1 A jelenlegi BI piacvezetők... 58 6.1.1 Cognos... 59 6.1.2 Oracle... 60 6.1.3 SAS... 60 6.1.4 SAP... 61 6.1.5 Microsoft... 62 6.1.6 SPSS... 63 6.1.7 Business Objects üzleti intelligencia megoldások (SAP)... 63 7 Nyílt forráskódú adatbányászati rendszerek... 67 7.1 Kereskedelmi nyílt forráskódú üzleti intelligencia... 67 7.2 A nyílt forráskódú üzleti intelligencia rendszerek gazdaságossági kérdései 68 7.3 Kettős termékkínálat... 69 7.4 Nyílt forráskódú üzleti intelligencia megoldások... 70 7.5 Nyílt forráskódú licencek... 70 8 Nyílt forráskódú üzleti intelligencia rendszerek... 71 8.1 Pentaho... 71 8.2 A vállalat bemutatása... 71 8.3 Pentaho BI Suite Enterprise Edition 3... 72 8.4 A Pentaho eszközei és termékkínálata... 72 8.4.1 Pentaho Reporting... 73 8.4.2 Pentaho Analysis... 73 8.4.3 Pentaho Dashboards... 73 8.4.4 Pentaho Data Integration... 74 8.4.5 Weka - Pentaho Data Mining... 74 8.4.6 A Community és az Enterprise Edition összehasonlítása... 76 3 (106)
Bevezetés - Az üzleti intelligencia fogalma 8.5. RapidMiner... 78 8.5.1 A RapidMiner-ről általában... 78 8.5.2 A RapidMiner funkcionalitása... 78 8.6 Talend... 81 8.6.1 A Talend Open Studio... 81 8.6.2 A Talend termékei... 84 8.6.3 Talend használhatósága bevezethetősége... 86 8.7 JasperSoft... 87 9 Az adatbányászat szerepe az üzleti intelligenciában... 87 10 Az adatbányászati technológiák é szervezeti folyamatok jellemzése... 88 10.1 Adatbányászati folyamatok... 88 10.1.1 Adatbányászat... 88 10.1.2 Cselekvés... 90 10.1.3 Eredmények mérése... 90 10.2 Adatbányászat alkalmazási területei... 90 10.3 Ügyfélkapcsolat menedzsment (CRM)... 90 10.3.1 CRM definíció... 90 10.3.2 Az adatok elemezése... 93 11 Megvalósíthatósági kérdések... 94 11.1 Az üzleti intelligencia területének várható fejlődése... 94 11.2 Üzleti intelligencia megoldás bevezetése és buktatói... 96 11.3 BI eszköz kiválasztása... 97 11.4 A bevezetési projektek... 97 11.5 A bevezetés leggyakoribb problémái... 98 11.6 A BI projektek sikerességét befolyásoló tényezők... 98 11.7 A BI projektek leggyakoribb buktatói... 98 11.8 BI költségösszetevői... 99 12 Üzleti intelligencia, adatbányászat és több dimenziós elemzés megvalósíthatósági kérdései Vatera.hu-nál... 99 12.1 Vásárlói magatartás modellezése... 99 12.2 Adatbázis alapú vásárlói magatartás előrejelzés... 100 12.3 A vásárló értékének vizsgálata... 101 12.4 A külvilág eseményeinek figyelembevétele az adatokban... 101 12.5 Törzsvásárlói és egyéb ösztönzési programok... 102 12.6 Adatbányászat az ügyfél kapcsolattartásban... 102 12.7 OLAP alkalmazhatóság az ügyfél kapcsolattartásban... 103 12.8 A vállalkozás vezetése felé nyújtott információk... 104 13 Irodalom... 105 4 (106)
Bevezetés - Az üzleti intelligencia fogalma Ábrajegyzék 1. ábra Döntéshozó csoportok információigénye [Forrás: BCE Információrendszerek Tanszék]...9 2. ábra: Az IT alkalmazások szerepe a vállalat működésében...10 3. ábra: Az üzleti intelligencia szerepe a vállalati információellátásban...11 4. ábra: Az EIM referenciamodellje...12 5. ábra Folyamatteljesítmény kontrolling [Forrás: IFUA 2006]...14 6. ábra A folyamat kontrolling szabályozóköre [Forrás: IFUA 2006]...15 7. ábra Üzleti intelligencia klasszikus architektúrája [Forrás: IFUA]...17 8. ábra OLTP és OLAP (Kő Lovrics, 2003)...19 9. ábra: Eladási adatok háromdimenziós adatkockája...23 10. ábra Az adatkockán végezhető műveletek (Abonyi, 2006, 62.oldal)...26 11. ábra: Adatbányászati rendszer adat és alkalmazás kiszolgáló architektúrája...29 12. ábra: A CRISP DM lépései...35 13. ábra: Példa a kétváltozós lineáris regresszióra (Abonyi, 2006. 274.old)...39 14. ábra: Példa egyszerű kétváltozós matematikai döntési fára...41 15. ábra: CHAID algoritmussal generált döntési fa [Forrás: http://www.smartdrill.com/about/process4.html]...43 16. ábra: Egy mesterséges neuron vázlata (Turban et. al., 2010)...47 17. ábra: A Kohonen háló (Sárközy, 2005)...48 18. ábra: Kétdimenziós térkép...49 19. ábra: Színek csoportosítása SOM részéről...50 20. ábra Klaszterek...53 21. ábra: Business Intelligence Platform Magic Qudrantja, 2007...58 22. ábra 2011 Magic Quadrant for Business Intelligence Platforms...59 23. ábra: SAS adattárház...61 24. ábra: SAP BW komponensek...62 25. ábra: A szemantikus réteg...64 26. ábra: A Business Objects termékstruktúrája... 66 27. ábra: Oktatóprogram...67 28. ábra: A Community és az Enterprise Edition összehasonlítása Forrás: Pentaho: Compare Pentaho Community and Enterprise Edition Products, http://www.pentaho.com/products/enterprise/enterprise_comparison.php...77 29. ábra: Az operátor fa kinézete Forrás: RapidMiner: Screenshots, http://rapidi.com/content/view/122/139/lang,en/...80 30. ábra: A Talend Integration Suite modellje Forrás: Talend: Talend Integration Suite, http://www.talend.com/products data integration/talend integration suite.php...85 31. ábra: A Talend On Demand modellje Forrás: Talned: Talend On Demand, http://www.talend.com/talend on demand/talend on demand.php...86 32. ábra Az adatbányászat értékteremtő folyamata (Fajszi Cser, 2004, 12.old)...89 33. ábra: CRM alkalmazások kördiagramja (Forrás: SAS)...93 34. ábra: Az üzleti intelligencia fejlődési irányai...95 5 (106)
Bevezetés - Az üzleti intelligencia fogalma Táblázatjegyzék 1. Táblázat Az OLTP és az OLAP összehasonlítása...19 2. táblázat2: Mérföldkövek a BI technológia várható fejlődésében...95 6 (106)
Bevezetés - Az üzleti intelligencia fogalma 1 Bevezetés - Az üzleti intelligencia fogalma Ebben a fejezetben az üzleti intelligenciához kapcsolódó alapfogalmakat mutatjuk be. Az informatikában viszonylag új fogalom az üzleti intelligencia, ezért nem lehet egységes meghatározást fellelni a szakirodalomban, valamint a szakterülettel foglalkozó vállalatok weboldalain sem. Az egyes definíciók néhol teljesen különböző módon közelítik meg az üzleti intelligencia fogalmát függetlenül attól, hogy a szakirodalomban jelent-e meg, vagy a szakma képviselőitől hangzott-e el. Először néhány, a szakirodalmakban fellelhető definíciót, majd az üzleti életben maghatározó szereplők által közzétett meghatározást mutatunk be: Olyan módszerek, fogalmak halmazát jelenti, melyek a döntéshozás folyamatát javítják adatok és ún. szakterület alapú rendszerek használatával. A "szakterület rendszer" fogalma a következő alrendszereket foglalja magába: Vezetői információrendszerek (Executive Information Systems); Döntéstámogató rendszerek (Decision Support Systems, DSS); Vállalat irányítási információrendszerek (Enterprise Information Systems); Üzleti információ elemző rendszerek (Online Analitical Processing (OLAP)); Adat és szövegbányászat; Adat vizualizáció Térinformatikai rendszerek (Geographic Information Systems, GIS). [Howard Dresner, Gartner Group, 1989] Egy másik megközelítés, mely a definíciót a rendszer forrásoldaláról közelíti meg: Az üzleti intelligencia sokféle forrásból származó adatot, információt (és tudást) használ fel az üzleti döntéshozatalban. Az üzleti analitika (elemzés) mindezt egy újabb dimenzióval gazdagítja: modellekkel és megoldásokat szolgáltató eljárásokkal. (Turban 2010). Végül egy szakirodalomban fellelhető, véleményem szerint az üzleti intelligenciát a legjobban leíró definíció Az üzleti intelligencia olyan eszközök és eljárások együttese, mely lehetővé teszi a vállalkozás alapadatainak magasabb, vezetői szintű elemzését. (Kókai 2005) A szakirodalmakban elhangzott definíciók után az üzleti élet szereplői részéről elhangzott meghatározások: Microsoft : Az Üzleti Intelligencia a jobb és gyorsabb döntéshozatalról szól a megfelelő információ biztosításáról a megfelelő emberek számára, a megfelelő időben, a megfelelő formában. Már nem a vezetők és elemzők kizárólagos territóriuma, mert vállalati szinten ma már mindenki hozzáfér a fontos üzleti adatokhoz, így valós idejű döntéshozókká válnak, akiknek így megalapozott tevékenységében közvetlenül megjelenik a vállalat stratégiája. A siker kulcsa ma már az, hogy a szervezetek hogyan képesek az adatokat feldolgozni, és azokra reagálni a szervezet minden szintjén. IFUA Horváth & Partners: Az Üzleti intelligencia megoldások (BI, Business Intelligence) körébe olyan alkalmazások és technológiák tartoznak, melyek célja, hogy a szükséges adatokhoz való hozzáférés biztosításával, ezen adatok megfelelő tárolásával, valamint sokoldalú 7 (106)
A szervezeti és informatikai stratégia illesztése elemzési lehetőségekkel támogassák a vállalati döntéshozatalt. Az üzleti intelligencia megoldások magukban foglalják tehát az adattárolási, a valós idejű lekérdezési, analitikai, előrejelzési és adatbányászati eljárások modern formáit. És végül egy olyan definíció, mely egy másik oldalról közelíti meg ugyan azt a fogalmat: BiXPERT: Intelligence = 1. Intelligencia, 2. Felderítés (hírszerzés, információ-szerzés) Business Intelligence = Üzleti Felderítés. Az Üzleti Intelligencia értelmezése tehát sokkal inkább egy olyan vezetői készség, képesség, tudás és megérzés, amelyet nem lehet szoftveres alkalmazással helyettesíteni. Valamint szintén a BiXPERT Kft.-nél található másik definíció: Heterogén adatforrásokból származó adatokból stratégiai és taktikai döntéseket támogató vezetői információ előállítása konzisztens módon és egységes felületen Összefoglalva elmondható, hogy az üzleti intelligencia adatokat elemez és dolgoz fel különböző informatikai rendszerek segítségével (ezen informatikai rendszereket hívjuk BI eszközöknek), támogatva a vezetői döntéshozatalt. 2 A szervezeti és informatikai stratégia illesztése A szervezeti és informatika stratégia illesztése a stratégiai menedzsment és a stratégia illesztése kontextusában értelmezhető. Definíció: A szervezeti és informatika stratégia illesztését úgy lehet felfogni mint egy olyan mértéket, amely azt méri, hogy a szervezet informatikai stratégiája és informatikai infrastruktúrája milyen mértékben áll összhangban a szervezet üzleti stratégiai célkitűzésével és szervezeti infrastruktúrájával. (Nickles 2004). Ez a definíció tovább bővíthető a következőkkel: A célok, a stratégiák, az architektúrák, a szolgáltatások, a folyamatok és a szervezeti kultúra összhangja, amely fennáll a szervezeten belül mind az informatikai funkció mind a szakterületek között. A vállalatok szervezeti struktúrája általában három szintből áll: operatív, taktikai és stratégiai. Operatív szinten a vállalat mindennapi működéséhez szükséges információkat állítja elő. Ez a folyamatos működés zavartalanságát hivatott segíteni, valamint az ehhez szükséges információkkal látja el az egyes tevékenységeket. Taktikai szinten többnyire középvezetők állnak, ők határozzák meg a fontosabb feladatokat, valamint elvégzik a vállalat valódi és elvárt teljesítményének az összehasonlítását, és szükség szerint beavatkoznak a folyamatokba. Stratégiai szinten a vezetők a hosszú távú feladatokkal foglalkoznak, és ennek megfelelően az ehhez szükséges információkat várják el a vezetői rendszertől. Ezen a szinten a vezetőket a kulcsfontosságú adatok érdeklik és nem szükséges, sőt fölösleges őket terhelni a részletesebb adatokkal, mert a hosszú távú döntésekhez nem szükségesek. 8 (106)
A szervezeti és informatikai stratégia illesztése 1. ábra Döntéshozó csoportok információigénye [Forrás: BCE Információrendszerek Tanszék] Általánosságban megfogalmazható, hogy az üzleti intelligencia legnagyobb értéke, hogy az információ visszakerül a végfelhasználóhoz. Ehhez a Microsoft vizualizációs eszköznek az Excelt használja, természetesen az Excel hátterében működik egy OLAP, illetve adattárház. Ez utóbbi kettő is jelen van a Microsoft termékportfoliójában. Az Exceles vizualizáció tapasztalatok szerint az egyik leginkább felhasználóbarát megoldás. Ez abból is jól látszik, hogy a többi szállító esetében is (Cognos, SAP, Oracle) sokszor a felhasználók által nagyon kedvelt Excel táblázat jelenti a végső megjelenítő felületet. A vezetői döntéstámogatási perspektíva a következő előfeltevéseken nyugszik (dr. Drótos György, 2001, 75. old.): o A szervezetek működésének eredményességét a döntések minősége határozza meg. o A döntések minősége azon múlik, hogy meghozásukhoz szükséges információ rendelkezésre áll-e. o A döntéseket a vezetők hozzák a szervezetekben. o A szervezeti információrendszerek legfontosabb feladata tehát a vezetők ellátása a döntéseik meghozatalához szükséges információval. A vállalatok operatív és stratégiai folyamatait támogató IT alkalmazások szerepét szemlélteti a 2. ábra. 9 (106)
A szervezeti és informatikai stratégia illesztése Vállalati szintű döntéshozatali és stratégiai irányítási folyamatok Üzleti intelligencia (BI) IT alkalmazások Beszállítói lánc kezelése (SCM) Operatív vállalatirányítás (ERP) Ügyfélkapcsolatok kezelése (CRM) A vállalat operatív (termelő-szolgáltató) folyamatai 2. ábra: Az IT alkalmazások szerepe a vállalat működésében 2.1 Az üzleti intelligencia szerepe az információellátásban A 3. ábra egy általános vállalat információellátási ciklusát szemlélteti. Négy szakaszt különböztet meg: 1. Előállítás ez a szakasz olyan operatív irányítási és munkafolyamattámogató alkalmazásokat tartalmaz, amelyek a vállalati információk elsődleges forrásai. 2. Rendszerezés - olyan alkalmazásokat fog össze, amelyek a vállalati szintű információk konszolidációjáért és integrációjáért felelősek. 3. Elemzés - különböző olyan alkalmazásokat tartalmaz, amelyek a vállalati szintű információk egyszerű ill. komplex elemzését végzik. 4. Hasznosítás - olyan döntéstámogatási és beavatkozási alkalmazásokat fed le, amelyek az irányítási és termelési-szolgáltatási folyamatok ill. rendszerek működésé re lehetnek közvetlen hatással. 10 (106)
A szervezeti és informatikai stratégia illesztése vállalati munkafolyamat támogatása EAI 1. ELŐÁLLÍTÁS vállalati működés támogatása Egyéb alk. ERP CRM SCM vállalatközi együttműködés támogatása Külső források 2. RENDSZEREZÉS 3. ELEMZÉS metaadatkezelés metaadattár adattranszformáció és -integrálás kigyűjtés, átalakítás és betöltés Üzleti intelligencia vállalati adattárház adattárolás operatív adattár kutatási és elemzési adattárház adatelemzés, adatbányászat, információfeltárás adatpiacok operatív piacok 4. HASZNOSÍTÁS vállalat teljesítményalapú írányítása (CPM) ügyfélkapcsolat vállalatirányítás döntéstámogatás (DSS) beszállítói lánc értékesítési lánc üzleti folyamatok felügyelete (BAM) A vállalati információellátás ciklusa 3. ábra: Az üzleti intelligencia szerepe a vállalati információellátásban1 Az üzleti intelligenciát a 3. ábra 2. és 3. szakaszaként lehet közelebbről meghatározni. Ezek alapján tehát az üzleti intelligencia az informatikai alkalmazások és eszközök összessége, amelyek a vállalati információk összegyűjtését, rendszerezését, elemzését és további hasznosításra (elsősorban döntéshozatalra) való átadását végzik. 2.2 Hajtóerők az üzleti intelligencia technológiai fejlődésében: Alkalmazások számának és használhatóságának növekedése Adatbázisok képességeinek fejlődése Tároló rendszerek képességeinek fejlődése Adatmennyiség mértéktelen növekedése Teljesítményalapú irányítás Adatok átlátásának, megértésének fontossága Jogszabályi megfelelés 1 Az adattárház-technológia kezdeményezője, Bill Inmon nyomán. 11 (106)
A szervezeti és informatikai stratégia illesztése Ezek a hajtóerők várhatóan olyan változásokat okoznak, amelyek a vállalatok információvagyonának 2 a mainál jóval egységesebb, összetettebb és közvetlenebb hasznosítását eredményezik. Ennek hatására az üzleti intelligencia sokkal jobban össze fog fonódni a vállalatok operatív ill. stratégiai folyamatainak irányításával, és a legfontosabb hajtóerővé válik a vállalati szintű információgazdálkodás (Enterprise Information Management - EIM) kialakulása felé vezető úton. Ennek célját és egyes rétegeit az ún. EIM referenciamodell írja le (4. ábra). egyedi alkalmazások ügyféladatok integrációja adatátalakítás tartalomintegráció modellek sémák üzleti folyamatok összeállítása integrált összeállítási technológiák üzleti szolgáltatások tára termékek tartalom- és adatkezelése vállalati tartalomkezelés csomagalkalmazások üzleti intelligencia alkalmazások Adat-szolgáltatások adatgazdálkodás adatmozgatás adatbeszerzés adatbővítés külső szolgáltatások Metaadatkezelés és szemantikai egyeztetés tárak és nyílvántartások szabványok keresés adatelérés adatminőség üzleti szabályok osztályozás tranzakciós, operatív éa analítikus forrásokból üzleti folyamatok platformja alkalmazási portfólió EIM infrastruktúra ügyfél alapadat termék alapadat eszköz alapadat külső adatforrások vállalati adattárház struktúrált, félig struktúrált és nem-struktúrált tartalmakból 4. ábra: Az EIM referenciamodellje 3 2.3 Stratégiai teljesítménymenedzsment eszközök A vállalati teljesítménymenedzsment az a mindennapos feladat, amelynek során a szervezetet a humán és pénzügyi erőforrások optimalizálásával, a hosszú és a rövidtávú vállalati stratégiával összhangban közös célkitűzések és a tulajdonosi célok elérése érdekében menedzselik (Portik, 2008) A fenti szemléletmód megvalósításának egyik elterjedt módszertana a kiegyensúlyozott mutató számrendszer ((Balanced Scorecard (BSC)) modell, ahol a stratégiai célokat hierarchiák mentén bontják le elemi, mérhető célok-ra. Miért éri meg bevezetni ezt a módszertant? A BSC modell előnyei: a vezetőség jövőképét közös, szervezeti jövőképpé alakítja 2 Az információs vagyon az adat, az információ és a tudás felhalmozott értéke, az információs tőke. Forrás: Dobay Péter, 1997, 134. old. 3 Forrás: Gartner nyomán 12 (106)
A szervezeti és informatikai stratégia illesztése a stratégiát könnyen értelmezhető és összehangolt célokká bontja le a célokhoz mutatókat, elvárásokat és akciókat rendel támogatja a tervezést és a visszamérést alkalmas az ok-okozati összefüggések megfogalmazására Ezen célok mérését manapság már a vállalati adattárház adatai alapján oldják meg, tehát az üzleti intelligencia a BSC alkalmazásában fontos szerepet játszik. A BI szerepe azonban sok megoldás esetében túlmutat az adatok egyszerű kiszolgálásán. Napjainkra a legtöbb üzleti intelligencia rendszer már tartalmaz olyan modult, mely ezen BSC mutatókat ki tudja számolni, és a feldolgozott adatokat grafikusan meg tudja jeleníteni. Ezeket a mutatókat a megfelelő szelektálás után az úgynevezett dashboard-okra (műszerfalakra, vezérlőpultokra) szokás elhelyezni, ahol a felelős vezető közvetlenül belépés után egy áttekintő képet kap arról, hogy a szervezet mennyiben követi a stratégiai célok teljesülését. Amennyiben a dashboard szemlélője abnormális működésre utaló adatokra lesz figyelmes, akkor az OLAP technikában ismert lefúrás segítségével a hibás adatra kattintva lehetősége van a rosszul viselkedő mutató adatainak egyre részletesebb megtekintésére, és egyúttal az okok felderítésére is. (Kaplan & Norton, 1999) 2.4 A folyamat-kontrolling mint az informatikai és vállalati stratégia illesztése A folyamat-teljesítmény növelésének - ami a folyamat valamely jellemzője szerinti javítást jelenti: minőség, költség, idő, ciklusidő, biztonság szempontjából - egyik leghatékonyabb eszköze a rendszeres mérés és a mérés során szerzett tapasztalatok alapján a folyamatok továbbfejlesztése. A cél ugyanis az, hogy irányítani lehessen a vállalati folyamatokat és ez által fejlődést lehessen elérni a vállalati teljesítményben. Az irányítás természetesen azt is magába foglalja, hogy nem csupán észleljük a változásokat a folyamatokban, hanem reagálni is tudunk azokra. A megfelelő reakcióhoz feltétlenül ismerni kell a folyamatokban bekövetkezett változások okát. Érdemes különbséget tenni a szervezeti teljesítménycsökkenések okai között. Előfordulhat, hogy nyáron a dolgozók szabadságra mennek, és azért csökken a vállalat teljesítménye, de az is lehet, hogy maga a belső folyamat működik hibásan és azon kellene változtatni. A példaként említett két eset teljesen eltérő reakciót igényel a vállalatvezetés részéről. Míg az első esetben csupán HR oldalról kellene jobban kezelni az emberek szabadságolását, addig ez utóbbi esetben már előfordulhat, hogy komoly strukturális illetve koncepcionális problémák állnak a teljesítménycsökkenés hátterében. A folyamat-kontrolling sikeres működéséhez nélkülözhetetlen a megfelelő indikátorok definiálása. Ezen mutatóknak le kell képezniük a költséget, az időt és a minőséget. E három területnek egyensúlyban kell lenni ahhoz, hogy ne borítsák fel a folyamatmérés egyensúlyát. A folyamat-kontrolling természetesen nem csupán mutatószámokból áll. Azt is állandóan ellenőrizni kell, hogy az egyes folyamatok elérték-e az előre definiált folyamatcélokat. Amennyiben a vállalat vezetése úgy dönt, hogy a legutóbb elért eredmény nem elegendő, úgy megteremtik a 13 (106)
A szervezeti és informatikai stratégia illesztése folyamatfejlesztés szükségességét. Ez a tevékenység rendszeres időközönként ismétlődik, beépülve a vállalat mindennapi üzletmenetébe. A folyamat-kontrolling alkalmazásának két fő területe van: A stratégiai és operatív teljesítmény mérése, ellenőrzése. 5. ábra Folyamatteljesítmény kontrolling [Forrás: IFUA 2006] Ahhoz, hogy képet kapjunk a teljesítményről, mindenképpen olyan információkat kell kapnunk, amelyek megfelelően leírják a stratégiai folyamatteljesítményt. Stratégiai cél egy szervezet esetében lehet a vállalat versenyképességének javítása, az árbevétel növelése 20%-kal vagy akár az üzletszerzési folyamatköltség csökkentése 20%-kal. Ezzel szemben a vállalat operatív sikeréhez a futó folyamatok vagy tevékenységek figyelemmel kísérése szükséges. Ennek klasszikus területe az erőforrás tervezés. Erőforrás tervezés egyik legismertebb és leggyakrabban használt területe a költségtervezés, mely a folyamatok tervezésekor szintén kulcsfontosságú. A folyamatok erőforrásainak (emberi és nem emberi) megtervezésekor információt kapunk a folyamatok hatékonyságáról, mind költségoldalról, mind az egyéb szükséges erőforrások oldaláról. A stratégiai a jövőkép első szintű részletesebb lebontása, amely már konkrétumokat is tartalmaz. Ezt tovább lehet bontani kisebb célterületekre, működési folyamatokra, mint például a marketing, gazdálkodás, vagy projektek. A célok egy kisebb közösség érdekeinek összehangolódását jelenti, mely területek együttműködve kell, hogy a vállalati stratégiát képviseljék. Ezen célok megvalósulásához szükséges meghatározni az ehhez kapcsolódó operatív teendőket/feladatokat. A stratégiai folyamatcélok része a folyamatok outputjának ellenőrzése, valamint a nem kívánt változások felderítése az egyes folyamatokban. Ellenőriznie kell, hogy a folyamatok összhangban vannak-e a stratégiai célokkal és, hogy elérték-e a kívánt eredményességet. Természetesen nem azonnal kell elérniük a stratégiai célokat, hanem ezek eléréséhez kiemelkedőjelentőségű elvárásokat kell csupán teljesíteniük. Összefoglalva a folyamatcontrolling egy olyan eszköz, mely biztosítja a szükséges információkat a folyamatcélok eléréséhez. 14 (106)
A szervezeti és informatikai stratégia illesztése 2.4.1 A folyamat-kontrolling szabályozóköre A hagyományos kontrollingtól annyiban különbözik a folyamat-kontrolling, hogy ez utóbbinak szabályozóköre a folyamatokra is érvényes. Az ábra (6. ábra) alapján jól látható, hogy külön kell bontani a bevezetési szakaszt és a mindennapi üzletmenetben való alkalmazást. A bevezetési szakasz során először azt kell eldönteni, hogy a vállalat mely folyamataira szeretnénk bevezetni a folyamatkontrollingot. Természetesen törekedni kell arra, hogy a vállalat összes folyamatára bevezessük, de mindenképpen érdemes pilot jelleggel egy-egy területen kipróbálni a rendszer működését. Ahhoz, hogy fennakadások nélkül működhessen egy ilyen rendszer, tisztázni kell a folyamatok illeszkedését a szervezeti struktúrába. Folyamatok esetében a folyamatfelelős feladata ellenőrizni és megfelelően működtetni a folyamatokat. Ehhez feltétlenül szükséges annak tisztázása, hogy a folyamatfelelős hogyan illeszkedik a szervezeti struktúrába, és hogy milyen hatáskörökkel rendelkezik az adott feladat betöltéséhez. Ezen felül érdemes kijelölni egy szervezeti egységet, amely felel az egész folyamat-kontrollingért. Ez a szervezeti egység jellemzően a kontrolling lehet, de sok vállalat esetében ezt a funkciót a minőségbiztosítási részleghez rendelik. Ez utóbbinak a hátránya az lehet, hogy nem tudnak megfelelő tartalmi ellenőrzést végezni a különböző szakmai területeken. A bevezetés során még egy kulcsfontosságú tényező meghatározása fontos: a rendszeresség. Ahhoz, hogy a folyamat-kontrollingot be lehessen építeni a vállalat irányításába, a rendszer használatának gyakoriságát össze kell hangolni az üzleti igényekkel. Az eddigi bevezetéssel kapcsolatos-tevékenységek egy folyamatkontrolling rendszer esetében egyszeri tevékenységet jelentenek. Az ezt követő tevékenységek azonban folyamatos és visszatérő feladatokat jelentenek a szervezet számára. 6. ábra A folyamat kontrolling szabályozóköre [Forrás: IFUA 2006] A folyamat kontrolling bevezetés utáni szakaszai: Tervezés 15 (106)
A szervezeti és informatikai stratégia illesztése A tervezés első fázisa minden esetben a már korábban említett stratégiai-és operatív folyamati célok meghatározása. A célok meghatározása után definiálni kell az ezekhez tartozó teljesítménymutatókat a célértékekkel együtt. Nem szabad elfelejteni a meghatározott teljesítménymutatók előállításához tartozó erőforrásigény tervet sem. Minden folyamathoz általában 1-3 célt határoznak meg, amelyikből nem mindegyik lesz közvetlenül folyamatcél. Ezek meghatározásánál abból kell kiindulni, hogy milyen elvárásai vannak a folyamat fogyasztójának, azaz mi legyen a folyamat outputja. Nem érdemes a célokból sokkal többet meghatározni, mert akkor jóval nehezebb koncentrálni az egyes célokra, aminek az lesz a következménye, hogy egyik cél sem fog teljesülni A folyamatcélok ismeretében már meghatározhatók az azt leíró mutatók, valamint azok célértékei. Ezen mutatók definiálásakor érdemes azt figyelembe venni, hogy a létrehozott mutató előállításának ne legyen magasabb a költsége, mint amekkora hasznot hozhat maga a mutató, azaz legyen költségtakaékos. 1. Végrehajtás A végrehajtás az előző(tervezési) fázis során meghozott döntések normál üzletmenetbe való implementálását jelenti. Ezzel átültetve a működésbe a folyamatcélokat. 2. Ellenőrzés Ahhoz, hogy az előbb végrehajtott két fázis sikeresen működhessen elengedhetetlen azoknak az ellenőrzése. Ebben a szakaszban ellenőrizzük azt, hogy a korábban meghatározott stratégiai és operatív céloknak vajon eleget tesznek-e a folyamatok. Ebben a szakaszban történik a terv/tény összehasonlítás, valamint az esetleges eltérések okainak felderítése. Ezt az eltérést meg kell vizsgálni minden egyes folyamat esetében, és ahhoz, hogy megállapíthassuk ennek esetleges okait meg kell nézni a folyamatokhoz tartozó mutatókat is(azok célértéktől való eltérését). Ezen eltérések elemzésére gyakran használnak vizuális megjelenítő eszközöket (pl.grafikonok, ábrák, cockpit), azért hogy ezek elemzése jóval gyorsabban megtörténhessen, illetve már ránézésre látni lehessen mi az, ami nem a normál üzletmenetnek megfelelően működik. A stratégiai és operatív célok ellenőrzését nem érdemes ugyan olyan rendszerességgel vizsgálni, hiszen míg egy stratégiai célhoz képesti eltérést jellemzően elegendő negyedévente vizsgálni, addig az operatív működést lehet akár naponta is ellenőrizni a gyorsabb beavatkozás érdekében. 3. Beavatkozás Az előző szakasz során feltárt hiányosságok, illetve problémák esetén gyakran elengedhetetlen a korábban meghatározott folyamatokon való változtatás. Ezen kiigazítások elindítanak egy újabb tervezési fázist, ahol újra meghatározzák az egyes folyamatcélokat. 2.5 Üzleti intelligencia szervezeti keretei és irányítása Az üzleti intelligenciával való foglalkozás céljaira létrehozható egy szervezeti egység, amelynek a fő feladatai a következők lehetnek: Az üzleti intelligencia stratégia kialakítása; Koncepcióalkotás, tanácsadás Az igények, követelmények rangsorba állítása, a szakmai tartalom figyelembevételével; 16 (106)
A szervezeti és informatikai stratégia illesztése Az üzleti intelligenciát alkalmazók, oktatása, képzése, szakmai támogatása; Az ismerte, tudás, bevált gyakorlat átadásának megszervezése a szervezeten belül; A kulcsfelhasználók tevékenységének szervezése és irányítása; Az üzleti intelligencia projektek folyamatainak, alkalmazási módszereknek a kialakítása; Az üzleti intelligencia mint információrendszer szolgáltatással kapcsolatos szolgáltatási szint megállapodások kezelése.; 2.6 Egy üzleti intelligencia rendszer klasszikus adatáramlási architektúrája 7. ábra Üzleti intelligencia klasszikus architektúrája [Forrás: IFUA] Az ábra (7. ábra) leegyszerűsítve az adat áramlásának lehetséges útjait mutatja egy tipikus üzleti intelligencia rendszerben. Az adatáramlásnak három fő állomása van: Forrásrendszer (adatforrás): ezek jellemzően a belső tranzakciós(oltp) rendszerek, de lehetnek bármilyen más külső rendszerek vagy adatok a források. Ezek a rendszerek már az üzleti intelligencia rendszer bevezetése előtt jelen vannak a vállalatnál, erre épül az adatáramlási rendszer többi szintje. Nem szabad elfelejteni, hogy ezek a rendszerek eltérő struktúrájúak, inhomogének lehetnek. Adattárolási réteg: ebben a rétegben találjuk az adattárházat, melyet hívhatunk az üzleti intelligencia központjának. Itt állnak elő azok az adatok, amelyek különböző rendszerekben találhatóak meg. Az adattárház feladata ezeknek az alapadatoknak az üzleti logika szerinti rendezése, valamint ezen adatok előkészítése az elemzéshez. Az ábrán láthatunk az adattárolási rétegnél egy úgynevezett előkészítő területet. Erre azért van szükség, hogy a forrásrendszer integritását megőrizzük, és a terhelését csökkentsük. Ezen kívül azért, hogy a különböző gyakorisággal előálló adatok adattárházba való betöltése előtt egy közös adatbázis területen raktározhassuk. A szaggatott vonallal jelöli az ábrán az üzleti intelligencia rendszer adatáramlásának alternatív lehetőségeit. Lehetőség van a köztes eszközök, mint például az előkészítő adatbázis terület (staging area) kihagyására, így az adatok közvetlenül betölthetők a forrásrendszer(ek)ből az adattárházba, vagy egy multidimenzionális elemzőeszközbe. Végül nem szabad elfeledkezni a végfelhasználók által legtöbbet látott megjelenítő eszközről sem. Az adattárház és a multidimenzionális elemzőeszköz is lehet adatforrása a megjelenítő eszköznek. Adattárház akkor lehet forrása közvetlenül a megjelenítő eszköznek, amikor az ott tárolt adatokat, általában statisztikai módszerekkel elemezzük, és próbálunk az ott található adatokból új információt, üzleti tudást kinyerni szakértői tapasztalat és emberi tudás segítségével. Ezt a folyamatot nevezzük adatbányászatnak. 2.7 Adat, információ, tudás és az információs igény Az üzleti intelligencia fogalom rendszerével jobban megismerkedhessünk szükséges néhány magától értetődő informatikai alapfogalmat tisztázni. Adat: Jelek sorozata (pl. bitek, betűk, karakterek ), amelyek számítástechnikai eszközökkel feldolgozhatók és megjeleníthetők. 17 (106)
OLAP alapfogalmai Információ: Olyan adat, amely csökkenti a világról alkotott ismeretek bizonytalanságát. Tudás: Az információt aktív, cselekvéssé tudja alakítani. 2.8 Mutatószám rendszer (Scorecarding) A mutatószám rendszer (scorecarding) olyan módszer, ahol a vállalati stratégiából mutatószámokat képzünk, ezek teljesülése mérhető és a vállalati teljesítményről visszajelzést ad. A mutatószámokat kulcs teljesítmény jelzőknek nevezik (Key Performance Indicator-oknak (KPI)). A mutatószámok képzésével a vállalati tevékenységből képződő adatok aggregálása, szelekciója történik, amit hozzárendelnek a teljesítmény méréséhez. Minden munkavállaló által érthetővé válik, milyen célokat kell elérni. 2.9 Üzleti, vállalati teljesítmény kezelés (Business Performance Management) A BPM, azaz üzleti teljesítmény menedzsment olyan menedzselési és elemzési folyamatokat takar, amik segítik a vállalatokat stratégiai célok definiálásában, majd a teljesítmény mérését ezen célok tükrében. A BPM különböző forrásokból származó adatok elemzését, összesítését teszi lehetővé. A folyamatok javítását pedig visszajelzési csatornák létrehozásával, fejlesztésével éri el. Itt is szerepet kapnak a teljesítményi kulcsjellemzők (key performance indicators). Fontos a prioritásukat pontosan meghatározni, hogy jó mérési eredményeket kapjunk. Teljesítményi kulcsjellemző lehet például: eladási adatok termékszegmensre bontva, új vásárlók száma adott időszakban, vásárlók megoszlása demográfiai csoportonként. Ezen, jól definiált jellemzők mentén leírható a vállalat tevékenysége, mérhetővé válik a teljesítmény. Időszakokat lehet jól összehasonlítani. Figyelemmel kell lenni az adatok elérhetőségének biztosítására. Ahogy fejlődik az informatikai háttér, úgy várnak el a döntéshozók minél aktuálisabb mutatószámokat. Manapság már napra pontosan lehet ezeket generálni, megmutatva nem csak azt, hogy milyen volt a vállalati teljesítmény 1 hónappal ezelőtt, hanem, hogy akár 24 órája. 3 OLAP alapfogalmai Az OLAP (on-line analytical processing) legfontosabb ismérve, hogy lehetővé teszi az adatok gyors és rugalmas lekérdezését, majd ezt követő elemzését, mindezt többdimenziós nézetekre, struktúrákra alapulva. A többdimenziós elemzések lehetővé teszik, hogy a vállalat az adatainak mint vagyonának maximális értékét használja ki. Nagy adatmennyiséget alakít át információvá, melyet üzleti kontextusban elemezhet a felhasználó. Ezzel a 18 (106)
OLAP alapfogalmai többdimenziós nézettel a felhasználó számára könnyen átlátható a vállalati teljesítmény és a piaci, gazdasági tendenciák (Cognos white paper, 2006). 3.1 Az OLTP és az OLAP A felhasználói igények növekedése és a technológiai fejlődés a 90-es években felerősítette az integrációs tendenciákat az információrendszerek egyes funkciói között. A tranzakció-feldolgozó rendszer (TPS) a vezetői információrendszerrel (MIS) összeolvadva egy új információrendszer megjelenését eredményezte, a tranzakcióorientált integrált információrendszerét (OLTP). A felsővezetői információrendszerek (EIS) pedig a döntéstámogató rendszerekkel (DSS) hoztak létre újfajta alkalmazást, a már említett OLAP rendszereket. Ezen integrációk láthatóak az ábrán (8. ábra). EIS OLAP DSS MIS TPS OLTP 8. ábra OLTP és OLAP (Kő Lovrics, 2003) A hagyományos on-line adatbázis-rendszerek fő feladata az on-line tranzakciók és lekérdezések megvalósítása. Ezeket a rendszereket ún. on-line tranzakció feldolgozó (OLTP, on-line transaction processing) rendszereknek nevezzük. Ide sorolhatók például a raktárnyilvántartások, a könyvtári kölcsönzési adatbázisok vagy a számlanyilvántartó-rendszerek. Az OLTP és az OLAP közötti különbségeket az alábbiakban lehet összefoglalni: 1. Táblázat Az OLTP és az OLAP összehasonlítása OLTP OLAP Alkalmazás Tranzakciók és lekérdezések Adatelemzés Felhasználók Rendszer orientációja Adattartalom és - mennyiség Adatbázistervezés Adminisztrációt végző alkalmazottak és informatikusok Felhasználó-orientált Aktuális adatok, kisebb adatmennyiség Relációs adatmodell Vezetők, döntéshozók és az őket segítő elemzők Piacorientált Nagy mennyiségű történeti adat Multidimenzionális vagy relációs adatmodell (csillagséma) 19 (106)
OLAP alapfogalmai Adatforrás Hozzáférés Vállalat aktuális adatai Nagyobb konkurencia (rövid, gyakrabbi tranzakció) Különböző adattárak (külső és belső) adatainak integrációja Kisebb konkurencia (általában csak olvasási művelet) 3.2 Dr. Codd s OLAP szabályai A Codd által 1993-ban definiált követelményrendszer 12 szabálya, mely meghatározza az OLAP-eszközökkel szembeni általános követelményeket (Abonyi, 2006, 50.oldal): 1. Többdimenziós nézet: az OLAP termékekben az adatok modellje többdimenziós és többváltozós, így lehetővé válik, hogy a felhasználó igény szerinti műveleteket (adatszeletek kiválasztása (slice and dice), forgatás, lefúrás (drill down), stb.) végrehajtson. Ennek lényege abban áll, hogy a vállalatot több dimenzió mentén lehet vizsgálni. Például az értékesítési adatokat könnyedén lebonthatjuk a különböző régiókra, termékekre vagy éppen időszakokra. 2. Átláthatóság a felhasználó számára: a felhasználónak ne kelljen tudni, hogy az adatok fizikailag vagy logikailag milyen módon vannak tárolva. Mivel az OLAP rendszerek mindennapi használatban vannak, fontos, hogy a felhasználók átlássák működését, és ennek köszönhetően ne legyenek kiszolgáltatva a betöltött adatforrásoknak, képesek legyenek a rendszer működési logikájához alkalmazkodni. 3. Hozzáférhetőség: az OLAP, mint közvetítő. Codd eredeti elképzelése szerint az OLAP egy a heterogén adatbázis és az OLAP-felhasználói felülete (front-end) része között elhelyezkedő eszköznek kell lennie. Az OLAP rendszernek tudnia kell egy olyan logikai struktúrát alkalmaznia, amely elfedi azt, hogy valójában különböző forrásból származó heterogén adatokat, adatbázisokat ér el, és ezeket az adatokat a célnak megfelelően fel tudja dolgozni. 4. Stabil vagy egyenletes lekérdezési teljesítmény: a dimenziók számának és az adatbázis méretének növelésével a felhasználónak nem szabad lényeges teljesítménycsökkenést érzékelnie. 20 (106)
OLAP alapfogalmai 5. Információ architektúra (Kliens-szerver architektúra, manapság gyakran háromrétegű architektúra): az adattárházak esetében előforduló hatalmas méretű adattömeget nagyteljesítményű szervereken tárolják tehermentesítve ezzel a PC-ket. Maguknak az OLAP szervereknek (alkalmazási, szoftver és hardver) is intelligensnek kell lenniük. Tudniuk kell a különböző adatbázisok adatait tárolni és aggregálni. 6. Általános érvényű dimenziófogalom: Minden adatdimenziónak azonos struktúrával, és működési elvvel kell rendelkeznie. Napjainkra azonban ez a szabály a legvitatottabb és legkevésbé teljesített szabállyá vált. 7. Dinamikus ritkamátrix-kezelés (sparsity): az OLAP-eszközöknél használt többdimenziós adatmodellek miatt garantálni kell a ritkamátrixok feldolgozásának optimális feltételeit. 8. Több párhuzamos felhasználó támogatása: könnyen előfordulhat, hogy több felhasználó ugyanazzal az adatmodellel szeretne dolgozni, vagy azonos adatokból különböző modelleket szeretne létrehozni. Az OLAPeszközöknek biztosítani kell a párhuzamos, konkurens elérést, az adatok védelmét és épségét, sértetlenségét (integritását). 9. Korlátozás nélküli dimenzióműveletek: a dimenziók közötti műveletek összes formáját meg lehessen valósítani. 10. Intuitív adatkezelés: a felhasználók számára az adatok kezelése közvetlenül a megjelenítési felületen történhet. A felhasználók számára olyan szolgáltatásokat kell nyújtani, hogy a felhasználók képesek legyenek az adatokat összefüggéseikben látni, kezelni, feldolgozni, az összefüggéseket feltárni. A szolgáltatásnak egyszerű elérést kell biztosítania, nem szükséges a főmenüben vagy a felhasználói felületen keresztül többlépéses, bonyolult módon keresni. 11. Rugalmas alakítható jelentés készítés: az adatok megjelenítésének legkülönbözőbb módjai legyenek támogatva. A felhasználó számára lehetővé kell tenni, hogy mindig a saját igényeinek megfelelő nézetben 21 (106) tudja megtekinteni az információkat.
OLAP alapfogalmai 12. Korlátlan dimenzió szám: szó szerint értelmezve az OLAP-eszköz legyen képes tetszőleges számú dimenzió és hierarchiaszint kezelésére. A rendszer által támogatott dimenziók számának korlátlannak kell lennie, hogy bármilyen szempont alapján lehessen vizsgálni az adatokat. Ezeknek a dimenzióknak a felhasználók által kívánt, bármilyen aggregációs szintű lekérdezést biztosítaniuk kell. A valóságban természetesen egyetlen számítógép sem tud megfelelni ennek a kritériumnak. Codd javaslata alapján legalább 15, de inkább 20 dimenziót kell tudnia kezelnie a szoftvernek, noha a tapasztalatok szerint egy konkrét adatkocka esetén ritkán van igény 8-10 dimenziónál többre. Codd felismerte azt, amit már a döntéstámogatással foglalkozó szakértők régóta hangoztattak: a napi, folyamatos működési adatok önmagukban nem alkalmasak a vezetők kérdéseire választ adni. Az OLAP egy olyan döntéstámogató szoftver-technológia, amely segítségével különböző vizsgálati szempontok és azon belül különböző aggregáltságú (összegzettségű) adatok alapján több dimenzióban elemezhetjük a vállalatunk működése során keletkezett alapadatokat. (Kókai Lászlóné, 2005, 35. old.) Az OLAP technológia elsődleges feladata az elemzéshez szükséges információk minél gyorsabb és egyszerűbb elérésének a biztosítása. Erre az OLAP egy ún. többdimenziós adatbáziskezelőt használ, amely segítségével az adatokat több vizsgálati szempont (dimenzió) mentén vizsgálhatjuk. A multi-dimenzionális adatbázist úgy kell elképzelni, mint egy kockát, amelynek minden éle egy, a vállalkozás számára fontos jellemzőket (dimenziót) képvisel (Kókai Lászlóné, 2005). Bár Codd 12 jellemzője kétségtelenül a legismertebb leírása az OLAP-nak, vannak e mellett más módszertanok is. A BARC (Business Application Research Center) kutatóközpont szerint a 12 meghatározás túl sok, nehezen követhető a fejlesztők számára. Emellett sok implementációval kapcsolatos megkötést tartalmaz, ami a túlzott gyártói befolyásra utal. 1995-ben kiadták leegyszerűsített, termék-független OLAP meghatározásukat, a FASMI ( Fast Analysis of Shared Multidimensional Information )tesztet. [Pendse, 2008] Ez az alábbi 5 kulcsfontosságú feltételből áll: Fast: A gyorsaság ebben az esetben úgy értelmezhető, hogy a felhasználó átlagban maximum 5 másodperc alatt választ kap legtöbb lekérdezésére, feltéve, hogy a legegyszerűbb analitikai kérdésre kevesebb mint egy másodperc alatt megérkezik a válasz, míg a komplexebb esetekben is ritkán tart 20 másodpercnél tovább. Ennek alapja, hogy egyes kutatások szerint a felhasználók 30 másodperces várakozás után hajlamosak azt hinni, hogy a folyamattal valami baj történt. 22 (106)
OLAP alapfogalmai Analytical: Az analitikus tulajdonsága az OLAP rendszereknek arra utal, hogy tetszőleges, a felhasználó számára fontos, üzleti logikai vagy statisztikai számítást el kell tudjon végezni. Noha mininmális programozásra szüksége lehet a felhasználónak új, ad hoc típusú számításai elvégzéséhez és az eredmények kívánt módon történő megjelenítéséhez, de célszerű ezt minimális szinten tartani. Shared: A megosztott tulajdonsága azt jelenti, hogy az eszköz teljesít minden, az adatok bizalmas kezeléséhez szükséges biztonsági követelményt, továbbá olyan esetekben, amikor lehetőség van az adatok egyidejű írási elérésére, képes a helyzetet megfelelő módon kezelni. Multidimensional: Az OLAP alkalmazások többdimenziós volta kulcskövetelmény. Ha egyetlen tulajdonságot kellen kiemelni, akkor ez lenne az, ezért a következő fejezetben részletesen foglalkozom vele. Information: Maga az információ. A két módszertanban közös, hogy kulcsfontosságúnak tartják az adatok multidimenzionális szervezését. A multidimenzionális modellen alapuló OLAP megoldásokat MOLAP rendszereknek hívjuk. Ezek úgy tárolják az adatokat, hogy minél könnyebben és gyorsabban lehessen lekérdezéseket végezni rajtuk. Ezt úgy érik el, hogy az adatokat nemcsak egy kulcs szerint lehet elérni, hanem lehetőség van több kulcs szerinti elérésre is. A kulcs jellemzők ebben az esetben a dimenziókat jelentik. [Fajszi-Cser, 2004] 9. ábra: Eladási adatok háromdimenziós adatkockája4 3.3 Adatkocka - Többdimenziós elemzés alapfogalmai A többdimenziós elemzés az adatokat egy jól vizsgálható struktúrába rendezi, melyet adatkockának nevezünk. Ez a struktúra az adatok többdimenziós nézetét szolgáltatja például, melyik termékből adtuk el a 4 Forrás: Sidló Csaba, 2004, 16. old. 23 (106)
OLAP alapfogalmai legtöbbet adott területen, időszakban és eladási csatornán. Ez a nézet átláthatóvá teszi a vállalatot és információt szolgáltat a döntéseknél (Cognos white paper, 2006). Az OLAP terminológiába tartozó legfontosabb fogalmak: Dimenzió (dimension) egy tranzakcióhoz köthető attribútum, egy meghatározó mező. Ilyen például a termék, dátum, eladó. E három dimenzió által létrehozott adatkocka látható a 8. ábrán. Hierarchia (hierarchy) a dimenziókhoz gyakran hierarchiákat rendelünk, melyek meghatározzák az adatok megjelenítésének részletességét, azok csoportosítását. Így például nap hónap negyedév év a dátum dimenzió hierarchiáinak lehetséges szintjei. Mérték (measure) adatmezők, melyek valójában összeadható mennyiségek. Ilyen például egy konkrét termék ára. A szakirodalom a mértéket gyakran ténynek (fact) is nevezi. Kategória (category) A Cognos megfogalmazása szerint a kategóriák dimenziókhoz hozzárendelt adatpontok, melyek gyakran hierarchiába rendezhetőek. Ilyen kategóriák például az év dimenzióban a 2004 és 2005. 3.4 Műveletek a többdimenziós adatelemzésben Felgöngyölítés (roll up) ez a művelet az adatkockán az adatok összevonását, csoportosítását végzi el oly módon, hogy csökkenti a dimenziók számát, vagy összevonja a valamely dimenzió elemcsoportjaihoz tartozó értékeket. Az előbbi esetre példa lehet ha az értékesítésből eltávolítjuk az idő dimenziót, így a mindenkori értékesítést kapjuk meg. Az utóbbira példa, ha az eladókat régiónként csoportosítjuk (10. ábra a. ábra), melyet a szakirodalom összegzésnek is nevez. Lefúrás (drill-down) ez a művelet a felgöngyölítés ellentéte, hiszen a kevésbé részletes adatokból a jobban részletezett adatok 24 (106)
OLAP alapfogalmai felé visz. A lefúrás is megvalósítható oly módon, hogy egy dimenzió hierarchiarendszerében egy szintet lefelé lépünk vagy pedig dimenzió hozzáadásával. Lefúrásra példa lehet ha az idő dimenzió hierarchiaszintjében egy szintet lefelé lépve a negyedév helyett a hónapokra lebontva mutatjuk meg az értékesítési darabszámokat (10. ábra b. ábra). d. Kockázás a. Felgöngyölítés c.szeletelés Hónap: 1 2 3 4 5 6 7 8 9 10 11 12 e.elforgatás Adatkocka b.lefúrás 25 (106)
OLAP alapfogalmai 1.1.1 MOLAP 26 (106) 10. ábra Az adatkockán végezhető műveletek (Abonyi, 2006, 62.oldal) Szeletelés (slice) ezt a műveletet a kocka egy dimenzióján hajtjuk végre. A művelet eredménye a kocka egy része, egy szelete. A 10. ábra c. ábrán például egy konkrét eladó szelete látható, azaz meghatározott eladó értékesítési adatai. Kockázás (dice) a művelet során részkockát választunk ki, azaz az egyes dimenziók szeletei által meghatározott kocka metszetet választjuk ki. A 10. ábra.d. ábrán látható kockázás művelet a központi kockán a következő feltételekkel hajtódott végre: termék legyen P2, P3, időpont legyen I, II negyedév, eladó legyen S3, S4. Elforgatás (pivot vagy rotate) ennek a megjelenítési műveletnek az a célja, hogy a kocka tengelyeit az adatprezentációban úgy rendezzük át, hogy az adatokat megfelelő elrendezésben lássuk. Ez a jelentések átalakításának egyszerű módszere, ezzel a művelettel egy pillanat alatt egy új jelentéshez juthatunk (10. ábra e. ábra). Egyéb OLAP műveletek: bizonyos OLAP rendszerekben további műveletek találhatóak. Ilyen például a keresztülfúrás (drill-across), mely egyszerre több ténytábla lekérdezését végzi el. MOLAP: Multidimensional OLAP, azaz olyan OLAP megoldások, melyek saját speciális adatbázis-kezelővel közvetlenül valamely multidimenzionális célstruktúrában tárolják az adatokat. Nagy hagyományokkal rendelkező megközelítés, szinte a relációs adatbázis-kezelővel egyidőben megjelent a multidimenzionális elemzési célú tárolás: a 70-es évek elején két MIT hallgató fejlesztett ki egy modellt és működő rendszert, amely jóval később az Oracle Express termékcsalád alapját is képezte. 1.1.2 ROLAP ROLAP: Relational OLAP, azaz olyan OLAP megoldások, ahol az adatok tárolását hagyományos relációs adatbázis-kezelővel végezik. Itt a multidimenzionális megjelenést speciális relációs adatbázis-sémákkal biztosítják. Ez a leginkább elterjedt megoldás, ami főképp rugalmasságára és a relációs adatbázis-kezelők viszonylagos olcsóságára és megbízhatóságára, valamint a relációs tárolási technika kiforrottságára vezethető vissza 1.1.3 HOLAP