AZ IGAZI BIG DATA hogyan használják a világban és egyáltalán használják-e hazánkban? Médiapiac 2015 Eger, 2015.03.18 Dévényi Edit Dunai Albert K&H Bank és Biztosító 1
Nem értek hozzá! Mi tart vissza? Túl drága! Nincs adatom! Úgysem adják oda! érzelmileg üzleti hatásait tekintve Nem Nem vagyok vagyok kész kész rá! rá! technikailag 2
Nem értek hozzá! Mi tart vissza? Túl drága! Nincs adatom! Úgysem adják oda! érzelmileg üzleti hatásait tekintve Nem Nem vagyok vagyok kész kész rá! rá! technikailag 3
AZ ANALITIKA EVOLÚCIÓJA Mi történt? Mi lett a következménye? Mikor és hol? Miért történt? Érték Optimalizáló Előrejelző Feltáró Leíró Statisztikai elemzés Standard riport CLTV alapú kampány Affinitás modellezés Taktikai mikroszegmentáció Dashboard készítés Ad-hoc riport Üzleti riasztás és trigger BI (DSS) riport Viselkedés alapú optimalizáció Next best offer (TOP3) Query drill-down Ügyfélérték (CLTV) Előrejelzés OLAP* Sztochasztikus optimalizáció SoW becslés Komplexitás Mi fog történni? És mikor? Folyamat optimalizáció Proaktív megtartás EBO valós időben perszonalizálva Közösségi hálózatelemzés Mit csináljak, hogy elkerüljem/ elősegítsem? Hogyan? Szemantikus analízis In-database elemzés *OLAP: On-line Analytical Processing 4
A CÉL UGYANAZ: AZ ADATBAN REJLŐ TUDÁS KIAKNÁZÁSA Feldolgozási idő és munkaigény Big Data Dinamikus árazás Analitikus CRM Kockázati besorolás Adatelemzés Termék penetráció Időjárás, lokáció, geostatisztika Ügyféladat Panasz, reklamáció Szegmentáció Fizetési szokás Hang / audio/ kép / video Ügyfél életút Vásárlás Termék affinitás Kommunikáció történet Weblog/ kattintás stream Esemény alapú riasztás Csatorna preferencia Tulajdon / Vagyon SoW* Közösségi interakció Szenzor/ okos eszköz (M2M) Blog, online aktivitás Dinamikus csatorna Tranzakciós háló / Hívásinformáció Kereső marketing Kapcsolati adat Tranzakcionális adat Kampány válasz E-bank kattintás stream *SoW: Share of Wallet Növekvő komplexitás és adat-sokféleség 5
A BIG DATA IGAZI EREJE A VALÓS IDEJŰSÉG A világon jelenleg gyűjtött adatok 80%-a strukturálatlan! Percenkénti több ezer blogpost, feltöltött kép és videó több százezer tweet bejegyzés és facebook update több millió elküldött e-mail és beütött google keresés 6
Nem értek hozzá! Mi tart vissza? Túl drága! Nincs adatom! Úgysem adják oda! érzelmileg üzleti hatásait tekintve Nem Nem vagyok vagyok kész kész rá! rá! technikailag 7
A BIG DATA MINDENÜTT KIAKNÁZÁSRA VÁR PUSZTÁN CSAK A MEGLÉVŐ PRIMER KUTATÁSOK MÖGÉ KELL ILLESZTENI, ILL. AZOKAT ADATGAZDAKÉNT SECUNDER MÓDON ÚJRAHASZNOSÍTANI Egészségügy Gyártástechnológia Telekommunikáció Pénzügy Biztonság Kereső optimalizálás Log analízis Fraud és kockázat elemzés Közlekedés Értékesítés Értékpapír kereskedelem Churn és NBO* *NBO: Next best offer 8
AZ EREDMÉNYEINK ÖSSZEKAPCSOLÁSA MÉG PONTOSABB ÜGYFÉLISMERETET EREDMÉNYEZ BIG DATA ÜZLETI ANALITIKA PIACKUTATÁS Adatmennyiség Nagyobb/ gyorsabban változó/ sokféle/ strukturálatlan/ hibákkal teli (Peta-Hexabyte) Nagy adatmennyiség, sok változó (Giga-Terabyte-ok) Viszonylag kevés számú változó (fix elemzési táblák - excel méret) Adatforrás Valós idejű hozzáférés több és sokféle külső forráshoz Forrásrendszer, adattárház Kérdőíves felmérés Megfigyelés Cél rögzítése nélkül tárolt információegységek dinamikusan változó sémák Nagyszámú, célzottan gyűjtött megfigyelések, statikus sémák Célzott mintavétel, becslés Számítási idő Kritikus Tervezhető Mérsékelt Problémák Strukturálatlanság és valósidejű modellezés Képzett változók kiválasztása és a modell túlzott illeszkedése Változó és modell kiválasztása Jól kérdezés 9
Nem értek hozzá! Mi tart vissza? Túl drága! Nincs adatom! Úgysem adják oda! érzelmileg üzleti hatásait tekintve Nem Nem vagyok vagyok kész kész rá! rá! technikailag 10
MILYEN IS EGY DATA SCIENTIST? MATEMATIKA ÉS STATISZTIKA Gépi tanulás Felügyelt és felügyelet nélküli tanítás Kísérlettervezés PROGRAMOZÁS ADATBÁZISOK Számítás tudomány Adatbázis kezelők SQL - NoSQL Programnyelvek (Python) Statisztikai nyelvek (R) Hadoop/ Hive/Pig ÜZLETI ISMERET ÉS HOZZÁÁLLÁS Szenvedély Kíváncsiság Kreatív problémamegoldó attitűd Stratégiai, proaktív, innovatív hacker szemlélet KOMMUNIKÁCIÓ ÉS VIZUALIZÁCIÓ Történetmesélés Adat alapú insight-ok döntéssé, akcióvá formálása Vizualizációs eszközök Vizuális művészet 11
MENNYIBEN MÁS? LÉPÉS CRISP-DM* MÓDSZERTAN Üzleti Probléma Megértése Üzleti Követelmények Meghatározása Üzleti probléma megértése Adatok feltérképezése Adatok Feltérképezése Adatszintű Követelmények és Lehetőségek Megismerése Megvalósítás Adat Adatok előkészítése Modellalkotás Adatok Előkészítése Modellalkotás Adatelőkészítés, Elemzés, Változó Származtatás Modellkiválasztás, Elemzés Modelltanítás Kiértékelés Kiértékelés Tesztelés és Kiértékelés Hatékonyság mérés Üzleti értelmezés Megvalósítás Üzleti és Technológiai Implementáció Oktatás/képzés *CRoss Industry Standard Process for Data Mining 12
Nem értek hozzá! Mi tart vissza? Túl drága! Nincs adatom! Úgysem adják oda! érzelmileg üzleti hatásait tekintve Nem Nem vagyok vagyok kész kész rá! rá! technikailag 13
A KELLŐ ÜGYFÉLISMERET HIÁNYA NEM (CSAK) A TERABYTE-OK FELDOLGOZOTTSÁGÁN MÚLIK 100 Ügyféladat Elérés Terabyte 75 50 25 Tudásbeli szakadék Végrehajtási űr Analitikus Kapacitás Alkalmazási Kapacitás 0 1960 1970 1980 1990 2000 Idő 2010 14
KEZDJÜK KICSIBEN: SEGÍTSÜNK JÓL KÉRDEZNI! 37% Sohasem panaszkodott 31% Úgy érzi, nem éri meg visszajelzést adni 47% Boldogtalan, de ritkán panaszkodik (néhány évente formál véleményt) 45% Egyenesen a versenytárshoz megy egy rossz élményt vagy negatív tapasztalatot követően 12x Pozitív szolgáltatási élmény szükséges EGYETLEN negatív eset jóvátételéhez 15
Nem értek hozzá! Mi tart vissza? Túl drága! Nincs adatom! Úgysem adják oda! érzelmileg üzleti hatásait tekintve Nem Nem vagyok vagyok kész kész rá! rá! technikailag 16
MEGÚJUL AZ ÜZLET SZEMLÉLETE IS! Hagyományos kutatócég Elemző partner Kell a kutatás Mennyiségben gondolkodunk Az ár a fő szempont Akarom az elemzést Minőségben versenyzünk Az érték az elvárás 17
Nem értek hozzá! Mi tart vissza? Túl drága! Nincs adatom! Úgysem adják oda! érzelmileg üzleti hatásait tekintve Nem Nem vagyok vagyok kész kész rá! rá! technikailag 18
EZ MÉG CSAK SCIENCE FICTION!? A legnagyobb kérdés a társadalmi szemlélet változása! A megkérdezettek 49%-a állítja, hogy a következő öt évben kevesebb személyes információ megosztására hajlandó. 78% szerint a személyes adataik ismeretében a vállalatok több profitot tudnak termelni. MÍG: A vállalatok 80%-a még tapasztalatlan a big data felhasználása kapcsán! Elgondolkodtató: Szenzorok mellett nincs szépítés, vélt elvárásoknak megfelelés, nem lehet elrejteni érzéseket győz az igazság! / 19
Dévényi Edit Dunai Albert Edit.Devenyi@kh.hu Albert.Dunai@kh.hu 20