Gyors sikerek adatbányászati módszerekkel

Hasonló dokumentumok
Gyors sikerek adatbányászati módszerekkel

Tartalom. Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben.

Retro adatbányászat. Kovács Gyula Andego Tanácsadó Kft.

Nyílt forráskód, mint üzleti előny. Szücs Imre VTMSZ - CMC Minősítési előadás Ha valamit érdemes csinálni, akkor azt megéri jól csinálni

Projektvezetői döntések támogatása webbányászattal

Pentaho 4: Mindennapi BI egyszerűen. Fekszi Csaba Ügyvezető október 6.

Big Data adattárházas szemmel. Arató Bence ügyvezető, BI Consulting

Takács Árpád K+F irányok

Hálózati elemzések az üzleti életben. Kovács Gyula Sixtep Kft.

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

Takács Gábor mérnök informatikus, okl. mérnöktanár

Adatbányászat a felhőben

BIG DATA ELEMZÉSEK LEHETŐSÉGEI

Fiktív cégek a hálóban

Adatbányászati, data science tevékenység projektmenedzsmentje

Adatbányászati, data science tevékenység

Fiktív cégek a hálóban

Adatbányászat az Oracle9i-ben. Fekete Zoltán vezető termékmenedzser

Microsoft SQL Server telepítése

Soltész Gábor. Önéletrajz Budapest, Lechner Ödön fasor em 26. a.

1. HÉT: CRM RENDSZEREKRŐL ÁLTALÁBAN

Innovatív trendek a BI területén

Így kampányolunk mi. Hans Zoltán. Szolgáltatás Fejlesztés és Online Irányítás vezető. IBM-SPSS üzleti reggeli (Budapest)

A kibontakozó új hajtóerő a mesterséges intelligencia

Adatbányászat és Perszonalizáció az Oracle9i-ben

Ropogós - Oracle BI EE 12C

OpenCL alapú eszközök verifikációja és validációja a gyakorlatban

Csalásfelderítés hálózatokon keresztül. Innovatív BI konferencia, Budapest,

Gépi tanulás a gyakorlatban. Bevezetés

1. HÉT: CRM RENDSZEREKRŐL ÁLTALÁBAN

Papp Attila. BI - mindenkinek

Intelligens közlekedési rendszerek (ITS)

SZTE Eötvös Loránd Kollégium. 2. Móra György: Információkinyerés természetes nyelvű szövegekből

ACCESS PROJEKT Innovatív eredmények a felnőttképzés területén

Tanulás tanuló gépek tanuló algoritmusok mesterséges neurális hálózatok

Kutatás-fejlesztési eredmények a Számítógépes Algoritmusok és Mesterséges Intelligencia Tanszéken. Dombi József

RapidAnalytics Enterprise Edition bevezetés a Telenor Magyarországnál. Szakács Balázs - Telenor Magyarország Szücs Imre United Consult

Átlátni és rendszerezni Az adatbányászat, a CRM és a piackutatás kapcsolata

Segítség, összementem!

kodolosuli.hu: Interaktív, programozást tanító portál BALLA TAMÁS, DR. KIRÁLY SÁNDOR NETWORKSHOP 2017, SZEGED

Adatbányászati technikák (VISZM185) 2015 tavasz

Big Data az adattárházban

Self service reporting fogások, technikák és megoldások controllereknek, nem csak Excel alapon

Hogyan lesz adatbányából aranybánya?

Google App Engine az Oktatásban 1.0. ügyvezető MattaKis Consulting

Mesterséges Intelligencia Elektronikus Almanach. Konzorciumi partnerek

Automatikus tesztgenerálás modell ellenőrző segítségével

Palaczk Péter A marketing folyamatok adattárház alapú támogatása

Sikerünk kulcsa: az információ De honnan lesz adatunk? Palaczk Péter

Autóipari vezérlőegységek aktív környezetállósági tesztelésének módszerei

Tipikus időbeli internetezői profilok nagyméretű webes naplóállományok alapján

Tipikus konverziós utak - Banki esettanulmány. Media Hungary, május 10. Dunai Zsolt, CIB Bank

Ügyfélkapcsolat menedzsment rendszerek nyílt forráskódú szoftverekkel. Herdon Miklós, Kaderják Gyula, Simon András

Teljesen elosztott adatbányászat alprojekt

Projekt beszámoló. NEWSIT News basedearlywarning System forintradaytrading: Hír alapú Korai Figyelmeztető Rendszer Napon belüli Kereskedéshez

IBM SPSS Modeler 18.2 Újdonságok

Neurális hálózatok bemutató

Nem minden könyvtáros grafikus, nem minden grafikus könyvtáros avagy annak (is) kell(ene) lennünk?

Marketing szolgáltatás tájékoztató

Térinformatika trendek 2013-ban. Kákonyi Gábor, GeoIQ kft. Mobil:

Beszédfelismerés. mit jelent, hogyan működik, kinek éri meg. Tibor Fegyó SpeechTex Kft.

Dokumentum kompozíció

PIACKUTATÁS VERSENYTÁRS ELEMZÉS

Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017.

TELJESÍTÉNYMÉRÉS FELHŐ ALAPÚ KÖRNYEZETBEN AZURE CLOUD ANALÍZIS

-közösségi oldal készítése, működtetése MEGTÉRÜLŐ KOMMUNIKÁCIÓS ÉS DIGITÁLIS SZOLGÁLTATÁSOK

Webanalitika a mindennapokban

Ügyfél- és címadatok feldolgozása Talenddel

Az információs portáloktól a tudásportálokig

Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs rendszerek Tanszék. Neurális hálók 2. Pataki Béla

SZTE Nyílt Forrású Szoftverfejlesztő és Minősítő Kompetencia Központ

A Jövő Internet Nemzeti Kutatási Program bemutatása

Mesterséges intelligencia alapú regressziós tesztelés

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

Közösség, projektek, IDE

Szoftver labor III. Tematika. Gyakorlatok. Dr. Csébfalvi Balázs

Statisztikai eljárások a mintafelismerésben és a gépi tanulásban

Flex: csak rugalmasan!

Projekt specifikus megvalósítás I. Merre tart az informatikai Hogyan érinti ez a megvalósítást Sándor Tamás

Vajda Éva. Keresőoptimalizált üzleti honlap

Enterprise extended Output Management. exom - Greendoc Systems Kft. 1

NAGY SÁV, NAGY VÉDELEM A KIBERBIZTONSÁG MODERN FAKTORAI. Keleti Arthur Kecskemét,

A D M D S M Z S t ev e é v k é e k n e y n s y ég é e e szeptember 20.

BRANCH TRANSFORMATION

G1) Bank specifikus kérdések: OTP

Új tehetséggondozó programok és kutatások

adroll A SIKER KISZÁMLÁZVA! KISKERESKEDELEM

ITIL alapú IT környezet kialakítás és IT szolgáltatás menedzsment megvalósítás az FHB-ban

Copyright 2012, Oracle and/or its affiliates. All rights reserved.

Szolgáltatás és Minőségfejlesztés a Corvinus Egyetemen Kiss György János Mogyorósi János

Van-e ingyen-ebéd? Avagy mire elég a nyílt forráskodú Pentaho? Fekszi Csaba Ügyvezető október 4.

COMPANY PROFILE SZOFI ALGORITHMIC RESEARCH KFT

CARE. Biztonságos. otthonok idős embereknek CARE. Biztonságos otthonok idős embereknek Dr. Vajda Ferenc Egyetemi docens

CSAPADÉKVÍZ GAZDÁLKODÁS A TELEPÜLÉSEKEN

Alter Róbert Báró Csaba Sensor Technologies Kft

Marketing szolgáltatás tájékoztató

A webanalitika változó világa 4 felvonásban

Gazdasági informatika alapjai

5G technológiák és felhasználási esetek

Adatbázis rendszerek. dr. Siki Zoltán

Átírás:

Gyors sikerek adatbányászati módszerekkel Kezdő adatbányászati workshop Petrócziné Huczman Zsuzsanna Tajti András 2016.10.25.

Petrócziné Huczman Zsuzsanna Andego Tanácsadó Kft. PBA, KÖBE, Fókusz Takarék, HVG Előtte: Kis adatbányászati tanácsadó cégek Szerencsejáték Zrt., Magyar Telekom, UPC International, OTP, Erste, Lombard BME, műszaki informatika, adatbányászat

Elvárások

Időbeosztás 9:00 12:00 Workshop I. 10:20 10:40 Kávészünet 12:00 13:00 Ebéd 13:00 16:00 Workshop II. 14:20 14:40 Kávészünet

Adatbányászat alapok tematika Adatbányászati történelem Az adatbányászati projektek folyamata Eszközök Rapid Miner két adatbányászati projekt R, Machine Learning Tajti András

Adatbányászati történelem Mit jelent az adatbányászat? Nagy mennyiségű adatból újszerű összefüggések kinyerése automatikus algoritmusok segítségével

Adatbányászati történelem Mikor és miért merült fel az igény? Az adattárolás története infografika 1960 Adathalászat 1980 Adatbázis bányászat 1990 Adatbányászat 2011 Data Science

Adatbányászati történelem Mennyi adat jön létre egy perc alatt?

Adatbányászati történelem Mekkora adatokkal találkozunk itthon? Céginfó adatbázis 1.8 GB (tömörítve) Vagyonbiztosítások 2 évi káreseménye 1.5 GB Prezi.com logfájlok: 800 GB/nap

Adatbányászati történelem 1997 IBM DeepBlue Kaszparov sakk-játszma 2011 IBM Watson in Jeopardy 2015 Önvezető autók 2016 Go-mester legyőzése (Google DeepMind)

Adatbányászati történelem Itt az első filmelőzetes, amit mesterséges intelligencia rakott össze Nagy bravúr: az orvosok elnézték, egy program mentette meg egy leukémiás nő életét Divattervező lesz az IBM új számítógépe Chef Watson: Megkóstoltam egy robot főztjét

Adatbányászati projekt folyamata 2 projektet viszünk végig ma Churn projekt Banki lemorzsolódáselemzés (Marketing projekt Banki ügyfél szegmentáció)

Adatbányászati projekt folyamata Határozzuk meg az üzleti célt Szerezzünk adatokat Készítsük elő az adatot Építsünk modelleket Nézzük meg, hogy teljesít Építsük be a folyamatokba CRISP-DM

Adatbányászati projekt folyamata Milyen típusú feladatok oldhatóak meg tipikusan gépi tanuló algoritmusokkal: Ki fogja visszafizetni a hitelt? Osztályozás Milyen vevőink vannak? Szegmentálás Akik ezt vették... Asszociációs szabályok Holnap mennyi pénzt hoznak be a pénztárba? Idősor-előrejelzés

Adatbányászati projekt folyamata Egyéb feladatok: Melyik email spam? Szövegbányászat I m Feeling Lucky Keresőmotor Milyen hatóanyaggal lehet gyógyítani téged Orvosi adatbányászat Kik a csalók? Hálózat-elemzés

Adatbányászati projekt folyamata Határozzuk meg az üzleti célt Szerezzünk adatokat Készítsük elő az adatot Építsünk modelleket Nézzük meg, hogy teljesít Építsük be a folyamatokba CRISP-DM

Adatbányászati projekt folyamata ADAT Honnan? Belső forrás Külső forrás (internet, piackutatás...) Mennyit? Hogyan lehet több adatunk?/hogyan mintavételezzünk? Mi a jó célváltozó-arány? Gondoljunk a validálásra is!

Adatbányászati projekt folyamata Határozzuk meg az üzleti célt Szerezzünk adatokat Készítsük elő az adatot Építsünk modelleket Nézzük meg, hogy teljesít Építsük be a folyamatokba CRISP-DM

Adatbányászati projekt folyamata Az adat közelebbről Objektumot leíró változók (+ Célváltozó) Adat-átalakítás Aggregálás, adatforrások összevonása Új változók generálása Hiányzó értékek kezelése Adattípus-átalakítások

Adatbányászati projekt folyamata Határozzuk meg az üzleti célt Szerezzünk adatokat Készítsük elő az adatot Építsünk modelleket Nézzük meg, hogy teljesít Építsük be a folyamatokba CRISP-DM

Adatbányászati projekt folyamata Milyen gépi tanuló algoritmus-családok vannak? Döntési fák Neurális hálók Regressziós modellek Klaszterező eljárások

Adatbányászati projekt folyamata Határozzuk meg az üzleti célt Szerezzünk adatokat Készítsük elő az adatot Építsünk modelleket Nézzük meg, hogy teljesít Építsük be a folyamatokba CRISP-DM

Adatbányászati projekt folyamata Hogyan mérjünk teljesítményt? Modell-építéstől független adatbázison! Vagy azonos időszakon, eddig nem látott adatokon Vagy különítsünk el teszt-időszakot Külön adathalmazok: Tanítás, Tesztelés, Validálás 70% 20% 10%

Adatbányászati projekt folyamata Határozzuk meg az üzleti célt Szerezzünk adatokat Készítsük elő az adatot Építsünk modelleket Nézzük meg, hogy teljesít Építsük be a folyamatokba CRISP-DM

Adatbányászati eszközök Ingyenes / Fizetős Programozás / GUI Adatelőkészítés is/ Csak modellezés

Gartner 2016 Magic Quadrant Advanced Analytics Platforms

A szoftver történelme Milyen analitikai eszközt használ? 2015 Rexer Analytics Survey

Rapid Miner Alap-információk Technológiai háttér Előnyei

Alap-információk Egyetemi fejlesztés Nyílt forráskód 4 verzió Free 10ezer rekord Small 2.500$ (100ezer rekord) Medium 5.000$ (1millió rekord) Large 10.000$ (limit nélkül)

Alap-információk XML alapú, GUI felület Párhuzamos futtatás Java library-ként használható Operátorok írhatóak

Alap-információk Első verziótól kezdve erős közösség Wiki oldal, Fórum YouTube csatorna Marketplace Pl. TextMining, DataStream, ProcessMining Használati szokások naplózása (community) Tutorial, példa-adatbázisok, template

Előnyei Platform-független Egyszerűen telepíthető, használható Gazdag operátorkör Számos tanuló algoritmus Jó vizualizációs eszközök Egyszerű fejleszthetőség

Projektek TELEPÍTÉS www.rapidminer.com

Churn projekt Válasszunk egy szimpatikus bankot POSTABANK

Churn projekt Üzleti cél: Szeretnénk megelőzni az ügyfél-vesztést Adatbányászati célra lefordítva: Kik azok az ügyfelek, akik nagy valószínűséggel le fogják mondani a szolgáltatásaikat? Osztályozás

Churn projekt Adatok milyen adatokat kérjünk? Mindent, ami rendelkezésre áll az ügyféllel kapcsolatban Demográfia Termékei Viselkedési adatok Célváltozó

Churn projekt Adatok elérhetősége: http://tinyurl.hu/rhnd/

Churn projekt Adatok feldolgozása Források egyesítése Alapstatisztikák (mit nézzünk?) Extrém értékek kiszűrése Új változók (ötletek?) Algoritmus-függő Hiányzó adatok kezelése Adattípus-átalakítás

Churn projekt Modellezés Próbáljunk ki többféle modellt, többféle paraméterezéssel

Churn projekt Validálás Válasszuk ki a legjobb modellt

Churn projekt Beépítés az üzleti folyamatokba CRM integráció Cross-sale / Megelégedettségi telefonos kampány

Marketing projekt Üzleti cél A bankunk célzott marketingakciókra készül, hogy így növelje az ügyfeleknek értékesített szolgáltatásokat. Adatbányászati cél Csoportosítsuk az ügyfeleket annak alapján, hogy azok milyen gyakran használják a bank adott szolgáltatásait. Szegmentáció

Marketing projekt Adatok milyen adatokat kérjünk? 10.000 ügyfél viselkedési történetét tartalmazza. A rögzített tranzakciók típusa: hagyományos banki tranzakciók (TBM - traditional banking methods); ATM tranzakciók (ATM - automatic teller machine); POS tranzakciók (POS - point of sale); ügyfélszolgálati tranzakciók (CSC - costumer service) - internetbank.

Marketing projekt Adatok feldolgozása Alapstatisztikák (mit figyeljünk?) Hibás az adatbázis! Transzformáljuk az adatokat; új változó Algoritmus-függő Hiányzó adatok kezelése Adattípus-átalakítás

Marketing projekt Modellezés Próbáljunk ki több modellt, többféle paraméterezéssel Klaszterező eljárások: k-means, x-means, dbscan

Marketing projekt Validálás A szegmentációs modelleket nehéz validálni, a cél, hogy minél jobban különböző, jól leírható, magyarázható szegmenseket kapjunk. Válasszuk ki a legjobb modellt

Marketing projekt Beépítés az üzleti folyamatokba Az eredmények alapján milyen javaslatot tennénk a marketing osztálynak?

Köszönöm a figyelmet!