Gyors sikerek adatbányászati módszerekkel

Hasonló dokumentumok
Gyors sikerek adatbányászati módszerekkel

Tartalom. Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben.

Retro adatbányászat. Kovács Gyula Andego Tanácsadó Kft.

Nyílt forráskód, mint üzleti előny. Szücs Imre VTMSZ - CMC Minősítési előadás Ha valamit érdemes csinálni, akkor azt megéri jól csinálni

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

Pentaho 4: Mindennapi BI egyszerűen. Fekszi Csaba Ügyvezető október 6.

Soltész Gábor. Önéletrajz Budapest, Lechner Ödön fasor em 26. a.

Gépi tanulás a gyakorlatban. Bevezetés

Big Data adattárházas szemmel. Arató Bence ügyvezető, BI Consulting

Projektvezetői döntések támogatása webbányászattal

Adatbányászat a felhőben

Microsoft SQL Server telepítése

IBM SPSS Modeler 18.2 Újdonságok

Kutatás-fejlesztési eredmények a Számítógépes Algoritmusok és Mesterséges Intelligencia Tanszéken. Dombi József

Takács Gábor mérnök informatikus, okl. mérnöktanár

Adatbányászat az Oracle9i-ben. Fekete Zoltán vezető termékmenedzser

Konszolidáció és költségcsökkentés a gyakorlatban. Az Országos Tisztifőorvosi Hivatal Oracle adatbázis konszolidációja

Hálózati elemzések az üzleti életben. Kovács Gyula Sixtep Kft.

Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017.

Automatikus tesztgenerálás modell ellenőrző segítségével

Új tehetséggondozó programok és kutatások

Fiktív cégek a hálóban

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

EGYÜTTMŰKÖDŐ ÉS VERSENGŐ ERŐFORRÁSOK SZERVEZÉSÉT TÁMOGATÓ ÁGENS RENDSZER KIDOLGOZÁSA

Statisztikai eljárások a mintafelismerésben és a gépi tanulásban

Így kampányolunk mi. Hans Zoltán. Szolgáltatás Fejlesztés és Online Irányítás vezető. IBM-SPSS üzleti reggeli (Budapest)

Mesterséges intelligencia alapú regressziós tesztelés

Tanulás tanuló gépek tanuló algoritmusok mesterséges neurális hálózatok

ITIL alapú IT környezet kialakítás és IT szolgáltatás menedzsment megvalósítás az FHB-ban

Adatbányászat és Perszonalizáció az Oracle9i-ben

Segítség, összementem!

Van-e ingyen-ebéd? Avagy mire elég a nyílt forráskodú Pentaho? Fekszi Csaba Ügyvezető október 4.

Oracle adatkezelési megoldások helye az EA világában. Előadó: Tar Zoltán

Átlátni és rendszerezni Az adatbányászat, a CRM és a piackutatás kapcsolata

Fiktív cégek a hálóban

Sikerünk kulcsa: az információ De honnan lesz adatunk? Palaczk Péter

ACCESS PROJEKT Innovatív eredmények a felnőttképzés területén

Közösség, projektek, IDE

Norway Grants. Az akkumulátor mikromenedzsment szabályozás - BMMR - fejlesztés technológiai és műszaki újdonságai. Kakuk Zoltán, Vision 95 Kft.

Adatelemzés SAS Enterprise Guide használatával. Soltész Gábor solteszgabee[at]gmail.com

Innovatív trendek a BI területén

OpenCL alapú eszközök verifikációja és validációja a gyakorlatban

Hogyan lesz adatbányából aranybánya?

Költségmegtakarítás járatoptimalizálással. Lukács Lajos Ügyvezető DSS Consulting Kft.

2. Cím: Nézettségmérés új módszerei avagy Audience measurement Kulcsszavak: IPTV, felhasználói viselkedés, média, ajánlórendszerek

IBM Datacap Taskmaster. Bejövő Számlák feldolgozása Accounts Payable Taskmaster (APT) Előadó: Csendes Balázs / IBM Industry Solutions Brand Executive

TOVÁBBTANULÁS Készítette: Chalupeckyné Guba Zsuzsanna

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

IT Stratégia rövid definíció

Prolan Zrt. fejlesztéseiben. Petri Dániel

Történet John Little (1970) (Management Science cikk)

Csalásfelderítés hálózatokon keresztül. Innovatív BI konferencia, Budapest,

vbar (Vemsoft banki BAR rendszer)

Flex: csak rugalmasan!

TELJESÍTÉNYMÉRÉS FELHŐ ALAPÚ KÖRNYEZETBEN AZURE CLOUD ANALÍZIS

Teljesen elosztott adatbányászat alprojekt

Személyügyi nyilvántartás szoftver

Cloud Akkreditációs Szolgáltatás indítása CLAKK projekt. Kozlovszky Miklós, Németh Zsolt, Lovas Róbert 9. LPDS MTA SZTAKI Tudományos nap

Hibadetektáló rendszer légtechnikai berendezések számára

GUSE BEMUTATÓ. Az MTA CLOUD felhasználói számára készült guse bemutató v2.0. MTA Cloud csapat

Miért ASP.NET? Egyszerű webes alkalmazás fejlesztése. Történet ASP ASP.NET. Működés. Készítette: Simon Nándor

TDK tájékoztató Gazdaságinformatika Intézeti Tanszék szeptember

Dokumentum kompozíció

Alkalmazás technológiai frissítés migrációs és üzemeltetési tapasztalatok

Enterprise extended Output Management. exom - Greendoc Systems Kft. 1

Intelligens közlekedési rendszerek (ITS)

Projekt beszámoló. NEWSIT News basedearlywarning System forintradaytrading: Hír alapú Korai Figyelmeztető Rendszer Napon belüli Kereskedéshez

Helyszín: Pécsi Tudományegyetem Szentágothai János Kutatóközpont (Ifjúság útja 20.) a plenáris előadás helyszíne: a Kavics előadó,

A Jövő Internet Nemzeti Kutatási Program bemutatása

Beszédfelismerés. mit jelent, hogyan működik, kinek éri meg. Tibor Fegyó SpeechTex Kft.

Útmutató az informatikus könyvtáros alapképzésben (BA) nappali tagozaton teljesítendő szakmai gyakorlatokhoz

Szolgáltatás és Minőségfejlesztés a Corvinus Egyetemen Kiss György János Mogyorósi János

Autóipari vezérlőegységek aktív környezetállósági tesztelésének módszerei

Papp Attila. BI - mindenkinek

Internetes térkép publikálási technikák, szabványok, trendek, nyílt forráskódú megoldások

Beszédfelismerés alapú megoldások. AITIA International Zrt. Fegyó Tibor

Beszerzések adatalapú vizsgálata a 21. században

Mesterséges Intelligencia Elektronikus Almanach. Konzorciumi partnerek

Adatbányászati, data science tevékenység projektmenedzsmentje

adroll A SIKER KISZÁMLÁZVA! KISKERESKEDELEM

E-learning alapú ügyféltámogató rendszer könyvtárak és felsőoktatási intézmények részére

Adatbányászati, data science tevékenység

BIG DATA ELEMZÉSEK LEHETŐSÉGEI

A hálózattervezés alapvető ismeretei

Adatbányászat és Perszonalizáció architektúra

Adatbányászati technikák (VISZM185) 2015 tavasz

Teljesen elosztott adatbányászat pletyka algoritmusokkal. Jelasity Márk Ormándi Róbert, Hegedűs István

NAGY SÁV, NAGY VÉDELEM A KIBERBIZTONSÁG MODERN FAKTORAI. Keleti Arthur Kecskemét,

A Jövő Internet Nemzeti Kutatási Program és eredményei

SZTE Eötvös Loránd Kollégium. 2. Móra György: Információkinyerés természetes nyelvű szövegekből

kodolosuli.hu: Interaktív, programozást tanító portál BALLA TAMÁS, DR. KIRÁLY SÁNDOR NETWORKSHOP 2017, SZEGED

Konzultáció és terméktámogatás Linux alapokon. Basa Richárd igazgató Novell PSH Kft.

Szoftver labor III. Tematika. Gyakorlatok. Dr. Csébfalvi Balázs

Gépi tanulás a Rapidminer programmal. Stubendek Attila

Digitális technika (VIMIAA02) Laboratórium 3

3D-s számítógépes geometria és alakzatrekonstrukció

Digitális technika (VIMIAA02) Laboratórium 3

Az információs portáloktól a tudásportálokig

Köszönjük, hogy e-számlakivonat szolgáltatásunkat választotta, ezzel is hozzájárulva környezetünk védelméhez! Elakadt? Segítünk!

CARE. Biztonságos. otthonok idős embereknek CARE. Biztonságos otthonok idős embereknek Dr. Vajda Ferenc Egyetemi docens

Átírás:

Gyors sikerek adatbányászati módszerekkel Kezdő adatbányászati workshop Petrócziné Huczman Zsuzsanna 2015.10.13.

Bemutatkozás BME, műszaki informatika szak, adatbányászati szakirány Citibank Data Explorer Kft. Szerencsejáték Zrt., Magyar Telekom Data Solutions Kft. MT, UPC, Kopint- Datorg, OTP, Erste, Lombard... Andego Kft.

Bemutatkozás

Adatbányászat alapok tematika Adatbányászati történelem A halászattól a tudósokig IBM Watson Adatbányászati projekt folyamata Az igénytől az adaton át az eredményig Rapid Miner ismerkedés 2 projekt Rapid Miner segítségével

Adatbányászati történelem Mikor és miért merült fel az igény? Az adattárolás története infografika 1960 Adathalászat 1980 Adatbázis bányászat 1990 Adatbányászat 2011 Data Science

Adatbányászati történelem Mi a különbség? Statisztikus? Adatbányász? Data Scientist?

Adatbányászati történelem Az adatok mennyisége, minősége Mennyi adat jön létre egy perc alatt? Az adatok 90-95%-a az utóbbi hány évben jött létre? Magyar rögvalóság Céginfó adatbázis 1.8 GB (tömörítve) Vagyonbizt. utóbbi 2 évi káreseménye 1.5 GB Prezi.com logfájlok: 800 GB/nap

Adatbányászati történelem 2011 IBM Watson in Jeopardy Demo

Adatbányászati projekt folyamata 2 projektet viszünk végig ma Churn projekt Banki lemorzsolódáselemzés Marketing projekt Banki ügyfél szegmentáció

Adatbányászati projekt folyamata Határozzuk meg az üzleti célt Gyűjtsünk, szerezzünk adatokat Készítsük elő az adatot CRISP-DM Építsünk modelleket Nézzük meg, hogy teljesít Építsük be a folyamatokba

Adatbányászati projekt folyamata Milyen típusú feladatok oldhatóak meg tipikusan gépi tanuló algoritmusokkal: Kinek adhatunk hitelt? Osztályozás, predikció Kik a vevőink? Szegmentálás Akik ezt vették... Ajánlórendszer Holnap mennyi pénzt hoznak be? Idősorelőrejelzés

Adatbányászati projekt folyamata Speciális feladatok: Melyik email spam? Szövegbányászat Írd be amit keresel Keresőmotor Milyen hatóanyaggal lehet gyógyítani téged orvosi adatbányászat Kik a csalók? Hálózat-elemzés

Adatbányászati projekt folyamata Határozzuk meg az üzleti célt Gyűjtsünk, szerezzünk adatokat Készítsük elő az adatot CRISP-DM Építsünk modelleket Nézzük meg, hogy teljesít Építsük be a folyamatokba

Adatbányászati projekt folyamata ADAT Honnan? Belső forrás Külső forrás (internet, piackutatás...) Mennyit? Hogyan lehet több adatunk?/hogyan mintavételezzünk? Mi a jó célváltozó-arány? Gondoljunk a validálásra is!

Adatbányászati projekt folyamata Határozzuk meg az üzleti célt Gyűjtsünk, szerezzünk adatokat Készítsük elő az adatot CRISP-DM Építsünk modelleket Nézzük meg, hogy teljesít Építsük be a folyamatokba

Adatbányászati projekt folyamata Az adat közelebbről Objektumot leíró változók (+ Célváltozó) Adat-átalakítás Aggregálás, adatforrások összevonása Új változók generálása Hiányzó értékek kezelése Adattípus-átalakítások

Adatbányászati projekt folyamata Határozzuk meg az üzleti célt Gyűjtsünk, szerezzünk adatokat Készítsük elő az adatot CRISP-DM Építsünk modelleket Nézzük meg, hogy teljesít Építsük be a folyamatokba

Adatbányászati projekt folyamata Milyen gépi tanuló algoritmus-családok vannak? Döntési fák Neurális hálók Klaszterező eljárások Regressziós modellek (Idősor-előrejelzés, predikció)...

Adatbányászati projekt folyamata Határozzuk meg az üzleti célt Gyűjtsünk, szerezzünk adatokat Készítsük elő az adatot CRISP-DM Építsünk modelleket Nézzük meg, hogy teljesít Építsük be a folyamatokba

Adatbányászati projekt folyamata Hogyan mérjünk teljesítményt? Modell-építéstől független adatbázison! Vagy azonos időszakon, eddig nem látott adatokon Vagy különítsünk el teszt-időszakot Külön adathalmazok: Tanítás, Tesztelés, Validálás

Adatbányászati projekt folyamata Határozzuk meg az üzleti célt Gyűjtsünk, szerezzünk adatokat Készítsük elő az adatot CRISP-DM Építsünk modelleket Nézzük meg, hogy teljesít Építsük be a folyamatokba

Rapid Miner tematika Alap-információk Technológiai háttér Építőkövek Előnyei

Alap-információk Egyetemi fejlesztés Open source 3 verzió Alap Community Professional (2000 $ / év) Többféle adatforrás + MarketPlace+ Support + Cloud Tutorial, példa-adatbázisok, wiki, fórum

Technológiai háttér XML alapú, GUI felület Párhuzamos futtatás Java library-ként használható Market TextMining, DataStream,... Operátorok egyszerűen írhatóak

Építőkövek Alapegységek: operátorok Az operátorok rendelkeznek: Bemenet Kimenet Opcionálisan belső operátorok

Előnyei Egyszerűen telepíthető Vizualizációs eszközök Számos algoritmus, egyszerű fejleszthetőség Platform-független

Projektek TELEPÍTÉS

Churn projekt Válasszunk egy szimpatikus bankot POSTABANK

Churn projekt Üzleti cél: Szeretnénk tudni, hogy az elkövetkező fél évben ki fogja nagy valószínűséggel lemondani a szolgáltatását. Adatbányászati célra lefordítva: Milyen ügyfélkarakterisztikával rendelkezik az a csoport, aki az utóbbi időben lemondta a szolgáltatást. Osztályozás

Churn projekt Adatok milyen adatokat kérjünk? Mindent, ami rendelkezésre áll az ügyféllel kapcsolatban. Viselkedési adatok Demográfia Termékei Célváltozó

Churn projekt Adatok feldolgozása Források egyesítése Alapstatisztikák (mit nézzünk?) Extrém értékek kiszűrése Új változók (ötletek?) Algoritmus-függő Hiányzó adatok kezelése Adattípus-átalakítás

Churn projekt Modellezés Próbáljunk ki többféle modellt, többféle paraméterezéssel

Churn projekt Validálás Válasszuk ki a legjobb modellt

Churn projekt Beépítés az üzleti folyamatokba Pl. Ajánljunk nekik kedvezményt, hogy megtartsuk őket

Marketing projekt Üzleti cél A bankunk célzott marketingakciókra készül, hogy így növelje az ügyfeleknek értékesített szolgáltatásokat. Adatbányászati cél Csoportosítsuk az ügyfeleket annak alapján, hogy azok milyen gyakran használják a bank adott szolgáltatásait. Szegmentáció

Marketing projekt Adatok milyen adatokat kérjünk? 100.000 ügyfél viselkedési történetét tartalmazza. A rögzített tranzakciók típusa: hagyományos banki tranzakciók (TBM - traditional banking methods); ATM tranzakciók (ATM - automatic teller machine); POS tranzakciók (POS - point of sale); ügyfélszolgálati tranzakciók (CSC - costumer service).

Marketing projekt Adatok feldolgozása Alapstatisztikák (mit figyeljünk?) Hibás az adatbázis! Transzformáljuk az adatokat; új változó Algoritmus-függő Hiányzó adatok kezelése Adattípus-átalakítás

Marketing projekt Modellezés Próbáljunk ki több modellt, többféle paraméterezéssel

Marketing projekt Validálás A szegmentációs modelleket nehéz validálni, a cél, hogy minél jobban különböző, jól leírható, magyarázható szegmenseket kapjunk. Válasszuk ki a legjobb modellt

Marketing projekt Beépítés az üzleti folyamatokba Az eredmények alapján milyen javaslatot tennénk a marketing osztálynak?

Köszönöm a figyelmet! huczman@andego.hu