Big Data az adattárházban



Hasonló dokumentumok
BIG DATA ELEMZÉSEK LEHETŐSÉGEI

Big Data adattárházas szemmel. Arató Bence ügyvezető, BI Consulting

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

Adattárház és BigData Szimbiózisa. Baranyi Szabolcs IM Technical Sales

Takács Gábor mérnök informatikus, okl. mérnöktanár

A webanalitika változó világa 4 felvonásban

Component Soft és tovább

Big Data: a több adatnál is több

AZ IGAZI BIG DATA hogyan használják a világban és egyáltalán használják-e hazánkban?

Adatbányászat és Perszonalizáció architektúra

Data Integrátorok a gyakorlatban Oracle DI vs. Pentaho DI Fekszi Csaba Ügyvezető Vinnai Péter Adattárház fejlesztő február 20.

Driving Excellence in Risk Management

Adatbányászat és Perszonalizáció az Oracle9i-ben

Big Data tömeges adatelemzés gyorsan

I. RÉSZ. Tartalom. Köszönetnyilvánítás...13 Bevezetés...15

Retro adatbányászat. Kovács Gyula Andego Tanácsadó Kft.

BEVEZETÉS AZ ADATTÁRHÁZ AUTOMATIZÁLÁSBA

Oracle SQL Developer Data Modeler és a DW adatmodellezés. Gollnhofer Gábor Meta Consulting Kft.

Oracle Big Data koncepció. Stadler Gellért Vezető tanácsadó Oracle ConsulKng HTE 2015 Konferencia

ETL keretrendszer tervezése és implementálása. Gollnhofer Gábor Meta4Consulting Europe Kft.

Weblog elemzés Hadoopon 1/39

A Tájékoztatási adatbázis 2013.

Papp Attila. BI - mindenkinek

Áttekintés a Jövő Internet agrárgazdasági alkalmazási lehetőségeiről Az NTP FI Agrár- és Élelmiszeripari tagozat

Több mint BI (Adatból üzleti információ)

Átfogó megoldás a számlafolyamatok felgyorsításához ELO DocXtractor. Laczkó Kristóf ELO Digital Office Kft. Bálint András Prognax Kft.

30 MB INFORMATIKAI PROJEKTELLENŐR

Nemzeti Fejlesztési és Gazdasági Minisztérium támogatásával megvalósuló KKC-2008-V számú projekt B2CR ONLINE KOMMUNIKÁCIÓ

A Jövő Internet Nemzeti Kutatási Program bemutatása

Gráfok mindenhol. x $ SZENDI-VARGA JÁNOS IOT SOCIAL NETWORKS FRAUD DETECTION MASTER DATA MANAGEMENT RECOMMENDATION ENGINES. Internet of Things

Big data előtt banki tranzakciós adatok kiaknázása. Kiss Ferenc Emánuel

MMK-Informatikai projekt ellenőr képzés 4

Adatbányászat az Oracle9i-ben. Fekete Zoltán vezető termékmenedzser

REKLÁMPSZICHOLÓGIA. 1/a. TÁRSTUDOMÁNYOK és ÚJ TUDOMÁNYÁGAK

Infor PM10 Üzleti intelligencia megoldás

Copyright 2013, Oracle and/or its affiliates. All rights reserved.

Sikerünk kulcsa: az információ De honnan lesz adatunk? Palaczk Péter

SmartActive Squash - IoT sportanalitika a felhőben

Self service reporting fogások, technikák és megoldások controllereknek, nem csak Excel alapon

IKT trendek és tapasztalatok a BME szemszögéből

DW/BI rendszerek kialakítása bevezetői szemszögből. Gollnhofer Gábor - Meta Consulting Kft.

Információs Rendszerek Szakirány

KÉZZEL FOGHATÓ TECHNOLÓGIAI MEGOLDÁSOK DANCSEVICS TIBOR

Árajánlat weboldal készítésére a Magyar Könyvvizsgálói Kamara Oktatási Központ ügyfelei részére

Kővári Attila, BI projekt

Név- és tárgymutató A, Á

Az információs rendszerek adatai

Vezetői információs rendszerek

GENERÁCIÓS ADATBÁZISOK A BIG DATA KÜLÖNBÖZŐ TERÜLETEIN

Újdonságok. Jancsich Ernő Ferenc

Adatbányászati technikák (VISZM185) 2015 tavasz

TDK tájékoztató Gazdaságinformatika Intézeti Tanszék szeptember

ADATTÁRHÁZAK MINŐSÉGBIZTOSÍTÁSA

EMBERKÖZPONTÚ ONLINE MARKETING A SZEMÉLYRE SZABOTT ÜZENETEK MŰVÉSZETE

Titkok. Oracle adatbázisok proaktív es reaktív védelmi eszközei. Mosolygó Ferenc, vezetı technológiai tanácsadó. <Insert Picture Here>

IBM SPSS Modeler 18.2 Újdonságok

1 Copyright 2011, Oracle and/or its affiliates. All rights reserved. Insert Information Protection Policy Classification from Slide 7

Dr. Sasvári Péter Egyetemi docens

VIR alapfogalmai. Előadásvázlat. dr. Kovács László

Big Data. Benczúr András Big Data Lendület kutatócsoport MTA SZTAKI, Informatika Laboratórium Benczúr András

Informatika és növekedés. Pongrácz Ferenc ügyvezető igazgató, IBM ISC Magyarország Kft., az MKT Informatikai Szakosztályának elnöke

Az okos kereskedelem. SmartCommerce

Microsoft SQL Server telepítése

COMPANY PROFILE SZOFI ALGORITHMIC RESEARCH KFT

Többfelhasználós és internetes térkép kezelés, megjelenítés

BIG DATA A H I VATA L O S S TAT I S Z T I K Á B A N

Üdvözlök mindenkit! Már mindenkinek elérhető? Automatizált, használhatóság növelése kutatás nélkül. Realeyes

Big Data Industry 4.0 Quality

Segítség, összementem!

Alkalmazásokban. Dezsényi Csaba Ovitas Magyarország kft.

Oracle Enterprise Metadata Management

2011. November 8. Boscolo New York Palace Budapest. Extrém teljesítmény Oracle Exadata és Oracle Exalogic rendszerekkel

A szak specializációi

Fekete Csaba Csongor Üzleti intelligencia vezető Citibank ZRt.

Az üzleti intelligencia megoldások helye és szerepe a magyar vállalatok életében. Dr. Kovács László Dr. Sasvári Péter Miskolci Egyetem

Temporális adatbázisok. Kunok Balázs szakdolgozata alapján

Az adatvagyon kezelés és a metaadatok. Gollnhofer Gábor DMS Consulting

Tartalom. Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben.

Így kampányolunk mi. Hans Zoltán. Szolgáltatás Fejlesztés és Online Irányítás vezető. IBM-SPSS üzleti reggeli (Budapest)

Adatkeresés az interneten. Cicer Norbert 12/K.

Mobil Üzleti Intelligencia

Geoportál a Közép-Magyarországi Régió területére

Enterprise extended Output Management. exom - Greendoc Systems Kft. 1

10. HÉT: ADATTÁRHÁZAK ÉS ÜZLETI INTELLIGENCIA

A Magyar Telekom közelítése a változó telekom piachoz

SDL Trados szervermegoldások. Szekeres Csaba SDL Trados partner M-Prospect Kft.

INFORMÁCIÓMENEDZSMENT E-KERESKEDELEM (3.-4. HÉT)

Változások előtt hol áll a banki (adat)elemzés? Nándorfi György

Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése

Tudásalapú információ integráció

Mobilinformatikai eszközök közigazgatási integrációjának kihívásai

Hogyan növelje kritikus üzleti alkalmazásainak teljesítményét?

Az információs rendszerek adatai

A T-Systems felhő koncepciója Frigó József

felhasználásra kerül(het)nek online tranzakciók igénybevételekor, vagy

Népszámlálás 2011 Internetes adatgyűjtéssel

VÁLLALATI INFORMÁCIÓS RENDSZEREK. Debrenti Attila Sándor

Toborzás a Linkedin és okosórák korában A toborzás, mint ügyfélkapcsolat kezelés

OZEKI Phone System. A jövő vállalati telefon rendszerének 4 alappillére. A jövő üzleti telefon rendszere SMS. Mobil mellékek. Összhang az IT-vel

Palaczk Péter A marketing folyamatok adattárház alapú támogatása

Átírás:

Big Data az adattárházban A párbaj folytatódik?

Néhány fontos Big Data projekt Cég Téma Adat Újfajta Mennyiség Saját adat? Típus Google Influenza Google I big I Előjelzés előjelzés Farecast Xoom Chicagoi egyetem Barabási Albert-L. Repjegy vásárlás optimális ideje Nemzetközi pénzátutalások Internetről összegyűjtött I big N Előjelzés Saját tranzakciók (régiek is!) N big I Csalás (pattern) Megjegyzés DW-vel is elő kellett volna jönni Szumóbajnokság Jegyzőkönyvek N 64 ezer N Csalás Hagyományos data mining? Hálózati kutatás Európai ország mobil hívásai egy szolgáltatónál I big N Pattern Price Fogyasztói Internetről összegyűjtött I big N Előjelzés Stats árindex Amazon Vásárlói ajánlás Internetes böngészés I big I Ajánlás Walmart Vásárlói szokások Tranzakciók (régebbiek is!) Aviva Hitelképességi Egészségügyi és életmód vizsgálat adatok??? Obama Big Data N big I Pattern I-N big N Előjelzés Választás Kérdőívek? mintavétel I Előjelzés

Big Data adatok (Általában) nagy mennyiségű, Sokféle, Sok esetben újfajta, Nagy sebességgel keletkező, Strukturálatlan, Kuszább adatok, ahol Nem feltétlenül a cég az adatok tulajdonosa

Újfajta adatok Web server logok Internet clickstream adatok Böngésző kifejezések Social media tartalom Social network tevékenységek Email szövegek Egyéb interneten elérhető adat Felmérések eredményei Mobil eszközök hívásai Szenzorok által szolgáltatott adatok (Internet of Things)

Kusza Big Data adatok Adatok Boyle - Marriotte törvénye DW és Big Data rendszerek esetén: Adattisztaság * Adatmennyiség = Állandó

Elemzések fajtái Általában adatbányászat kapcsolatok: minták, amikor egy esemény egy másikkal van kapcsolatban amikor egy esemény egy későbbi másik eseményhez vezet osztályozás, új minták keresése klaszterezés, eddig nem ismert tények csoportjának felismerése előrejelzések: olyan minták felfedezése, amelyek nagy valószinűséggel bekövetkező eseményeket jeleznek Szövegelemzés, Egyéb statisztikai elemzések Kauzalitás vs Korreláció

Újfajta eszközök Adatok tárolására, feldolgozására, elemzésére Hadoop/MapReduce NoSQL adatbázisok Elemzésre: R, R Enterprise Adatbázis szinten fejlesztett SQL, pl. Match Recognize, Big Data SQL

Felmerülő kérdések Van már DW a cégnél? (WALMART, AMAZON, XOOM) Mi a Big Data Projekt és a DW kapcsolata? Ha önálló projekt, akkor is sok adatot kell hozzátölteni, pl:google influenza projekt: Influenza statisztika időegységenként és földrajzi egységenként IP cím - földrajzi egység összefüggése (Geolocation)

DW vs Big Data: a párbaj folytatódik

DW és Big Data: Inmon vs Kimball Inmon: Adattárháznak és Big Data-nak nincs semmi köze! DW gondosan megtervezett, tiszta, összefüggésében ellenőrzött adatokat tartalmaz. Kimball: Adattárházban helye van a Big Data-nak Staging area szintjén kapcsolódnak be ezek az adatok Hadoop és NoSQL rendszerek Kapcsolatot a közös dimenziókon keresztül építhetünk (Termék, Ügyfél, Földrajzi egységek, Idő..) CRM fontos adatai keletkeznek

DW és Big Data: Oracle Staging area továbbfejlesztve: Hadoop központi tára az összes input adatnak (reservoir), itt lehet különböző modelleket felállítani és innen kerülhetnek továbbtöltésre adatok Data reservoir + Data warehouse Big Data SQL Cloudera Hadoop Adatbázis Oracle NoSQL Oracle R Advanced Analytics for Hadoop Big Data Connectors Data Integrator

Big Data és DW összekapcsolása Strukturálatlan clickstream adat

Big Data és DW összekapcsolása Clickstream adatok: View/external tábla DW tábla

Néhány összefoglaló gondolat Újfajta gondolkodás, szerepkör: adattudós Újfajta adatok bevonása DW-ben helye van az ilyen jellegű adatoknak Közös (Conformed) dimenziók használata, összekapcsolás ezen adatokkal DW egyéb adataihoz kapcsolás (pl. CRM) Tudni kell, hogy honnan származnak ezek az új adatok! (Válasz Inmon-nak) Strukturált DW adaton történő Big Data jellegű elemzést hova soroljuk? Meglevő adattárházat használjuk ki jobban! Szükség van hagyományos DW-re? Igen!