Big Data. Benczúr András Big Data Lendület kutatócsoport MTA SZTAKI, Informatika Laboratórium Benczúr András

Hasonló dokumentumok
Big Data: a több adatnál is több

Big data amikor a probléma az adat mérete maga

Tájékoztató a Jövő Internet Nemzeti Kutatási Program előrehaladásáról: JINKA2.1 Dr. Sallai Gyula

A Jövő Internet Nemzeti Kutatási Program és eredményei

URBAN PLANNING IN THE AGE OF BIG DATA A NEW EMPIRIUM TELEPÜLÉSTERVEZÁS AZ ADATBŐSÉG KORÁBAN EGY ÚJ EMPÍRIUM

Big data áttekintés. Sidló Csaba. MTA Számítástechnikai és Automatizálási Kutatóintézet

Bevezető Intelligens közlekedési rendszerek

A jövő Internetje. HTE Közgyűlés május 20. Dr. Szabó Róbert, e. docens.

SmartActive Squash - IoT sportanalitika a felhőben

IKT megoldások az ipar szolgálatában

Gyakorlatok. VITMMA09 Okos város MSc mellékspecializáció

Jármű ICT fejlesztési irányok és kihívások

KÖVETKEZŐ GENERÁCIÓS NAGYVÁLLALATI TARTALOMKEZELŐ MEGOLDÁSOK Stratis Kft. / Autonomy üzleti reggeli / Mezei Ferenc üzletág-igazgató

IKT trendek és tapasztalatok a BME szemszögéből

BIG DATA ELEMZÉSEK LEHETŐSÉGEI

BME-Ipar. Win-Win. Intelligens környezetek és e-technológiák. Dr. Charaf Hassan Fókuszban a Műegyetem és az ipar kapcsolata

Intelligens közlekedés: a járműipar és járműirányítás IKT igényei, a VehicleICT projekt. Lengyel László lengyel@aut.bme.hu

A Jövő Internet Nemzeti Kutatási Program bemutatása

Waberer s BI a BO-n túl. WABERER S INTERNATIONAL Nyrt. Szatmári Johanna, Tobak Tamás

A Jövő Internet kihívásai A jövő információs és kommunikációs technológiai MTA TRB és IB közös tudományos ülés november 17.

Elosztott adatbázis-kezelő formális elemzése

Gráfok mindenhol. x $ SZENDI-VARGA JÁNOS IOT SOCIAL NETWORKS FRAUD DETECTION MASTER DATA MANAGEMENT RECOMMENDATION ENGINES. Internet of Things

Internet-hozzáférések teljesítményvizsgálata webböngészőben

Smart megoldások. Ela

Virtuális Obszervatórium. Gombos Gergő

Takács Gábor mérnök informatikus, okl. mérnöktanár

Információs Rendszerek Szakirány

Az Internet jövője Nemzetközi és hazai kitekintés

Big Data az adattárházban

Big data áttekintés. Sidló Csaba. MTA Számítástechnikai és Automatizálási Kutatóintézet

A NEMZETI MOBILFIZETÉSI ZRT. SMART MOBILITY VÍZIÓJA

Infrastrukturális vagy közösségi érzékelés. Vida Rolland, Fehér Gábor (BME TMIT) 2. Magyar Jövő Internet Konferencia november 11.

Félreértések elkerülése érdekében kérdezze meg rendszergazdáját, üzemeltetőjét!

A kibontakozó új hajtóerő a mesterséges intelligencia

Tarcsi Ádám ELTE Informatikai Kar

AZ ELEKTROMOBILITÁS KORMÁNYZATI FELADATAI. III. Elektromobilitás Konferencia. Weingartner Balázs államtitkár Innovációs és Technológiai Minisztérium

A JÖVŐ INTERNET KUTATÁSKOORDINÁCIÓS KÖZPONT SZERVEZETI ÉS MŰKÖDÉSI SZABÁLYZATA

AZ E-MOBILITÁS ÖSSZEFÜGGÉSEI, LEHETŐSÉGEI. Kisgyörgy Lajos BME Út és Vasútépítési Tanszék

vitmma09 Szenzorhálózatok és alkalmazásaik

Copyright 2012, Oracle and/or its affiliates. All rights reserved.

KÖZPONTI OKOSHÁLÓZATI MINTAPROJEKT

Android Pie újdonságai

ActiveAssist. Rózner Lajos

V2I - Infrastruktúra

SZOLGÁLTATÁS-VALIDÁCIÓ ITU-T AJÁNLÁSOK ALAPJÁN

BME IPAR 4.0 TECHNOLÓGIAI KÖZPONT. Kovács László

Kognitív Infokommunikáció: egy ébredő interdiszciplína. Baranyi Péter DSc

A többképernyős médiafogyasztás - Változó médiafogyasztási szokások, közösségi média

Mobil fizetési megoldások alkalmazása a GUIDE@HAND alkalmazás családban

Smart City feltételei

Felhasználó-központú biztonság

Az okos kereskedelem. SmartCommerce

Worldwide LHC Computing Grid

Informatikai képzés a BME-n, ahogy mi csináljuk. Dr. Charaf Hassan, hassan@aut.bme.hu

Okos Városok Globális helyzetkép, lehetőségek, várakozások. Digitális Város Konferencia 2016 szeptember, Győr

IoT szolgáltatások fejlesztése - SensorHUB

Innovatív trendek a BI területén

Kooperatív Intelligens Közlekedés Rendszerek építőelemei

Okos Városok T-City Szolnok. Intelligens IT City Eger

Industrial Internet Együttműködés és Innováció

Okos Városok T-City Szolnok. HTE INFOKOM 2014 Smart Metering & Environment

5G technológiák és felhasználási esetek

Alter Róbert Báró Csaba Sensor Technologies Kft

Excel ODBC-ADO API. Tevékenységpontok: - DBMS telepítés. - ODBC driver telepítése. - DSN létrehozatala. -Excel-ben ADO bevonása

Ericsson CoordCom. Integrált segélyhíváskezelés, tevékenységirányítás. <Name> Kovács László

A Jövő Internet Nemzeti Kutatási Program eredményei,

OKOS VÁROS FOGALMA, KONCEPCIÓJA, LEHETSÉGES ÉRTÉKELÉSI MÓDSZEREI

Miért jó nekünk kutatóknak a felhő? Kacsuk Péter MTA SZTAKI

Jövő Internet Nemzeti Technológiai Platform

IPv6 A jövő Internet alaptechnológiája

Big Data adattárházas szemmel. Arató Bence ügyvezető, BI Consulting

Jövő Internet Nemzeti Technológiai Platform IVSZ Menta. Dr. Bakonyi Péter BME EIT HUNGARNET

AZ INFORMÁCIÓS TÁRSADALOM TECHNOLÓGIAI TÁVLATAI. Detrekői Ákos a Nemzeti Hírközlési és Informatikai Tanács elnöke Székesfehérvár,

Rendszermodernizációs lehetőségek a HANA-val Poszeidon. Groma István PhD SDA DMS Zrt.

Hasznos és kártevő rovarok monitorozása innovatív szenzorokkal (LIFE13 ENV/HU/001092)

Üzemeltetési kihívások 2015

OKOS KÖZLEKEDÉSI ALKALMAZÁSOK Benyó Balázs, Fördős Gergely

DSD DSD. Egy országos méretű orvosi adatbázissal kapcsolatos informatikai kihívások. Kovács László Pataki Balázs Pataki Máté MTA SZTAKI DSD

MARCONI (Ericsson) SDH felügyeleti rendszerének mérése

hagyományos médiaperformancia és e-kereskedelem mit tanulhat az egyik a másiktól Nagy Barnabás Magyar Telekom

Erőforrás gazdálkodás a bevetésirányításban

General information for the participants of the GTG Budapest, 2017 meeting

A mobilitás biztonsági kihívásai

SzIP kompatibilis sávszélesség mérések

Bemutatkozik az ELTE Informatikai Kara

A konvergencia következményei. IKT trendek. Új generációs hálózatok. Bakonyi Péter c.docens. Konvergencia. Új generációs hálózatok( NGN )

IT trendek és lehetőségek. Puskás Norbert

Tudásalapú információ integráció

MMK-Informatikai projekt ellenőr képzés 4

milliárd Ft, folyó áron

Vajna István BLC INDUSTRY 4.0 & LEAN

Új módszerek és eszközök infokommunikációs hálózatok forgalmának vizsgálatához

BIG DATA ÉS GÉPI TANULÁS KÖRNYEZET AZ MTA CLOUD-ON KACSUK PÉTER, NAGY ENIKŐ, PINTYE ISTVÁN, HAJNAL ÁKOS, LOVAS RÓBERT

Új funkciók az RBP-ben október 1-től New functions in RBP from 1 October Tatár Balázs

MEGHÍVÓ. Infokommunikációs technológiák és a jövő társadalma (FuturICT.hu) TÁMOP C-11/1/KONV

Valós idejű kiberfizikai rendszerek 5G infrastruktúrában

E Q U I C O M M é r é s t e c h n i k a i K f t. H B u d a p e s t, M á t y á s k i r á l y u T. : F.

Egészség és informatika

A társadalom hálózati jelenségeinek adatvezérelt vizsgálata I: Társadalmi terjedés. Magyar Tudomány Ünnepe 2017 Számítógépes Társadalomtudomány

Átírás:

Big Data Benczúr András Big Data Lendület kutatócsoport MTA SZTAKI, Informatika Laboratórium Benczúr András benczur@sztaki.mta.hu http://datamining.sztaki.hu Big Data @ SZTAKI 2014. Október 17.

Big Data: volume, velocity, variety - V 3 big data is when the size of the data itself becomes part of the problem big data is data that becomes large enough that it cannot be processed using conventional methods Google sorts 1PB in 33 minutes (07-09-2011) Amazon S3 store contains 499B objects (19-07-2011) New Relic: 20B+ application metrics/day (18-07-2011) Walmart monitors 100M entities in real time (12-09-2011) Forrás: The Emerging Big Data slide from the Intelligent Information Management DG INFSO/E2 Objective ICT-2011.4.4 Info day in Luxembourg on 26 September 2011

Megvalósítás: új technológiai lehetőségek Technikai és kutatási kérdés: A nagy számú jelenleg lehetséges új technológia és megoldás jelölt közül melyik architektúra legalkalmasabb az adott üzleti probléma megoldására?

Elosztott rendszerek Murphy törvénye

Elosztott rendszerek Murphy törvénye Fox&Brewer CAP Tétel : C-A-P: kettőt választhatunk! C consistency Apache Flink A Availability AP: egy replika válaszolhat hibásan P Partition-resilience

Alkalmazások Big Data @ SZTAKI 2014. szeptember 17.

Temperatures -30 Model estimation error (%) [limit: +/- 17%] Big Data feladat: szenzor adatok Non-conform situation detection - estimation of the gearbox bearing temperature by a neural network modell (Model validity: ambient temperature between 4 and 10 C) 110 130 100 Values_for_Model_INPUT_2 Gearbox bearing temperature_model_estimates Values_for_Model_INPUT_1 Gearbox bearing temperature_measured 120 110 90 Ambient temperature (for model vaildity) Error_% 100 80 70 90 80 70 60 60 50 50 40 40 30 20 30 20 10 0 10 0-10 -20 Time - a year

Big Data feladat: nagyvállalati IT log Hagyományos megoldások: kudarc Aggregált adatok: adattárház? Tapasztalat: 30-115 GB/nap 3-60 millió esemény teljesítményprobléma, folyamat-optimalizálás rosszindulatú támadás, visszaélés-felderítés

Intelligens környezet mobilitási adatok Mobilitási adatok többcélú elemzése o Mobil szolgáltatás minősége, csomagvesztés előrejelzése o Személyre szabott profilépítés térben és időben Felhasználó és helyszín modellek építése és előrejelzés o Helyszín, útvonal predikció, valós idejű közlekedési előrejelzés Intelligens város alkalmazások o Többtényezős optimalizáció (ár, idő elektromos autók!) o Tömegközlekedés o Katasztrófahelyzetek, nagy rendezvények biztosítása Metropolisz adatmennyisége o Tárolásra nincs idő (volume) o Azonnali reakció (velocity) o Mozgás, események, tartalomfogyasztás, közösség (variety)

Mobilitás adatfolyam kísérlet (Orange D4D)

Virtuális neuro-kognitív labor VirCA-ra épülő együttműködés o SZTAKI 3D Internet Kontroll és Kommunikáció Labor (Baranyi) o MTA TTK Kognitív Idegtudomány és Pszichológia Intézete o BME Ergonómia, Pszichológia és TMIT tanszékek Big Data feladatok: 1. Részletes naplózás és visszakeresés 2. Események rekonstruálása 3. Analitika Gazdag, heterogén adatforrás: mozgás közbeni EEG, szemkövetés, FIRST projekt Smart City alprojektjéhez kapcsolódó kutatás

Közösségi média trendek Algoritmikus kihívás: o Sok millió releváns dokumentum o Interaktív válaszidő demo o ELTE Twitter gyűjtés első éve (2012) o 1.2Md Tweet, 700M angol nyelvű o Meryl Streep előfordul 50,000 üzenetben o Valós időben Leválogatni Előszedni a teljes szöveget Gyakori szavakat kiválasztani

HANA demo Twitter 2012: Meryl Streep

HANA demo Twitter 2012: Meryl Streep

HANA demo Twitter 2012: Meryl Streep

HANA demo Twitter 2012: Meryl Streep

HANA demo Twitter 2012: Meryl Streep

HANA demo Twitter 2012: Meryl Streep

HANA demo Twitter 2012: Meryl Streep

HANA demo Twitter 2012: Meryl Streep

HANA demo Twitter 2012: Meryl Streep

Közösségi média, ajánló rendszerek Ajánlás (retweet, hashtag) tartalom ÉS hálózat alapján Maidan: 286.984 tweets, 120.996 retweets, 87.498 users Euromaidan: 2.433.517 tweets, 1.788.604 retweets, 162.582 users Olympics: 735.849 tweets, 289.269 retweets, 250.569 users Putin: 879.711 tweets, 333.250 retweets, 227.320 users Berkin Elvan: 1.856.387 tweets, 1.261.590 retweets, 582.861 user MH17: elemzésre vár

Összefoglalás Big Data feladatok jellemzői Adat más célból gyűlik Elosztottan kell feldolgozni Valós idejűség gyakran igény, és lehetőség Szoftver-rendszerek zavarba ejtő választéka Alkalmazási területek Szenzorhálózatok, IT rendszerek Mobilitás, közlekedés, intelligens környezet Közösségi média Együttműködés FIRCC-hez kapcsolódó SZTAKI projekt SAP, Ericsson EU projektek

Köszönöm a figyelmet! Big Data @ SZTAKI 2014. szeptember 17.