Component Soft 1994-2013 és tovább



Hasonló dokumentumok
Big Data adattárházas szemmel. Arató Bence ügyvezető, BI Consulting

Big Data: a több adatnál is több

Takács Gábor mérnök informatikus, okl. mérnöktanár

MMK-Informatikai projekt ellenőr képzés 4

Élet az SQL-en túl: Az adatfeldolgozás legújabb trendjei. Földi Tamás

Microsoft SQL Server telepítése

Big Data az adattárházban

Adatbányászat és Perszonalizáció architektúra

BIG DATA ELEMZÉSEK LEHETŐSÉGEI

Exadata, a világ leggyorsabb adatbázisgépe

Big Data tömeges adatelemzés gyorsan

2011. November 8. Boscolo New York Palace Budapest. Extrém teljesítmény Oracle Exadata és Oracle Exalogic rendszerekkel

COMPANY PROFILE SZOFI ALGORITHMIC RESEARCH KFT

Vezetői információs rendszerek

Enterprise extended Output Management. exom - Greendoc Systems Kft. 1

Sikerünk kulcsa: az információ De honnan lesz adatunk? Palaczk Péter

Valós idejű megoldások: Realtime ODS és Database In-Memory tapasztalatok

GENERÁCIÓS ADATBÁZISOK A BIG DATA KÜLÖNBÖZŐ TERÜLETEIN

IT trendek és lehetőségek. Puskás Norbert

API-MÁGIA MILLIÓ SORNYI ADAT ÚJRARENDEZÉSE. Előadó: Jaksa Zsombor, drungli.com

Data Vault 2.0 és az Oracle DW/BD referencia architektúra. Gollnhofer Gábor Meta Consulting Kft.

Adattárház és BigData Szimbiózisa. Baranyi Szabolcs IM Technical Sales

Big Data technológiai megoldások fejlesztése közvetlen mezőgazdasági tevékenységekhez

Oracle SQL Developer Data Modeler és a DW adatmodellezés. Gollnhofer Gábor Meta Consulting Kft.

webalkalmazások fejlesztése elosztott alapon

Data Governance avagy adatvagyon kezelés Rövid bevezető. Gollnhofer Gábor DMS Consulting

Weblog elemzés Hadoopon 1/39

Kővári Attila, BI projekt

Data Governance avagy adatvagyon kezelés Rövid bevezető. Gollnhofer Gábor DMS Consulting

KÖVETKEZŐ GENERÁCIÓS NAGYVÁLLALATI TARTALOMKEZELŐ MEGOLDÁSOK Stratis Kft. / Autonomy üzleti reggeli / Mezei Ferenc üzletág-igazgató

ADATBÁZIS-KEZELÉS - BEVEZETŐ - Tarcsi Ádám, ade@inf.elte.hu


MySQL kontra MongoDB programozás. SQL és NoSQL megközelítés egy konkrét példán keresztül

Rendszermodernizációs lehetőségek a HANA-val Poszeidon. Groma István PhD SDA DMS Zrt.

Cégbemutató, rövid áttekintés. Keszler Mátyás Territory Manager, Hungary

Exadata hibrid oszlopos adattömörítés automatizálása; DB 12c partition merge

ADATTÁRHÁZ MENEDZSMENT ÉS METAADAT KEZELÉS

Copyright 2013, Oracle and/or its affiliates. All rights reserved.

Adatbázis-kezelő rendszerek. dr. Siki Zoltán

Felhők teljesítményelemzése felhő alapokon

Versenyelőnyszerzés az intelligens megoldások korában. Rehus Péter, SWG CEE, IS brand igazgató November 5.

Gartner: Hype Cycle for Big Data NoSQL Database Management Systems

Novell és Oracle: a csúcsteljesítményű, költséghatékony adatközpont megoldás. Sárecz Lajos Értékesítési konzultáns

Az Oracle szakértelem mérése és fejlesztése

<Insert Picture Here> Cloud, Oracle tervezett célrendszerek, Exadata Database Machine adatbázisgép Fekete Zoltán, Principal sales consultant

Hadoop és használata az LPDS cloud-on

MPP Adattárház Teradata alapokon

FELHŐ és a MAINFRAME. Irmes Sándor

Oracle adatkezelési megoldások helye az EA világában. Előadó: Tar Zoltán

VIR alapfogalmai. Előadásvázlat. dr. Kovács László

A webanalitika változó világa 4 felvonásban

SQL SERVER 2012 ÚJ TÁVLATOKAT NYIT AZ ADATBÁZIS PLATFORMOK TERÜLETÉN

Tudásalapú információ integráció

CMDB architektúra megjelenítése SAMU-val Rugalmas megoldás. ITSMF Bekk Nándor Magyar Telekom / IT szolgáltatás menedzsment központ

Self service reporting fogások, technikák és megoldások controllereknek, nem csak Excel alapon

RDBMS fejlesztési irányok. Ferris Wheel (óriáskerék) Jim Gray törvényei. Elosztott adatbázisok problémái. Elosztott adatbázisok

Windows Server 2012: a felhő OS

Az információ hatalom. adatok. információ

VvAaLlÓóSs IiıDdEeJjȷŰű OoDdSs goldengate alapokon a magyar telekomban

Szoftveripar és üzleti modellek

Google App Engine az Oktatásban 1.0. ügyvezető MattaKis Consulting

Magic xpi 4.0 vadonatúj Architektúrája Gigaspaces alapokon

Soltész Gábor. Önéletrajz Budapest, Lechner Ödön fasor em 26. a.

Mérésadatgyűjtő rendszer Oracle Database Appliance alapon. Szabad Miklós vezérigazgató-helyettes XperTeam ZRt. Budapest, Róbert Károly krt. 59.

Beszerzések adatalapú vizsgálata a 21. században

MUMPS - a legfontosabb Adatbázis amiről (valószínűleg) soha nem hallott

Vodafone ODI ETL eszközzel töltött adattárház Disaster Recovery megoldása. Rákosi Péter és Lányi Árpád

VÁLLALATI INFORMÁCIÓS RENDSZEREK. Debrenti Attila Sándor

Másolatképzési technikák és azok felhasználási lehetőségei

Amazon Web Services. Géhberger Dániel Szolgáltatások és alkalmazások március 28.

Szolgáltatás Modellezés. Tivoli Business Service Management

AZ IGAZI BIG DATA hogyan használják a világban és egyáltalán használják-e hazánkban?

Segítség, összementem!

RHadoop. Kocsis Imre Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék

IT trendek és lehetőségek

Konszolidáció és költségcsökkentés a gyakorlatban. Az Országos Tisztifőorvosi Hivatal Oracle adatbázis konszolidációja

Oracle Enterprise Manager: Az első teljesértékű felhő üzemeltetési megoldás

Takács Árpád K+F irányok

BIG DATA ÉS GÉPI TANULÁS KÖRNYEZET AZ MTA CLOUD-ON KACSUK PÉTER, NAGY ENIKŐ, PINTYE ISTVÁN, HAJNAL ÁKOS, LOVAS RÓBERT

Infor PM10 Üzleti intelligencia megoldás

Jogosultság-monitorozó rendszer kialakítása

ADATTÁRHÁZ HATÉKONYSÁGNÖVELÉS, REDUNDANCIA CSÖKKENTÉS Frunza Zsolt ÜZLETI INTELLIGENCIA A JÖVŐ, AHOGY MI LÁTJUK

Innovatív trendek a BI területén

Self Service szekció. XXVIII. Budapesti Menedzsment és Controlling Fórum. Havas Levente. Budapest, május 26. IFUA Horváth & Partners

Alternatív adatbázisok Gráfadatbázisok

BEVEZETÉS AZ ADATTÁRHÁZ AUTOMATIZÁLÁSBA

Adatbányászat és Perszonalizáció az Oracle9i-ben

A nagyméretű és nagy mennyiségű adatok kezelésének adatbázis technológiai következményei Vállalati információrendszerek GIKOF 2013

Prediktív analitikai megoldások bankok és biztosítók számára

Az MTA Cloud a tudományos alkalmazások támogatására. Kacsuk Péter MTA SZTAKI

Adatbázis rendszerek. dr. Siki Zoltán

Oracle Big Data koncepció. Stadler Gellért Vezető tanácsadó Oracle ConsulKng HTE 2015 Konferencia

Portfóliónk áttekintése

Adatbázis-lekérdezés. Az SQL nyelv. Makány György

Üzleti intelligencia - eszközöktől a megoldásokig

Szárnyas Gábor (BME) diáinak felhasználásával.

Analitikai megoldások IBM Power és FlashSystem alapokon. Mosolygó Ferenc - Avnet

SQL Server High Availability

Oracle Enterprise Metadata Management

április 24. INFO Savaria április 24. INFO Savaria április 24. INFO Savaria

Átírás:

Component Soft 1994-2013 és tovább IT szakemberek oktatása, tanácsadás Fő témáink: UNIX/Linux rendszerek, virtualizációs, fürtözési, tároló menedzsment és mentési technológiák Adatbázisok és middleware (főleg MySQL és Java app. szerverek) Bash/Perl/Python/Ruby/stb. script programozás C++/Java/Android programozás BIG DATA!!! 1

Component Soft Technológiai szeminárium a Big Data jegyében 2013 március 13. De mi is az a Big Data? Mitől nagy? Miért fontos? Milyen technológiákból áll?

Érdekes példák a Big Data-ra: az adatok léteznek, de ki gyűjti össze és főleg ki elemzi ki őket? Arckép felismerés a Picassa-n Dalok felismerése SoundHound apppal Repülőgép sztori: London-New York-i járaton az érzékelők több adatot generálnak, mint ami egy átlagos vállalati adattárházban összesen van Egészségügy: érzékelők a betegeken, korábbi gyógykezelések adatai Large Ecommerce site ajánló rendszerrel Customer churn analysis (ügyfél elpártolás vizsgálata/megakadályozása) rendszerek új generációja 3

Big Data definíciója: a 3 V Volume: terabyte vagy petabyte-nyi mennyiségű adat Velocity: nagy sebességű, gépek által generált adatfolyam Variability: sokféle adatformátum 4

Miért fontos a Big Data Gartner 2012 októberi előrejelzés a Big Data piacra: 2012: 96 milliárd USD, 2013: 120 milliárd USD 2016: 232 milliárd USD McKinsey 2011: példák, hogy egyes szektorok hogyan csökkenthetik költségeiket és/vagy növelhetik bevételeiket sok száz milliárd dollárral IBM 2012: Big Data is all about better analytics on a broader spectrum of data, and therefore represents an opportunity to create even more differentiation among industry peers. Index 2013 február: az USÁ-ban a legjobban fizetett IT szakemberek a Big Datá-val foglalkoznak: http://index.hu/tech/2013/02/26/ezt_kell_tudni_havi_ketmillios_fizeteshez/ 5

Miért nem működnek a régi módszerek? (adattárház, SMP gépek stb.) A tárolt adatmennyiség sokkal gyorsabban nő, mint a processzorok teljesítménye A hagyományos SMP szerverek és shared disk cluster-ek nem alkalmasak a Big Data (petabyte méretek) feldolgozására Az adatok jelentős része nem könnyen, nem hatékonyan szervezhető relációs adatbázisokba A web-en megváltozott az elvárt sebesség definíciója: ha lassú egy webshop, átmennek a konkurenciához 6

A Big Data adatfeldolgozás lépései Acquire: adatgyűjtés és real time vagyis operational analysis (pl. hagyományos OLTP, Call Detail Records, call center records, HW & SW system logs, personal location data (mobil GPS), medical sensors, emails, twitts, Facebook entries (NoSQL és MySQL Cluster adatbázisok területe) Organize (hagyományosan ez az ETL) Analyze (HW gyorsított adattárházak vagy Hadoop területe) Decide vagy Share (Business Intelligence területe) 7

NoSQL adatbázisok: miért? A hagyományos RDBMS-ek bombabiztosak, az SQL nagyon jó programozási nyelv csak: Bonyolultak, ezért nem elég gyorsak Nehézkesen kezelnek sok gigabyte vagy petabyte mennyiségű adatot Rosszul kezelik a távoli replikáció és az adatbázis particionálás (sharding) problémáit 8

NoSQL adatbázisok általános jellemzői Alapelvek: NoSQL = Not Only SQL (az SQL nem tűnik el sőt...) Massively paralell, multi master, shared-nothing architecture Egyszerű programozási modell, korlátozott és sokszor előre definiált lekérdezésekkel Egyszerű adminisztráció sok automatizmussal Jobban illeszkednek az OO programozáshoz Sebesség és a folyamatos rendelkezésre állás fontosabb mint a 100%-os adatkonzisztencia (sok vállalati alkalmazásnál nem igazán jó) Egy-két méregdrága HW helyett sok-sok olcsó szerveren futnak Nyílt forráskódúak 9

Hadoop: mi is ez? Nyílt forráskódú, több ezer gépig skálázható, hibatűrő rendszer akár petabyte mennyiségű adat tárolására és feldolgozására Az egyes gépek olcsó Linux-os vagy esetleg Windows-os szerverek, emiatt a gigabyteonkénti fajlagos költsége alacsony Az adatok formátuma bármilyen lehet, a struktúrát nem az adatgyűjtésnél hanem az egyes feldolgozásoknál tudom megadni Speciális algoritmusokat és programozási modellt igényel (MapReduce) Nagyon elterjedt nagy mennyiségű, nehezen strukturálható adat batch alapú feldolgozására 10

HW gyorsított adattárház gépek Kevésbé forradalmi megoldás, legkönnyebben eladható a vállalatoknak Továbbra is hagyományos adatbázist használnak Adatbázis, szerver és tároló integrált megvalósítása a gyors működés és egyszerű kezelhetőség érdekében Pl. Oracle Exadata, IBM Netezza 11