A nagyméretű és nagy mennyiségű adatok kezelésének adatbázis technológiai következményei Vállalati információrendszerek GIKOF 2013

Hasonló dokumentumok
Oracle SQL Developer Data Modeler és a DW adatmodellezés. Gollnhofer Gábor Meta Consulting Kft.

Adatbázis-kezelő rendszerek. dr. Siki Zoltán

Component Soft és tovább

Cloud computing. Cloud computing. Dr. Bakonyi Péter.

Adatbázis rendszerek I

Data Vault 2.0 és az Oracle DW/BD referencia architektúra. Gollnhofer Gábor Meta Consulting Kft.

Adatbázis rendszerek. dr. Siki Zoltán

Célkitűzések Az Oracle10 g felépítésének, használatának alapszíntű megismerése

webalkalmazások fejlesztése elosztott alapon

Cloud computing Dr. Bakonyi Péter.

ADATBÁZIS-KEZELÉS - BEVEZETŐ - Tarcsi Ádám, ade@inf.elte.hu

MMK-Informatikai projekt ellenőr képzés 4

ADATBÁZIS-KEZELÉS. Adatbázis-kezelő rendszerek

Alternatív adatbázisok Gráfadatbázisok

Adatbányászat és Perszonalizáció architektúra

INFORMATIKA ÁGAZATI ALKALMAZÁSAI. Az Agrármérnöki MSc szak tananyagfejlesztése TÁMOP /1/A

Mérnök informatikus (BSc) alapszak levelező tagozat (BIL) / BSc in Engineering Information Technology (Part Time)

Big Data adattárházas szemmel. Arató Bence ügyvezető, BI Consulting

Big Data: a több adatnál is több

Sikerünk kulcsa: az információ De honnan lesz adatunk? Palaczk Péter

Data Integrátorok a gyakorlatban Oracle DI vs. Pentaho DI Fekszi Csaba Ügyvezető Vinnai Péter Adattárház fejlesztő február 20.

GENERÁCIÓS ADATBÁZISOK A BIG DATA KÜLÖNBÖZŐ TERÜLETEIN

Tudásalapú információ integráció

Az M2M szabványosítási helyzete

Takács Gábor mérnök informatikus, okl. mérnöktanár

Miskolci Egyetem Gépészmérnöki és Informatikai Kar Alkalmazott Informatikai Tanszék. Dr. Kulcsár Gyula egyetemi docens

Információs Rendszerek Szakirány

Mérnök informatikus (BSc) alapszak levelező tagozat (BIL) / BSc in Engineering Information Technology (Part Time)

Vodafone ODI ETL eszközzel töltött adattárház Disaster Recovery megoldása. Rákosi Péter és Lányi Árpád

Programozás. Adatbázis-kezelés (alapok) Fodor Attila

Adattárház és BigData Szimbiózisa. Baranyi Szabolcs IM Technical Sales

Weblog elemzés Hadoopon 1/39

Miskolci Egyetem Gépészmérnöki és Informatikai Kar Informatikai Intézet Alkalmazott Informatikai Tanszék

Adatbáziskezelő-szerver. Relációs adatbázis-kezelők SQL. Házi feladat. Relációs adatszerkezet

Gráfok mindenhol. x $ SZENDI-VARGA JÁNOS IOT SOCIAL NETWORKS FRAUD DETECTION MASTER DATA MANAGEMENT RECOMMENDATION ENGINES. Internet of Things

CMDB architektúra megjelenítése SAMU-val Rugalmas megoldás. ITSMF Bekk Nándor Magyar Telekom / IT szolgáltatás menedzsment központ

A J2EE fejlesztési si platform (application. model) 1.4 platform. Ficsor Lajos Általános Informatikai Tanszék Miskolci Egyetem

Oracle adatkezelési megoldások helye az EA világában. Előadó: Tar Zoltán

Multimédiás adatbázisok


9.előadás: Adatbázisok-I. dr. Hajas Csilla (ELTE IK)

Üzemeltetési kihívások 2015

BMEVIHIM134 Hálózati architektúrák NGN menedzsment vonatkozások: II. Üzemeltetés-támogatás és üzemeltetési folyamatok

VÁLLALATI INFORMÁCIÓS RENDSZEREK. Debrenti Attila Sándor

Pénzügy, számvitel. Váradi Mónika

Az információs rendszerek adatai

Érettségi tétel az IT vizsgán: Felhő

Design of Programming V 5 -

Design of Programming V 5 -

Az Oracle Fusion szakértői szemmel

Adatmodellezés, alapfogalmak. Vassányi István

Több mint BI (Adatból üzleti információ)

Információ-architektúra

Big Data az adattárházban

BEVEZETÉS Az objektum fogalma

Data Vault adatmodellezés.

ADATBÁZIS RENDSZEREK. Adatbázisok története, alapfogalmak, adatmodellek. Krausz Nikol, Medve András, Molnár Bence

Üzleti architektúra menedzsment, a digitális integrált irányítási rendszer

Indexek és SQL hangolás

Az információs rendszerek adatai

Oracle Enterprise Manager: Az első teljesértékű felhő üzemeltetési megoldás

MapReduce paradigma a CAP-tétel kontextusában. Adatb haladóknak. Balassi Márton Adatbázisok haladóknak 2012.

CAD-CAM

A modern e-learning lehetőségei a tűzoltók oktatásának fejlesztésében. Dicse Jenő üzletfejlesztési igazgató

Gartner: Hype Cycle for Big Data NoSQL Database Management Systems

Adatbázisok* tulajdonságai

Excel ODBC-ADO API. Tevékenységpontok: - DBMS telepítés. - ODBC driver telepítése. - DSN létrehozatala. -Excel-ben ADO bevonása

Magic xpi 4.0 vadonatúj Architektúrája Gigaspaces alapokon

Adatbázis-kezelés. alapfogalmak

Szoftver-technológia II. Tervezési minták. Irodalom. Szoftver-technológia II.

JAVA webes alkalmazások

Informatikai alapismeretek Földtudományi BSC számára

Adatmodellezés. 1. Fogalmi modell

Fejlesztés, működtetés, felügyelet Hatékony infrastruktúra IBM szoftverekkel

Nemzetközi vállalat - a vállalati szoftvermegoldások egyik vezető szállítója

Vállalati információs rendszerek I, MIN5B6IN, 5 kredit, K. 4. A meghirdetés ideje (mintatanterv szerint vagy keresztfélében):

Adattárház kialakítása a Szövetkezet Integrációban, UML eszközökkel. Németh Rajmund Vezető BI Szakértő március 28.

Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése

Az üzleti igények átültetése a gyakorlatba eszköz és módszertan: - ARIS és WebSphere megoldások együttes használata a folyamatmendzsmentben -

Döbrönte Zoltán. Data Vault alapú adattárház - Fél óra alatt. DMS Consulting Kft.

LOGISZTIKAI ADATBÁZIS RENDSZEREK JOIN, AGGREGÁCIÓ

Miskolci Egyetem Gépészmérnöki és Informatikai Kar Alkalmazott Informatikai Tanszék. Dr. Kulcsár Gyula egyetemi docens

Big Data. Benczúr András Big Data Lendület kutatócsoport MTA SZTAKI, Informatika Laboratórium Benczúr András

MTA Cloud Use cases MTA Cloud workshop. Hernáth Szabolcs MTA WIGNER FK

Elosztott adatbázis-kezelő formális elemzése

Oracle E-Business Suite auditok tapasztalatai. Gáspár Gyula Senior Manager Oracle License Management Services, Central Europe április 6.

irányításban Teljesítménymérés

SAS Enterprise BI Server

Adatbázis, adatbázis-kezelő

MEGA ÜZLETI FOLYAMATMENEDZSMENT ÉS VÁLLALATI ARCHITEKTÚRA MEGOLDÁSOK. Kóczé Zoltán Tanácsadó

Introduction. Szolgáltatásorientált rendszerintegráció Service-Oriented System Integration. Dr. Balázs Simon BME, IIT

Adattárház tiszta alapokon Oracle Day, Budapest, november 8.

Hogyan lehet megakadályozni az üzleti modellezés és az IT implementáció szétválását? Oracle BPM Suite

Élet az SQL-en túl: Az adatfeldolgozás legújabb trendjei. Földi Tamás

Never-ending fight - A soha véget nem érő harc a Black Hat-hackerekkel

RDBMS fejlesztési irányok. Ferris Wheel (óriáskerék) Jim Gray törvényei. Elosztott adatbázisok problémái. Elosztott adatbázisok

WebSphere Adapters. 6. változat 2. alváltozat. WebSphere Adapter for SAP Software felhasználói kézikönyv 6. változat 2. kiadás

KOGGM614 JÁRMŰIPARI KUTATÁS ÉS FEJLESZTÉS FOLYAMATA

Menedzsment paradigmák és a virtuális vállalat. Virtuális vállalat 2012/13 1. félév 6. Előadás Dr. Kulcsár Gyula

Virtuális Obszervatórium. Gombos Gergő

Átírás:

A nagyméretű és nagy mennyiségű adatok kezelésének adatbázis technológiai következményei Vállalati információrendszerek GIKOF 2013 Molnár Bálint ELTE, Információs rendszerek tanszék TÁMOP-4.2.2/B-10/1-2010-0030 támogatásával készült kutatás

A nagyméretű adatok fogalma Mik a nagyméretű adatok (Big data) 3V (volumen, viharsebesség, változatosság) Adatmennyiség= data volumes, Nagysebességgel keletkezik = high velocity Nagy változatosság variety; Amikor a hagyományos adatkezelési eljárások akadályokba ütköznek Inkább egy koncepció, mint egy pontos definíció, fogalom meghatározása ELTE, Információs rendszerek tanszék, Dr. Molnár Bálint, tudományos főmunkatárs 2

Vállalati információ kezelése (Vik) Információrendszerek irányítása Üzleti /szervezeti modell Vállalati technológia és architektúra Információ menedzsmentje és használata Vállalati szervezet és kultúra Tranzakció központú alkalmazások Üzleti alkalmazási rendszerek Működést támogató alkalmazások Vállalati adatmodell és adattárolók Döntés támogató alkalmazások (EDW, BI, Analízis) IT infrastruktúra IT üzemeltetés és támogatás IT környezet Információ életciklus kezelés Szabályozás (hatóságok) és szabályszerűség ELTE, Információs rendszerek tanszék, Dr. Molnár Bálint, tudományos főmunkatárs 3

A nagyméretű adatok kezelésének új megközelítései vállalati környezetben Hagyományos (vállalati) információrendszerek információkezelése Strukturált adatok, tárolva: Relációs adatbázis-kezelő; Objektum-orientált adatbázis-kezelő; Hálós adatbázis; Hierarchikus adatbázis ELTE, Információs rendszerek tanszék, Dr. Molnár Bálint, tudományos főmunkatárs 4

A nagyméretű adatok kezelésének új megközelítései vállalati környezetben Az adatok nagy része ma strukturálatlan formában keletkezik; Az adatok 85%-90% Ezeket az adatokat nem aknázzák ki: Nehéz elemezni (parsing); Modellezni; Értelmezni. ELTE, Információs rendszerek tanszék, Dr. Molnár Bálint, tudományos főmunkatárs 5

A nagyméretű adatok kezelésének új megközelítései vállalati környezetben A nagyméretű adatok keretében: A strukturált; Félig-strukturált; A strukturálatlan; A polistrukturált adatokat is kezelni kell. Pl.: e-levél, web lap tartalom, videó, audió stb. Adatbázis tartalom, napló állományok, XML állományok, strukturálatlan szöveges dokumentumok, web lapok, grafikák. ELTE, Információs rendszerek tanszék, Dr. Molnár Bálint, tudományos főmunkatárs 6

A nagyméretű adatok kezelésének új megközelítései vállalati környezetben Skálázhatóság Infrastruktúra menedzsment Végfelhasználó kielégítő kiszolgálása Adatmodellezés - NoSQL adatbázisok kifejlesztése ETL (Extract-Transform-Load) vállalati adattárházak hagyományos megoldásai szűk keresztmetszet félig-strukturált adatok céljaira. Adatok felfalása (data ingestion) Map-reduce technológia a párhuzamos feldolgozásra (funkcionális programozás) ELTE, Információs rendszerek tanszék, Dr. Molnár Bálint, tudományos főmunkatárs 7

Vállalati információrendszerek Az információrendszerek dokumentum központúvá válnak Nem csak a nagy mennyiség és méret, hanem az adatszerkezet típusok magas fokú heterogenitása is probléma. Hagyományos rendszerszervezési, elemzési és tervezési módszerek, információ kezelési eljárások nem kielégítőek ELTE, Információs rendszerek tanszék, Dr. Molnár Bálint, tudományos főmunkatárs 8

Adatbázisok evolúciója RDBMS (SQL, relációs adatbázis-kezelés) RDBMS oszlop-orientált (Sybase IQ/SAP) Teljesítmény: lekérdezések kontra sororientált problémái Üzleti intelligencia igényei, egyéb adat analitika igények; Memória-alapú adatbázis kezelés (In-memory); Grid (homogén csomópontok) illetve számítási felhő (heterogén csomópontok) ELTE, Információs rendszerek tanszék, Dr. Molnár Bálint, tudományos főmunkatárs 9

Adatbázisok evolúciója Not Only SQL, NoSQL DBMS Teljesítmény: Elosztott hálózati architektúra (distributed arch.) Masszív párhuzamos, konkurens adatfeldolgozás (high concurrency) Particionálással szembeni tűrés (parttion tolerance) Kiterjeszthetően skálázható arch. (Scale-out architecture) ELTE, Információs rendszerek tanszék, Dr. Molnár Bálint, tudományos főmunkatárs 10

Relációs kontra nem relációs adatbáziskzelés Strukturált adat: Minden adatelemre létezik meta-adat, SQL tárolás, elérés pontosan definiált. Strukturálatlan adat: Az adatbázis séma nem írja le pontosan. ELTE, Információs rendszerek tanszék, Dr. Molnár Bálint, tudományos főmunkatárs 11

Relációs kontra nem relációs adatbáziskzelés RDBMS : 3NF, táblák, kapcsolatok, integritási feltételek. Oszlopok strukturált adat. Logikai adatmodell Nem relációs DBMS Egymásba ágyazott, hierarchikus adatszerkezetek BoM, darabjegyzék, XML komplex dok. A régi hierarchikus, és hálós adatbázisok, objektum, objektum-relációs adatszerkezetek, dokumentumok, XML adatszerkezetek, gráfok Új SQL (NewSQL) NoSQL ELTE, Információs rendszerek tanszék, Dr. Molnár Bálint, tudományos főmunkatárs 12

Alkalmazhatóság (OldSQL, NewSQLm NoSQL) Összetett séma Gráf séma Egymásba ágyazott modellek 3NF séma Hópehely séma Csillag séma Adatszerkezet bonyolultsága OldSQL NoSQL NewSQL Egy tábla 40 TB > 40 TB ELTE, Információs rendszerek tanszék, Dr. Molnár Bálint, tudományos főmunkatárs 13

NoSQL Kulcs-érték pár (key-value pair) Gráf adatbázis Dokument adatbázis XML által definiált adatszerkezet JSON (JavaScript object notation )

Poliglott tartós tárolás (perzisztencia) RDBMS és egy vagy több NoSQL adatbázis kohabitációja az adatbáziskezelés rétegében ELTE, Információs rendszerek tanszék, Dr. Molnár Bálint, tudományos főmunkatárs 15

Poliglott tartós tárolás (perzisztencia) Nyers adatok Hadoop ökoszisztema Kötegelt adatfeldolgozás / Valós idejű adatfeldolgozási folyamat RDBMS NewSQL NoSQL Alkalmazások ELTE, Információs rendszerek tanszék, Dr. Molnár Bálint, tudományos főmunkatárs 16

Bálint Molnár, Senior Researcher, Information Systems Department 17

VA Enterprise Architecture DATA What FUNCTION How NETWORK Where PEOPLE Who TIME When MOTIVATION Why Based on work by John A. Zachman SCOPE (CONTEXTUAL) Things Important to the Business Processes Performed Business locations Important Organizations Ev ents Significant to the Business Business Goals and Strategy SCOPE (CONTEXTUAL) Planner Entity = Class of Business Thing Function = Class of Business Process Node = Major Business Locations People = Major Organizations Time = Major Business Event Ends/Means = Major Business Goals Planner ENTERPRISE MODEL (CONCEPTUAL) Semantic Model Business Process Model Business Logistics System Work Flow Model Master Schedule Business Plan ENTERPRISE MODEL (CONCEPTUAL) Owner Ent = Business Entity Proc = Business Process Rel = Business Relationship I/O = Business Resources Node = Business Location Link = Business Linkage People = Organization Unit Work = Work Product Time = Business Event Cycle = Business Cycle End = Business Objectiv e Means = Business Strategy Owner SYSTEM MODEL (LOGICAL) Logical Data Model Application Architecture Distributed System Architecture Human Interface Architecture Processing Structure Business Rule Model SYSTEM MODEL (LOGICAL) Designer Ent = Data Entity Rel = Data Relationship Proc = Application Function Node = IS Function I/O = User Views Link = Line Characteristics People = Role Work = Deliv erable Time = System Event Cycle = Processing Cycle End = Structural Assertion Means = Action Assertion Designer TECHNOLOGY MODEL (PHYSICAL) Physical Data Model System Design Technology Architecture Presentation Architecture Control Structure Rule Design TECHNOLOGY MODEL (PHYSICAL) Builder Ent = Segment/Table Rel = Pointer/Key Proc = Computer Function I/O = Data Elements/Sets Node = Hardware/Softw are People = User Link = Line Specifications Work = Screen Format Time = Ex ecute Cycle = Component Cycle End = Condition Means = Action Builder DETAILED Data REPRESENTATIONS Definition (OUT-OF-CONTEXT) Program Network Architecture Security Architecture Timing Definition Rule Design DETAILED REPRESENTATIONS (OUT-OF-CONTEXT) Sub-Contractor Ent = Field Rel = Address Proc = Language Statement Node = Addresses I/O = Control Block Link = Protocols People = Identity Work = Job Time = Interrupt Cycle = Machine Cycle End = Sub-Condition Means = Step Sub-Contractor FUNCTIONING ENTERPRISE Data Function Network Organization Schedule Strategy FUNCTIONING ENTERPRISE Ent = Rel = DATA What Proc = I/O = FUNCTION How Node = Link = NETWORK Where People = Work = PEOPLE Who Time = Cycle = TIME When End = Means = MOTIVATION Why Bálint Molnár, Senior Researcher, Information Systems Department 18

Bálint Molnár, Senior Researcher, Information Systems Department 19

Bálint Molnár, Senior Researcher, Information Systems Department 20

A schematic mapping between Zachman architecture and requirements and constraints in the framework of Axiomatic Design Aspects Entities Activities Locations People Time Motivation Perspectives Contextual UR Intensional document UR UR UR Intensional document UR UR Intensional document Scope Conceptual FR Document hierarchy FR Document hierarchy FR FR Document hierarchy FR FR Document hierarchy Enterprise Model Logical DC&P DC&P DC&P DC&P DC&P DC&P System Model Physical DC&P DC&P DC&P DC&P DC&P DC&P Technical Model Detailed representation (Actual implementation and operation) IF&OV IF&OV IF&OV IF&OV IF&OV IF&OV Components Functioning Data Function Network Organization Schedule Strategy enterprise/organizat Bálint Molnár, Senior Researcher, Information Systems Department 21 ion

Köszönöm a figyelmet Kérdések?