Memóriarezidens adatbáziskezelés

Hasonló dokumentumok
Marton József. Adatbázisok elmélete VITMMA február 20.

Memória alapú adatbázisok (IMDB: In-Memory DataBase vagy MMDB Main-Memory DataBase)

Memóriaadatbázisok. áttekintő előadás az. Adatbázisok haladóknak. c. tárgy keretében, szeptember 18. Szerző: Marton József Ernő BME-VIK TMIT

ADATBÁZIS-KEZELÉS - BEVEZETŐ - Tarcsi Ádám, ade@inf.elte.hu

2011. November 8. Boscolo New York Palace Budapest. Extrém teljesítmény Oracle Exadata és Oracle Exalogic rendszerekkel

Adatbázis rendszerek 7. előadás State of the art

Adatbáziskezelő-szerver. Relációs adatbázis-kezelők SQL. Házi feladat. Relációs adatszerkezet

Rendszermodernizációs lehetőségek a HANA-val Poszeidon. Groma István PhD SDA DMS Zrt.

Teljesítmény mérése és hangolása adatbáziskezelő rendszerekben

Operációs Rendszerek II. Első verzió: 2009/2010. I. szemeszter Ez a verzió: 2009/2010. II. szemeszter

Adatbáziskezelı-szerver SQL. Relációs adatbázis-kezelık. Relációs adatszerkezet. Házi feladat

Tranzakció-kezelés, alapfogalmak. Vassányi István, 2012.

Könyvtári szervervirtualizáció Oracle Virtual Machine platformon

Valós idejű megoldások: Realtime ODS és Database In-Memory tapasztalatok

Web harvesztelés. Automatikus módszerekkel

Számítógép felépítése

webalkalmazások fejlesztése elosztott alapon

Analitikai megoldások IBM Power és FlashSystem alapokon. Mosolygó Ferenc - Avnet

Operációs rendszerek. UNIX fájlrendszer

Riak. Pronounced REE-ahk. Elosztott adattároló eszköz. Molnár Péter

SQLServer. Particionálás

Magic xpi 4.0 vadonatúj Architektúrája Gigaspaces alapokon

TELJESÍTÉNYMÉRÉS FELHŐ ALAPÚ KÖRNYEZETBEN AZURE CLOUD ANALÍZIS

6. óra Mi van a számítógépházban? A számítógép: elektronikus berendezés. Tárolja az adatokat, feldolgozza és az adatok ki és bevitelére is képes.

NAGY TELJESÍTM. Szerzők Dévai. István Automatizálási. és s Alkalmazott Informatikai Tanszék

A számítógép egységei

Mosolygó Ferenc értékesítési konzultáns

Adatbázis rendszerek Gy: Az adattárolás fejlődése

Tipikus időbeli internetezői profilok nagyméretű webes naplóállományok alapján

Informatikai alapismeretek Földtudományi BSC számára

Adatbáziskezelés Delphi 5 alatt. Bese Antal

Operációs rendszerek. Az NT memóriakezelése

Software Defined technológiák használata Oracle adatbázis konszolidációhoz

Az Oracle rendszer komponensei

MMK-Informatikai projekt ellenőr képzés 4

Microsoft SQL Server telepítése

Adatbáziskezelő-architektúrák. Adatbázisok elmélete 2. előadás Gajdos Sándor

Weblog elemzés Hadoopon 1/39

Hálózatba kapcsolt adatbázisok. Erős Levente, TMIT 2011.

Fájlrendszerek. A Windows operációs rendszerek fájlrendszere

Processzusok (Processes), Szálak (Threads), Kommunikáció (IPC, Inter-Process Communication)

Operációs rendszerek. Bemutatkozás

VvAaLlÓóSs IiıDdEeJjȷŰű OoDdSs goldengate alapokon a magyar telekomban

Csima Judit szeptember 6.

ADATBÁZIS-KEZELÉS. Adatbázis-kezelő rendszerek

Adatbázisok elmélete

Az indexelés újdonságai Oracle Database 12c R1 és 12c R2

The Power To Develop. i Develop

Data Integrátorok a gyakorlatban Oracle DI vs. Pentaho DI Fekszi Csaba Ügyvezető Vinnai Péter Adattárház fejlesztő február 20.

Component Soft és tovább

2. Számítógépek működési elve. Bevezetés az informatikába. Vezérlés elve. Külső programvezérlés... Memória. Belső programvezérlés

Processzusok (Processes), Szálak (Threads), Kommunikáció (IPC, Inter-Process Communication)

Adatbányászat és Perszonalizáció architektúra


Utolsó módosítás:

Excel ODBC-ADO API. Tevékenységpontok: - DBMS telepítés. - ODBC driver telepítése. - DSN létrehozatala. -Excel-ben ADO bevonása

GDi Esri Magyarország Felhasználói Konferencia Timár Gábor: Konkurens adatfeldolgozás ArcGIS rendszerben

SQLServer. SQLServer konfigurációk

Adatbázis-kezelő rendszerek. dr. Siki Zoltán

Adatbázis rendszerek. dr. Siki Zoltán

Elosztott rendszer architektúrák

A processzor hajtja végre a műveleteket. összeadás, szorzás, logikai műveletek (és, vagy, nem)

Vodafone ODI ETL eszközzel töltött adattárház Disaster Recovery megoldása. Rákosi Péter és Lányi Árpád

Summer of LabVIEW The Sunny Side of System Design

NIIF Központi Elosztott Szolgáltatói Platform

Virtuális Obszervatórium. Gombos Gergő

Dr. Schuster György október 30.

Az adatok a vállalat kulcsfontosságú erőforrásai. Az információs rendszer adatai kezelésének két alapvető változata:

Grayteq. Grayteq DLP Teljesítmény Benchmark. Grayteq DLP Benchmark. Sealar Corporate Proprietary Commercial-in-confidence

Előadás_#13. Egy lemez írási művelet kiszolgálása

2023 ban visszakeresné 2002 es leveleit? l Barracuda Message Archiver. Tóth Imre Kereskedelmi Igazgató Avisys Kft Barracuda Certified Diamond Partner

Nyíregyházi Egyetem Matematika és Informatika Intézete. Input/Output

Adatbázis-kezelés. Harmadik előadás

SQLServer. Probléma megoldás

Vizuális adatelemzés - Gyakorlat. Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék

Bevezetés: az SQL-be

AdoDB a gyakorlatban

Alkalmazások teljesítmény problémáinak megszűntetése

Exadata, a világ leggyorsabb adatbázisgépe

ProofIT Informatikai Kft Budapest, Petzvál J. 4/a

Dr. Illés Zoltán

Oracle TTS migrációs technológia használata

SQL Server High Availability

Matematikai és Informatikai Intézet. 4. Folyamatok

Operációs Rendszerek II. Első verzió: 2009/2010. I. szemeszter Ez a verzió: 2009/2010. II. szemeszter

Operációs rendszerek III.

Fájlszervezés. Adatbázisok tervezése, megvalósítása és menedzselése

Költséghatékony high-end adattároló megoldások Vitéz Gábor, Avaxio Kft.

OE-NIK 2010/11 ősz OE-NIK ősz

S04-2 Elosztott alkalmazások készítése

ADATBÁZISOK, ADATTÁRHÁZAK

Párhuzamosítás adatbáziskezelő rendszerekben

Ismerkedjünk tovább a számítógéppel. Alaplap és a processzeor

Célkitűzések Az Oracle10 g felépítésének, használatának alapszíntű megismerése

Oracle GoldenGate Studio Nagyon rövid bemutató. Quick Talk. Gollnhofer Gábor

Szathmáry László Debreceni Egyetem Informatikai Kar

Multimédiás adatbázisok

Magyar Posta központi Oracle infrastruktúrája VMware alapokon

Tudásalapú információ integráció

Átírás:

Memóriarezidens adatbáziskezelés Marton József Ernő marton@db.bme.hu Adatbázisok haladóknak 2012. 2012. szeptember 18.

Miről lesz szó? Memóriaadatbázisokról általában Alapelv, kontraszt a hagyományossal Előnyök, erősségek Hátrányok (?), nehézségek Szervezés Kommunikáció ACID D betűje Fizikai ~, Lekérdezésvégrehajtás Megvalósítások Kérdések, válaszok 2012. szeptember 18. Marton József Ernő 2.

Memóriaadatbázis: alapelv Memóriaadatbázis-rendszer (IMDB) (In-Memory DataBase) az adatok elsődleges példánya a fizikai memóriában DRDB: az elsődleges példány diszken van (Disk-Resident DataBase) mondjuk inkább úgy: blokkos tárolón (vö. SSD) 2012. szeptember 18. Marton József Ernő 3.

Az alapelv létjogosultsága (2012: 20 USD) 1 GB RAM ára, USD 100000 40000 10000 3000 1000 400 150 100 1986 1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 2012. szeptember 18. Marton József Ernő 4.

Az alapelv létjogosultsága (2) Sok és olcsó RAM adatbázisok, adattárházak Még nagyobb igény esetén: adatbázis particionálása IMDB és DRDB részre automatikusan vagy kézzel konfigurált módon az adatok migrációja a két rendszer között 2012. szeptember 18. Marton József Ernő 5.

IMDB használatának előnyei gyorsabb adatelérés, tranzakció-feldolgozás akár hard real-time alkalmazások egyes esetekben egyszerűbb alkalmazás-logika diszk-io alrendszer eliminálása még gyorsabb működés saját adatszerkezetek helyett kész komponens olcsóbb fejlesztés, olcsóbb termék a termék sikerét is meghatározhatja 2012. szeptember 18. Marton József Ernő 6.

IMDB: hátrányok, nehézségek bizonyos esetekben bonyolultabb alkalmazás-logika tartósság biztosítása biztonsági mentések szervezése a rendszer indulásakor fel kell tölteni az adatbázist persze leállás után is mentésből, fejállomásról letöltve vagy on-line adatgyűjtésből Megéri-e: előnyök vs. hátrányok a konkrét feladat határozza meg 2012. szeptember 18. Marton József Ernő 7.

IMDB: megvalósítási kihívások optimalizált adatszerkezetek a fizikai memória random elérését kihasználják zárkezelés, tranzakciók ütemezése megfelelő granularitású zárak egyszerűbb alkalmazáslogika trükkök a tartósságra HW támogatás: elemes RAM, hálózaton szinkronizáló RAM-kártyák szinkron vagy aszinkron naplózás nem követelmény 2012. szeptember 18. Marton József Ernő 8.

Vajon IMDB-nek minősül? egyedi alkalmazás saját adatszerkezetekkel hagyományos DBMS úgy, hogy nagy fájlrendszer cache az operációs rendszerben adatfájlok RAM-diszken nagy a buffer cache 2012. szeptember 18. Marton József Ernő 9.

Kommunikáció Alkalmazás Adatbázismotor Fájlrendszer OS alrendszer lemezes háttértár DB belső cache OS fájlrendszer cache Adathozzáférés komponensei DRDB esetén a piros nyilak üzenetátadást, míg a zöldek adatáramlást jelölnek a szaggatott keret átlépése a futási környezetváltásokat mutatja 2012. szeptember 18. Marton József Ernő 10.

Kommunikációs alternatíva kliens-szerver modell osztott memória alapú adatelérés durva hozzáférés szabályozás Alkalmazás Adatbázismotor Fájlrendszer OS alrendszer lemezes háttértár DB belső cache OS fájlrendszer cache Adathozzáférés komponensei DRDB esetén a piros nyilak üzenetátadást, míg a zöldek adatáramlást jelölnek a szaggatott keret átlépése a futási környezetváltásokat mutatja 2012. szeptember 18. Marton József Ernő 11.

Tranzakciós tulajdonságok A atomicitás nincs markáns különbség gyorsabb tranzakciók, magasabb zár-granularitás C konzisztencia nincs markáns különbség I izoláció sorosítható helyett valódi soros ütemezés (vö. processzor-cache, mint környezet) D tartósság 2012. szeptember 18. Marton József Ernő 12.

D tartósság Az adatbázisba írt adatok megmaradnak. diszk: passzív memória: aktív tápfeszültség kimaradásakor törlődik elemmel támogatott RAM bithiba modul meghibásodások vö: diszkek: RAID modultöbbszörözés naplózás (és persze mentések) 2012. szeptember 18. Marton József Ernő 13.

D tartósság: naplózás... de hova? diszkre: már megint diszkio stable memory kicsi, nagy megbízhatóságú memória-megoldás de mikor? írási műveletkor azonnal tranzakció kommitjakor még később?! ún. durable commit (Oracle TimesTen) 2012. szeptember 18. Marton József Ernő 14.

Táblázat: durable commit hatása a tranzakciófeldolgozási kapacitásra select/insert/update tartós kommit nem tartós kommit 70/15/15 100 % 918 % 40/30/30 52 % 714 % 20/40/40 AMD Athlon64 3000+ (1809 MHz) processzorral és 4 GiB fizikai memóriával rendelkező gép teljesítménye egy 7200 rpm fordulatú Seagate Barracuda UltraATA 100-as merevlemezzel és a Debian Linux 3.1 operációs rendszer AMD64-es változatával, amelyen a TimesTen 6.0.2-es, 64 bites verziója fut(ott) A mérés az előzőleg bemutatott tptbm benchmark eredményeit mutatja 38 % 626 % 2012. szeptember 18. Marton József Ernő 15.

Index-adatszerkezetek Hash-alapú struktúrák nincs markáns különbség B*-fa (DRDB) lassú.?! (a) egy B-fa csomópont (b) egy B-fa (a) (b) vezérlő inf. data1 data2... data(m-1) 2012. szeptember 18. Marton József Ernő 16....

Index-adatszerkezetek (2) AVL-fa bináris keresőfa AVLtulajdonsággal gyenge memóriakihasználás gyors navigáció (a) egy AVL-fa csomópont (b) egy AVL fa bal gyermekcsomópont adat (mutató) vezérlő inf. jobb gyermekcsomópont 2012. szeptember 18. Marton József Ernő 17. (a) (b)

Index-adatszerkezetek: T-fa B*-fa és AVLfa előnyei összegyúrva gyors navigáció jó tárkihasználás adat tárolása adat maga mutató muttaó + adat része (pkt-fa) (a) (b) adat 1 bal gyermekcsomópont vezérlő inf. adatok (mutatók) jobb gyermekcsomópont 2012. szeptember 18. Marton József Ernő 18. adat 1 (a) egy csomópont; (b) egy T-fa (c) a tárolt elemek elhelyezkedése a T-fában bal részfa vezérlő inf. adatok (mutatók) adat n jobb részfa (c) adat n

Relációk tárolása rekordok vagy mutatók tömbje idegen kulcsok követésének (illesztés) támogatása avagy előreszámított (fél)illesztések DRDB: klaszterezés IMDB: a kulcs értéke helyett mutató 2012. szeptember 18. Marton József Ernő 19.

Lekérdezésvégrehajtás Vetítés, szelekció: sokszor olcsóbb az eredményreláció leírójának módosítása és on-the-fly számítás, mint a tényleges számítás Illesztések: l. a mutatók követéséről írottakat Költség: DRDB: tipikusan az eredmény kiírásának költségét nem számoljuk (miért?), de IMDB: a saját címtér miatt nem mindig merül fel 2012. szeptember 18. Marton József Ernő 20.

Particionált adatbázis ha a teljes adatbázis IMDB-ben nem megoldható v. racionális Hibrid megoldás tiszta IMDB in-memory cache DRDB Az elemzőeszközök a partícionált adatbázishoz csatlakoznak, amíg az adatforrások friss adati közvetlenül az IMDB részbe érkeznek, hogy minél hatékonyabb lehessen az előfeldolgozásuk. sensory data sources Memory-resident DB query & result passing cached data portion data propagation analysis tool initial load Disc-resident DB transform logic 2012. szeptember 18. Marton József Ernő 21. Partitioned database

Vajon IMDB-nek minősül? (ism) egyedi alkalmazás saját adatszerkezetekkel hagyományos DBMS úgy, hogy nagy fájlrendszer cache az operációs rendszerben adatfájlok RAM-diszken nagy a buffer cache 2012. szeptember 18. Marton József Ernő 22.

Kérdések válaszok (?) 2012. szeptember 18. Marton József Ernő 23.

Köszönöm megtisztelő figyelmüket! Marton József Ernő marton@db.bme.hu Adatbázisok haladóknak 2012. 2012. szeptember 18.

Demó: durable commit hatása benchmark Az instance_dir/demo/performance alatt található a TimesTen részeként szállított tptbm multi-user throughput benchmark $./tptbm -read 20 -insert 40 -xact 100000 -key 1000 -proc 5 -connstr "DSN=TptbmData_tt70;DurableCommits=0;PermSize=400" Connecting to the data source Populating benchmark data store Waiting for 5 processes to initialize Beginning execution with 5 processes: 20% read, 40% update, 40% insert Elapsed time: Transaction rate: 12.7 seconds 39513.2 transactions/second 2012. szeptember 18. Marton József Ernő 25.

Megvalósítások MySQL memory engine Oracle TimesTen 2012. szeptember 18. Marton József Ernő 26.

Oracle TimesTen rendszerbe illesztése DB pillanatképek tranzakciónaplók TCP/IP távoli kliensgép ill. alkalmazás Oracle adatbázis Oracle cache alrendszer helyi ODBC alkalmazás TCP/IP szerverfolyamatok segédprogramok ODBC közvetlen meghajtó adattárak adattárak adattárak TT gyerekdémonok JDBC TT démon replikációs alrendszer helyi Java alkalmazás 2012. szeptember 18. Marton József Ernő 27.

TimesTen adatszervezés Három szintű hierarchia TimesTen példány (instance) démon, kezelt adatok, segédprogramok (pl. ttisql) jogosultságkezelési egység kivétel: tulajdonos a sémobjektumaira teljes jogkörű adattár (data store) naplózási és mentési/visszaállítási egység rendelkezésre áll === memóriába töltött séma (schema) felhasználó objektumai (tábla, nézet, szekvencia, ) 2012. szeptember 18. Marton József Ernő 28.

IMDB alkalmazási példa mobilkommunikáció Mobilkommunikáció fejlődése bővülő szolgáltatások, ügyfélkör előrefizetett szolgáltatások: egyenlegfigyelés A hálózat cellás, moduláris felépítésű elosztott, valós idejű adatbázis-rendszer az adatgyűjtésre Csalásdetekció pl. az ügyfél földrajzi mozgásából (fizikai korlátok), stb. 2012. szeptember 18. Marton József Ernő 29.

IMDB alkalmazási példa tőzsdeinformatika Eladási és vételi ajánlatok intelligens illesztése haszon Jegyzések adatai, valósidejű elemzések haszon NYMEX: 2005 óta memóriaadatbázis-alapú real-time adatfolyamban közlik a jegyzéseket A sokszereplős valósidejű információszolgáltatást hozta el nagyságrendileg olcsóbb infrastruktúrán az IMDB 2012. szeptember 18. Marton József Ernő 30.