RDBMS fejlesztési irányok. Ferris Wheel (óriáskerék) Jim Gray törvényei. Elosztott adatbázisok problémái. Elosztott adatbázisok
|
|
- Klaudia Pintér
- 7 évvel ezelőtt
- Látták:
Átírás
1 1 RDBMS fejlesztési irányok Column store Tömb adatmodell JIT fordító és vektorizált végrehajtás Ferris wheel (óriáskerék) Elosztott adatbázisok Ferris Wheel (óriáskerék) Optimalizált scan műveletek Table scan, index scan Adattárházak alapvető funkciója, optimalizálni kell Sokáig tart, nagy IO költség Egyszerre több query is olvashatja ugyanazt a táblát Miért kell ehhez többször betölteni az adatot? Viszont a queryk nem egyszerre indulnak A queryk újrahasznosítják a másik által már elindított scaneket Nem az elején kezdik a scant, hanem felülnek a már futó scan műveletekre A tábla végére érve a scan tovább fut elölről Akkor van vége, ha épp nincsen olyan query, ami még további sorokat szeretne olvasni Jim Gray törvényei Scale-out: Az adatfeldolgozás csak masszív párhuzamosítással oldható meg Az számolást kell vinni az adathoz és nem az adatot a számoláshoz 6 Elosztott adatbázisok Adat particionálás (sharding) Vertikális particionálás Kulcs tartományok külön szervereken Funkcionális particionálás Függőleges particionálás Bizonyos oszlopok külön szervereken Replikáció Magas rendelkezésre állás (redundancia) Terheléselosztás Nem kell külön back-up + ezek kombinációi Elosztott adatbázisok problémái Lassú hálózat Szerveren belül nagyon gyors IO Racken belül közös switch Rackek között más lassabb kapcsolat Geo-redundáns rendszerek: nagy késleltetésű hálózat Co-location awareness A rendszer kihasználja az adatok közeliségét A feladatokat úgy kell szervezni, hogy az minimális hálózaton keresztüli adatmozgatással járjon Replikáció Az adatokról több másolat készül, külön-külön szerverekre Ugyanakkor az adatírási műveletek bonyolultak lesznek Hogyan tarthatóak a replikák szinkronban, úgy, hogy az ne rontsa a teljesítményt? 1
2 7 Elosztott műveletek Feltesszük: a tábla több szerver között van elosztva Scan Be kell olvasni minden sort pontosan egyszer Sort Shardonként sorba rendezés, majd merge sort Key lookup Az indexek szintén shardolhatók Adott kulcstartomány adott shardon Join? Ez általánosságban kemény dió Elosztott JOIN Elmélet régen kidolgozva Általános esetben nem oldható meg optimálisan Optimalizálási probléma Minimális adatmozgatás legyen a hálózaton át Hogyan kell ehhez az adatokat és a végrehajtást szervezni? A JOIN queryről nehezen mondható meg az eredményhalmaz számossága! Kevés implementáció Gyakran nem is az RDBMS része, hanem felső réteg Korlátozott funkcionalitással MySQL cluster SQL Azure Microsoft Parallel Data Warehouse stb Elosztott JOIN ötletek Mindent tükrözzünk le mindenhova Párhuzamosítható futás Sok tárhelyet igényel, de egyszerű megvalósítani A kisebb táblát másoljuk oda, ahol a nagyobb van Mi van akkor, ha van WHERE feltétel is? Okos statisztikák kellenek Akár statisztika készítése menet közben Előre mintavételezett táblák A kicsi, ritkán írt táblákat eleve tükrözzük le minden shardra Elosztott JOIN ötletek 2 Particionáljunk idegen kulcs szerint Ha tudjuk, hogy a tábla mindig joinban fog szerepelni Ekkor az INNER JOIN egy shardon belül elvégezhető Lazy-JOIN A ritkán használt oszlopokat más, nagy kapacitású, de lassabb tárterületre tesszük Előbb lefuttatjuk a JOIN-okat (semi join), majd utána gyűjtjük hozzá a többi oszlopot Ekkor elegendő első körben csak a JOIN-hoz szükséges oszlopokat mozgatni (vagy tükrözni) 11 Elosztott JOIN ötletek 3 Alkalmazzunk okos cache-elést Ha már egy táblát valahova lemásoltunk, akkor egy darabig tartsuk is meg ott A hatékony cache-elés nagyban függ a futtatott query-ktől Milyen oszlopok, milyen sorok? Mennyire szűrnek a WHERE feltételek N. Li (2012) Több táblás JOIN tovább bonyolódik Nem mindegy a sorrend Gond, ha a JOIN ciklikus Graywulf Szalay Sándor Johns Hopkins Egyetem, Baltimore ELTE közreműködéssel SQL Server klaszterek tudományos célú felhasználása Load-balancing, probabilistic join, distributed join, array database stb. SkyQuery, turbulencia, stb. DataScope: klaszter DB + GPU integrációval 2
3 13 Web 2.0 Keresők, óriásáruházak, közösségi oldalak Néha exponenciális növekedés A nagy vasak nem bővíthetők a végtelenségig Hatalmas adatmennyiség Kevésbé strukturált adatok Magas rendelkezésre állás Nem baj, ha nem teljesen konzisztens RDBMS 16 Elosztott rendszerek Elosztott rendszerekre nagy igény lett nódus olcsó szerverekből Shared nothing megközelítés A nódusok meghibásodás a napi rutin része RDBMS-nél máig implementálatlan a több gépre történő scale-out Fő probléma: elosztott JOIN Próbálkozások vannak, pl. MySQL Cluster, Graywulf stb. Egy egyszerűbb út: új megközelítésű adatbázisok nosql (not only SQL) Sürgős fejlesztési kényszer Az RDBMS nagyon bonyolult, nem lehet gyorsan bővíteni a funkcionalitás Legyen sokkal egyszerűbb, de elosztott! Min lehet spórolni? Nem SQL nyelv Nem deklaratív programozási modell (imperatív) Nem relációs adatmodell Nincsenek általános scan és join műveletek Az ACID tranzakciós modell egyszerűsítése BASE (ld. később) 18 Két fontos terület Nagy mennyiségű adat feldolgozása Rendszeres műveletek Sok adat redukálása, scan Nagy számú felhasználó kiszolgálása Terhelés megosztása Random műveletek Adatok replikálása Adatbiztonsági okokból Terhelésmegosztás miatt Hadoop Google cikk alapján, Apache projekt, teljesen Java Hadoop Distributed File System Elosztott fájlrendszer, replikáció több gép között Nagy fájlokra (n 64Mb optimalizálva) Feladatütemező Sokgépes környezetben biztosítja a feladatok particionált futtatását Co-location-aware A feladatoknak párhuzamosíthatóknak kell lenniük Vagy túl bonyolult megírni, vagy ehelyett: Egyszerű építőkockákkal lehet csak dolgozni 3
4 20 Map/Reduce Feladatok megfogalmazása Filter, Map és Reduce függvény implementálható Ebből kell összerakni a programot A futtatás az adat kis darabjain történik A feldolgozandó adatcsomagokat az ütemező osztja ki Az adathalmaz többi részét egy-egy függvény nem láthatja Egy program több Filter/Map/Reduce rétegből állhat A rétegek a HDFS-re való írással osztják meg egymás között az adatokat Map/Reduce Filter Előzetes szűrést végez az adatokon Map Az előzetesen megszűrt adathalmaz minden elemére meghívódik Transzformációs műveleteket végez a következő reduce lépés számára Reduce Egy komplett adatcsomagot dolgoz fel A kapott adatok kombinációjából új adatokat állít elő A bemeneti adatok több partícióról, shardról is származhatnak 21 Map/Reduce Nagy előny szinte korlátlan scale-out működik Nagy hátrány: túl alacsony szintű, de pl.: PIG: magas szintű nyelv Hadoophoz Hive: Query nyelv + indexek Hadoophoz Nem új technológia, csak újra felfedezték Map/Reduce vs. RDBMS Amit MapReduce-szal meg lehet oldani, azt RDBMS-sel is A nehéz elosztott JOIN-okat a MapReduce sem tudja Hadoop fájlrendszer helyett legyenek táblák stb. nosql adatmodellek Key-Value (Redis, MongoDB, Scalien) Value lehet sokféle Dokumentum (bináris, xml stb.) String, lista, hash-tábla stb. BigTable (Google, Hbase, Cassandra) Sorok kulccsal Oszlopcsaládok (előre definiált) Oszlopok (nem előre definiált) Valójában key-value kompozit kulccsal Lehet még gráf, objektum stb. nosql alapok Alapműveletek adat megtalálása kulcs alapján egyetlen kulcshoz tartozó érték módosítása Tranzakciók egyszerűek egyetlen kulcs értékének a módosítása atomi a tranzakciók egylépésesek, nem párhuzamosítottak nincsen szükség a bonyolult izolációs rendszerre Nincsen scan művelet Kereséshez mindenképp kell index Indexeket karban kell tartani Van, hogy kézzel kell megoldani, de gyakran gyári támogatás is van 4
5 Konzisztencia Biztonsági mentés helyett replikáció Az adatok több példányban tárolódnak Mi biztosítja, hogy a replikák konzisztensek maradnak? Kell valami replikációs protokoll Általában aszinkron C Konzisztencia ablak Mennyi idő után válik a rendszer konzisztenssé Rendelkezésre állás Az adatok folyton elérhetőek Több belépési pont Nincsen egyetlen kritikus elem sem Geo-redundancia A válasz legyen gyors Minimális késleltetés Még akkor is, ha a visszaadott adat nem konzisztens A Partíció tűrés Elosztott rendszer Hálózati kapcsolat (lassú, törékeny) P Több belépési pont A rendszer akkor is működőképes marad, ha egyes részei nem látják egymást Elosztott funkcionalitás Pl. Facebook felhasználó bejelentkezés, fénykép megosztás, levelesláda CAP-tétel A háromból egyszerre csak kettő teljesíthető! A C P Tranzakciós modell lazítása BASE ACID elosztott rendszernél nagyon drága (2PC) Hiba esetén nem lehet tranzakciót érvényesíteni Helyette: BASE basically available, soft-state, eventually consistent Eleve olyan rendszert feltételez, ahol vannak hibák A hibákat optimista módon kezeli A tranzakciók hatásai nem egy időben jelennek meg ehhez kellene a kétlépéses érvényesítés üzenet formájában, véges idő alatt terjednek BA: Basically available Főleg CP rendszer esetében Legalább a rendszer egy része maradjon elérhető Soft-state A változások véges ideig tartó üzenetekkel történnek A rendszer állapota akkor is változhat, ha épp nincsen input Minden adatra lehet egy érvényességi idő Ha ez lejárt, akkor meg kell vizsgálni, hogy konzisztens-e még Eventually consistent Főleg AP rendszer esetében A változások aszinkron propagálnak (gossip protokollok) Egy idő után konzisztenssé válik Konzisztencia ablak 5
6 Konfliktusok feloldása Hiba miatt inkonzisztens állapot Fel kell oldani Többségi szavazáson múló algoritmusok Pl. Paxos Node-ok quorumokba szerveződve szavaznak Időbélyegzőn alapuló algoritmusok Mindig a legfrissebb adat tekintendő Deklaratív nyelv, optimalizáló RDBMS BigTable Hadoop Optimalizált scan Elsődleges kulcs szerinti elérés Indexek szerinti keresés Join műveletek Párhuzamos végrehajtás Egyszerű sharding Tranzakciók Többlépéses tranzakciók Durability ACID BASE backup/log replikáció replikáció Egyszerű load balancing Nem strukturált adat Szabványos API 6
MapReduce paradigma a CAP-tétel kontextusában. Adatb haladóknak. Balassi Márton Adatbázisok haladóknak 2012.
MapReduce paradigma a CAP-tétel kontextusában Balassi Márton balassi.marton@gmail.com 2012. október 30. Adatbázisok haladóknak 2012. 2012. október 30. Miről lesz szó? Elosztott adatfeldolgozásról általában
RészletesebbenMMK-Informatikai projekt ellenőr képzés 4
Miről lesz szó Big Data definíció Mi a Hadoop Hadoop működése, elemei Köré épülő technológiák Disztribúciók, Big Data a felhőben Miért, hol és hogyan használják Big Data definíció Miért Big a Data? 2017.
RészletesebbenAdatbáziskezelı-szerver SQL. Relációs adatbázis-kezelık. Relációs adatszerkezet. Házi feladat 2012.03.05.
1 2 Adatbáziskezelı-szerver Általában dedikált szerver Optimalizált háttértár konfiguráció Csak OS + adatbázis-kezelő szoftver Teljes memória az adatbázisoké Fő funkciók: Adatok rendezett tárolása a háttértárolón
RészletesebbenElosztott adatbázis-kezelő formális elemzése
Elosztott adatbázis-kezelő formális elemzése Szárnyas Gábor szarnyas@mit.bme.hu 2014. december 10. Budapesti Műszaki és Gazdaságtudományi Egyetem Hibatűrő Rendszerek Kutatócsoport Budapesti Műszaki és
RészletesebbenÉlet az SQL-en túl: Az adatfeldolgozás legújabb trendjei. Földi Tamás
Élet az SQL-en túl: Az adatfeldolgozás legújabb trendjei Földi Tamás tfoldi@starschema.net IBM Kutatóközpont San Jose, California, 1970 Negyven évvel később Gartner Report Elsősorban relációs adatbázisok
RészletesebbenComponent Soft 1994-2013 és tovább
Component Soft 1994-2013 és tovább IT szakemberek oktatása, tanácsadás Fő témáink: UNIX/Linux rendszerek, virtualizációs, fürtözési, tároló menedzsment és mentési technológiák Adatbázisok és middleware
RészletesebbenAdatbáziskezelő-szerver. Relációs adatbázis-kezelők SQL. Házi feladat. Relációs adatszerkezet
1 2 Adatbáziskezelő-szerver Általában dedikált szerver Optimalizált háttértár konfiguráció Csak OS + adatbázis-kezelő szoftver Teljes memória az adatbázisoké Fő funkciók: Adatok rendezett tárolása a háttértárolón
RészletesebbenAdatbázis rendszerek I
Normalizálás 1NF 2NF BCNF Adatbázis rendszerek I 20111201 1NF 2NF BCNF Ha BCNF 2NF A B B A 2NF BCNF 2NF részkulcsból indul ki FD létezik FD, amely nem jelölt kulcsból indul ki Jelölt kulcs olyan mezőcsoport
RészletesebbenAlternatív adatbázisok Gráfadatbázisok
Alternatív adatbázisok Gráfadatbázisok Adatbázis típusok Relációs PostgreSQL, Oracle, MySQL, stb. Dokumentum MongoDB, CouchDB, OrientDB Gráfadatbázis Neo4J, OrientDB, ArangoDB, InfiniteGraph Key-value
RészletesebbenGENERÁCIÓS ADATBÁZISOK A BIG DATA KÜLÖNBÖZŐ TERÜLETEIN
INFORMATIKAI PROJEKTELLENŐR 30 MB Szabó Csenger ÚJ GENERÁCIÓS ADATBÁZISOK A BIG DATA KÜLÖNBÖZŐ TERÜLETEIN 2016. 12. 31. MMK- Informatikai projektellenőr képzés Big Data definíció 2016. 12. 31. MMK-Informatikai
RészletesebbenGartner: Hype Cycle for Big Data NoSQL Database Management Systems
NOSQL RENDSZEREK Szárnyas Gábor szarnyas@mit.bme.hu 2014. március 3. Budapesti Műszaki és Gazdaságtudományi Egyetem Hibatűrő Rendszerek Kutatócsoport Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika
RészletesebbenNoSql, Document Store, MongoDB. Gombos Gergő
NoSql, Document Store, MongoDB Gombos Gergő Tematika NoSql Elosztott rendszerek konzisztenciája CAP, ACID, BASE MongoDB Koncepció JSON, BSON Adattárolás Replica, sharding Mongo CRUD Aggregation framework
RészletesebbenNem klaszterezett index. Beágyazott oszlopok. Klaszterezett index. Indexek tulajdonságai. Index kitöltési faktor
1 2 Nem klaszterezett indexek Egy táblán csak egy klaszterezett index lehet Ha más oszlop szerint is keresni akarunk, nem klaszterezett indexeket használunk A tábla mellett megjelenő adatstruktúra Egy
RészletesebbenNem klaszterezett index. Klaszterezett index. Beágyazott oszlopok. Index kitöltési faktor. Indexek tulajdonságai
1 2 Nem klaszterezett indexek Egy táblán csak egy klaszterezett index lehet Ha más oszlop szerint is keresni akarunk, nem klaszterezett indexeket használunk A tábla mellett megjelenő adatstruktúra Egy
RészletesebbenNoSQL technológiák. NoSQL Fórum Budapest, 2016. március 23. Diasablon: http://www.slidescarnival.com/ - a fotók sajátok :)
NoSQL technológiák az -nál NoSQL Fórum Budapest, 2016. március 23. Diasablon: http://www.slidescarnival.com/ - a fotók sajátok :) ! Ó L L E H Nádai Gábor avagy Mefi Lead dev az ingatlan.com Frontend csapatában
RészletesebbenReaktív programozás szerver oldalon
Reaktív programozás szerver oldalon Tóth Márton Supercharge Agenda Reactive streams Spring WebFlux Reactive Spring Data Benchmarks Konklúzió Reactive streams Reactive streams Reaktív programozási modell
RészletesebbenSzárnyas Gábor (BME) diáinak felhasználásával. https://www.db.bme.hu/targyak/adatbazisok-haladoknak
Szárnyas Gábor (BME) diáinak felhasználásával https://www.db.bme.hu/targyak/adatbazisok-haladoknak Codd: A Relational Model of Data for Large Shared Data Banks, 1970 1970-es évek eleje: SEQUEL (Structured
RészletesebbenAdatbázis, adatbázis-kezelő
Adatbázisok I. rész Adatbázis, adatbázis-kezelő Adatbázis: Nagy adathalmaz Közvetlenül elérhető háttértárolón (pl. merevlemez) Jól szervezett Osztott Adatbázis-kezelő szoftver hozzáadás, lekérdezés, módosítás,
RészletesebbenADATBÁZIS-KEZELÉS - BEVEZETŐ - Tarcsi Ádám, ade@inf.elte.hu
ADATBÁZIS-KEZELÉS - BEVEZETŐ - Tarcsi Ádám, ade@inf.elte.hu Számonkérés 2 Papíros (90 perces) zh az utolsó gyakorlaton. Segédanyag nem használható Tematika 1. félév 3 Óra Dátum Gyakorlat 1. 2010.09.28.
RészletesebbenPárhuzamosítás adatbáziskezelő rendszerekben
Párhuzamosítás adatbáziskezelő rendszerekben Erős Levente, 2018. 1 Párhuzamos műveletvégzés Miért? Nagy adatmennyiségek Nagyságrendileg nő a keletkező/feldolgozandó/tárolandó adat mennyisége Célhardver
RészletesebbenWeblog elemzés Hadoopon 1/39
Weblog elemzés Hadoopon 1/39 Az előadás témái Egy Hadoop job életciklusa A Weblog-projekt 2/39 Mi a Hadoop? A Hadoop egy párhuzamos programozási séma egy implementációja. 3/39 A programozási séma: MapReduce
RészletesebbenVirtuális Obszervatórium. Gombos Gergő
Virtuális Obszervatórium Gombos Gergő Áttekintés Motiváció, probléma felvetés Megoldások Virtuális obszervatóriumok NMVO Twitter VO Gombos Gergő Virtuális Obszervatórium 2 Motiváció Tudományos módszer
RészletesebbenRendszermodernizációs lehetőségek a HANA-val Poszeidon. Groma István PhD SDA DMS Zrt.
Rendszermodernizációs lehetőségek a HANA-val Poszeidon Groma István PhD SDA DMS Zrt. Poszeidon EKEIDR Tanúsított ügyviteli rendszer (3/2018. (II. 21.) BM rendelet). Munkafolyamat támogatás. Papírmentes
RészletesebbenMásolatképzési technikák és azok felhasználási lehetőségei
Másolatképzési technikák és azok felhasználási lehetőségei Godányi Géza Technical Account Manager EMC Magyarország Kft. 1 A belső másolatok előnye: Párhuzamos feldolgozás! Mentés / visszatöltés Oracle
RészletesebbenNem-relációs adatbáziskezelés. Gajdos Sándor május 8.
Nem-relációs adatbáziskezelés Gajdos Sándor 2018. május 8. 1 Motiváció A feladat pontosabb értelmezése: Hogyan lehet adatokat minél nagyobb hatékonysággal kezelni? Mit jelent az adatkezelés? Meddig lehet
RészletesebbenProcesszusok (Processes), Szálak (Threads), Kommunikáció (IPC, Inter-Process Communication)
1 Processzusok (Processes), Szálak (Threads), Kommunikáció (IPC, Inter-Process Communication) 1. A folyamat (processzus, process) fogalma 2. Folyamatok: műveletek, állapotok, hierarchia 3. Szálak (threads)
RészletesebbenTudásalapú információ integráció
Tudásalapú információ integráció (A Szemantikus Web megközelítés és a másik irány) Tanszéki értekezlet, 2008. május 14. 1 Miért van szükségünk ilyesmire? WWW: (Alkalmazások) Keresés a weben (pl. összehasonlítás
RészletesebbenAz MTA Cloud a tudományos alkalmazások támogatására. Kacsuk Péter MTA SZTAKI
Az MTA Cloud a tudományos alkalmazások támogatására Kacsuk Péter MTA SZTAKI Kacsuk.Peter@sztaki.mta.hu Tudományos alkalmazások és skálázhatóság Kétféle skálázhatóság: o Vertikális: dinamikusan változik
RészletesebbenAdatbázis-kezelő rendszerek. dr. Siki Zoltán
Adatbázis-kezelő rendszerek I. dr. Siki Zoltán Adatbázis fogalma adatok valamely célszerűen rendezett, szisztéma szerinti tárolása Az informatika elterjedése előtt is számos adatbázis létezett pl. Vállalati
RészletesebbenTranzakció-kezelés, alapfogalmak. Vassányi István, 2012.
Tranzakció-kezelés, alapfogalmak Vassányi István, 2012. ACID tulajdonságok Tranzakció: az üzleti folyamat egy logikailag összetartozó lépéssorozata atomicity: nem valósulhat meg részlegesen consistency:
RészletesebbenDöbrönte Zoltán. Data Vault alapú adattárház - Fél óra alatt. DMS Consulting Kft.
Data Vault alapú adattárház - Fél óra alatt Döbrönte Zoltán DMS Consulting Kft. 1 Miről lesz szó Adattárház automatizálás Hol alkalmazható a leghatékonyabban Célok, funkcionalitás, előnyök Data Vault modellezés
RészletesebbenBig Data adattárházas szemmel. Arató Bence ügyvezető, BI Consulting
Big Data adattárházas szemmel Arató Bence ügyvezető, BI Consulting 1 Bemutatkozás 15 éves szakmai tapasztalat az üzleti intelligencia és adattárházak területén A BI Consulting szakmai igazgatója A BI.hu
RészletesebbenAz adatbázisrendszerek világa
Az adatbázisrendszerek világa Tankönyv: Ullman-Widom: Adatbázisrendszerek Alapvetés Második, átdolgozott kiadás, Panem, 2009 1.1. Az adatbázisrendszerek fejlődése 1.2. Az adatbázis-kezelő rendszerek áttekintése
RészletesebbenTakács Gábor mérnök informatikus, okl. mérnöktanár
Takács Gábor mérnök informatikus, okl. mérnöktanár takacsg@sze.hu http://rs1.sze.hu/~takacsg/ Big Data Definition Big Data is data that can t be stored or analyzed using traditional tools. Információ tartalom,
RészletesebbenMuppet: Gyors adatok MapReduce stílusú feldolgozása. Muppet: MapReduce-Style Processing of Fast Data
Muppet: Gyors adatok MapReduce stílusú feldolgozása Muppet: MapReduce-Style Processing of Fast Data Tartalom Bevezető MapReduce MapUpdate Muppet 1.0 Muppet 2.0 Eredmények Jelenlegi tendenciák Nagy mennyiségű
RészletesebbenWebes alkalmazások fejlesztése 11. előadás. Alkalmazások felhőben. 2015 Giachetta Roberto groberto@inf.elte.hu http://people.inf.elte.
Eötvös Loránd Tudományegyetem Informatikai Kar Webes alkalmazások fejlesztése 11. előadás Alkalmazások felhőben 2015 Giachetta Roberto groberto@inf.elte.hu http://people.inf.elte.hu/groberto Számítástechnikai
RészletesebbenMySQL kontra MongoDB programozás. SQL és NoSQL megközelítés egy konkrét példán keresztül
MySQL kontra MongoDB programozás SQL és NoSQL megközelítés egy konkrét példán keresztül Kardos Sándor sandor@component.hu Miről lesz szó? Miért érdemes őket összehasonlítani? MySQL általános jellemzői
RészletesebbenNIIF Központi Elosztott Szolgáltatói Platform
NIIF Központi Elosztott Szolgáltatói Platform Bajnok Kristóf kristof.bajnok@sztaki.hu MTA-SZTAKI ITAK 2004. április 7. MTA Sztaki / ITAK 1 A helyzet 2002-ben Az NIIF központi szolgáltatásait a helka.iif.hu
RészletesebbenTematika. MongoDB koncepció JSON Schemaless logika Replicaset képzés Sharding Aggregate framework
MONGODB Tematika MongoDB koncepció JSON Schemaless logika Replicaset képzés Sharding Aggregate framework Koncepció párhuzamosítás: hardver infrastruktúra adta lehetőségeket kihasználni (sok szerver, sok
RészletesebbenAdatbázisműveletek és lekérdezésoptimalizálás
és lekérdezésoptimalizálás Nagyméretű adathalmazok kezelése Kazi Sándor 2010. február 24. Kazi Sándor (kazi@cs.bme.hu) és lekérdezésoptimalizálás 1 / 39 1 Bevezetés 2 3 4 5 6 7 Kazi Sándor (kazi@cs.bme.hu)
RészletesebbenTöbbfelhasználós és internetes térkép kezelés, megjelenítés
Többfelhasználós és internetes térkép kezelés, megjelenítés Többfelhasználós környezetek Egyszerű fájlszerveres megoldás, LAN (Novel, Windows hálózat) Egy fájl egyidejű módosítása több helyről nem lehetséges
RészletesebbenVodafone ODI ETL eszközzel töltött adattárház Disaster Recovery megoldása. Rákosi Péter és Lányi Árpád
Vodafone ODI ETL eszközzel töltött adattárház Disaster Recovery megoldása Rákosi Péter és Lányi Árpád Adattárház korábbi üzemeltetési jellemzői Online szolgáltatásokat nem szolgált ki, klasszikus elemzésre
RészletesebbenSQLServer. Particionálás
SQLServer 11. téma DBMS particiók, LOG shipping Particionálás Tábla, index adatinak szétosztása több FileGroup-ra 1 Particionálás Előnyök: Nagy méret hatékonyabb kezelése Részek önálló mentése, karbantartása
RészletesebbenMicrosoft SQL Server telepítése
Microsoft SQL Server telepítése Az SQL Server a Microsoft adatbázis kiszolgáló megoldása Windows operációs rendszerekre. Az SQL Server 1.0 verziója 1989-ben jelent meg, amelyet tizenegy további verzió
RészletesebbenNAGY TELJESÍTM. Szerzők Dévai. István Automatizálási. és s Alkalmazott Informatikai Tanszék
NAGY TELJESÍTM TMÉNYŰ WEBALKALMAZÁSOK KÉSZÍTÉSE SE JAVA TECHNOLÓGI GIÁVAL Szerzők Dévai István Automatizálási és s Alkalmazott Informatikai Tanszék Az előad adás s tartalma Elméleti áttekintés Nagy teljesítményű
RészletesebbenWebes alkalmazások fejlesztése 11. előadás. Alkalmazások felhőben. Alkalmazások felhőben Számítástechnikai felhő
Eötvös Loránd Tudományegyetem Informatikai Kar Webes alkalmazások fejlesztése 11. előadás Számítástechnikai felhő A számítástechnikai felhő (computational cloud) egy olyan szolgáltatás alapú rendszer,
RészletesebbenAdattárház tiszta alapokon Oracle Day, Budapest, november 8.
Adattárház tiszta alapokon Oracle Day, Budapest, 2011. november 8. WIT-SYS Consulting Zrt. Lévai Gábor gabor.levai@wit-sys.hu Tematika Az adattárházról általánosan Az adattárház definíciója Fő jellemzők
Részletesebben2011. November 8. Boscolo New York Palace Budapest. Extrém teljesítmény Oracle Exadata és Oracle Exalogic rendszerekkel
2011. November 8. Boscolo New York Palace Budapest Extrém teljesítmény Oracle Exadata és Oracle Exalogic rendszerekkel Integrált rendszerek - Engineered Systems Együtt tervezett hardver és szoftver Egyedi
RészletesebbenHálózatba kapcsolt adatbázisok. Erős Levente, TMIT eros@tmit.bme.hu 2011.
Hálózatba kapcsolt adatbázisok Magas rendelkezésreállás Erős Levente, TMIT eros@tmit.bme.hu 2011. Tartalom Mi az, hogy rendelkezésreállás? Miért fontos? Hogyan mérjük? Mitől sérül? Védelmi szintek Rendelkezésreállási
RészletesebbenAdatbázis-lekérdezés. Az SQL nyelv. Makány György
Adatbázis-lekérdezés Az SQL nyelv Makány György SQL (Structured Query Language=struktúrált lekérdező nyelv): relációs adatbázisok adatainak visszakeresésére, frissítésére, kezelésére szolgáló nyelv. Születési
RészletesebbenHadoop és használata az LPDS cloud-on
Hadoop és használata az LPDS cloud-on Bendig Loránd lbendig@ilab.sztaki.hu 2012.04.13 Miről lesz szó? Bevezetés Hadoop áttekintés OpenNebula Hadoop cluster az LPDS cloud-on Tapasztalatok, nyitott kérdések
RészletesebbenBig Data az adattárházban
Big Data az adattárházban A párbaj folytatódik? Néhány fontos Big Data projekt Cég Téma Adat Újfajta Mennyiség Saját adat? Típus Google Influenza Google I big I Előjelzés előjelzés Farecast Xoom Chicagoi
RészletesebbenData Vault adatmodellezés.
Data Vault adatmodellezés Nemeth.Zoltan@iqpp.hu Új adattárház adatmodellezési módszer Dan Linstedt nevéhez fűződik Ismérvei Részletes, tételes adatok Történetiség kezelése Data Vault Üzleti területek köré
RészletesebbenGENERÁCIÓS ADATBÁZISOK A BIG DATA KÜLÖNBÖZŐ TERÜLETEIN
INFORMATIKAI PROJEKTELLENŐR 30 MB Szendi-Varga János ÚJ GENERÁCIÓS ADATBÁZISOK A BIG DATA KÜLÖNBÖZŐ TERÜLETEIN 2016. 12. 31. MMK- Informatikai projektellenőr képzés 2016. 12. 31. MMK-Informatikai projekt
RészletesebbenFelhők teljesítményelemzése felhő alapokon
Felhők teljesítményelemzése felhő alapokon Kocsis Imre ikocsis@mit.bme.hu HTE Infokom 2014 Budapest University of Technology and Economics Department of Measurement and Information Systems 1 IT Szolgáltatásmenedzsment
RészletesebbenRiak. Pronounced REE-ahk. Elosztott adattároló eszköz. Molnár Péter molnarp@ilab.sztaki.hu
Riak Pronounced REE-ahk Elosztott adattároló eszköz Molnár Péter molnarp@ilab.sztaki.hu Mi a Riak? A Database A Data Store A key/value store A NoSQL database Schemaless and data-type agnostic Written (primarily)
RészletesebbenRHadoop. Kocsis Imre Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék
RHadoop Kocsis Imre ikocsis@mit.bme.hu Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Házi feladat Csapatépítés o 2 fő, tetszőleges kombinációkban http://goo.gl/m8yzwq
RészletesebbenProcesszusok (Processes), Szálak (Threads), Kommunikáció (IPC, Inter-Process Communication)
1 Processzusok (Processes), Szálak (Threads), Kommunikáció (IPC, Inter-Process Communication) 1. A folyamat (processzus, process) fogalma 2. Folyamatok: műveletek, állapotok, hierarchia 3. Szálak (threads)
RészletesebbenMongoDB THE NOSQL DATABASE. Készítette: Hugyák Tamás v2.1.1
MongoDB THE NOSQL DATABASE Készítette: Hugyák Tamás v2.1.1 Fontosabb információk E-mail: hugyak@dev.mik.uni-pannon.hu Weboldal: http://desoft.hu/oktatas/mongodb/tartalom MongoDB weboldala: http://www.mongodb.org/
RészletesebbenCsima Judit szeptember 6.
Adatbáziskezelés, bevezető Csima Judit BME, VIK, Számítástudományi és Információelméleti Tanszék 2017. szeptember 6. Csima Judit Adatbáziskezelés, bevezető 1 / 20 Órák, emberek heti két óra: szerda 14.15-16.00
RészletesebbenAdatbázisok elmélete
Adatbázisok elmélete Adatbáziskezelés, bevezető Katona Gyula Y. Számítástudományi és Információelméleti Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem Katona Gyula Y. (BME SZIT) Adatbázisok elmélete
Részletesebben2278-771061-Y02 2014. márci
A WD és a WD embléma a Western Digital Technologies, Inc. az Egyesült Államokban és más országokban bejegyzett védjegyei; Az absolutely, a WD Re, a WD Se, a WD Xe, a RAFF és a StableTrac a Western Digital
RészletesebbenProgramozás alapjai II. (7. ea) C++ Speciális adatszerkezetek. Tömbök. Kiegészítő anyag: speciális adatszerkezetek
Programozás alapjai II. (7. ea) C++ Kiegészítő anyag: speciális adatszerkezetek Szeberényi Imre BME IIT M Ű E G Y E T E M 1 7 8 2 C++ programozási nyelv BME-IIT Sz.I. 2016.04.05. - 1
RészletesebbenEgészítsük ki a Drupal-t. Drupal modul fejlesztés
Egészítsük ki a Drupal-t Drupal modul fejlesztés Drupal 6.0 2008. február 13. Miért írjunk Drupal modult? Nincs az igényeinknek megfelelő modul Valamilyen közösségi igény kielégítése Valami nem úgy működik
RészletesebbenNoSQL adatbázisok. Adatb haladóknak. Trencséni Márton Adatbázisok haladóknak szeptember 25.
NoSQL adatbázisok NoSQL @ Adatb haladóknak Trencséni Márton mtrencseni@gmail.com Adatbázisok haladóknak 2012. 2012. szeptember 25. Kérdés Használtatok-e már NoSQL terméket? Mikor használnátok NoSQL terméket?
RészletesebbenSpeciális adatszerkezetek. Programozás alapjai II. (8. ea) C++ Tömbök. Tömbök/2. N dimenziós tömb. Nagyméretű ritka tömbök
Programozás alapjai II. (8. ea) C++ Kiegészítő anyag: speciális adatszerkezetek Szeberényi Imre BME IIT Speciális adatszerkezetek A helyes adatábrázolás választása, a helyes adatszerkezet
RészletesebbenKomponens alapú szoftverfejlesztés 10. előadás. Elosztott alkalmazások architektúrái. Elosztott alkalmazások architektúrái
Eötvös Loránd Tudományegyetem Informatikai Kar Komponens alapú szoftverfejlesztés 10. előadás Elosztott alkalmazások architektúrái Giachetta Roberto groberto@inf.elte.hu http://people.inf.elte.hu/groberto
RészletesebbenAdatmodellezés. 1. Fogalmi modell
Adatmodellezés MODELL: a bonyolult (és időben változó) valóság leegyszerűsített mása, egy adott vizsgálat céljából. A modellben többnyire a vizsgálat szempontjából releváns jellemzőket (tulajdonságokat)
RészletesebbenProgramozási technikák Pál László. Sapientia EMTE, Csíkszereda, 2009/2010
Programozási technikák Pál László Sapientia EMTE, Csíkszereda, 2009/2010 12. ELŐADÁS Adatbázis-kezelés Delphiben 2 Adatmegjelenítés lekérdezés segítségével A táblákhoz hasonlóan a lekérdezések is az adatbázis
Részletesebbenwebalkalmazások fejlesztése elosztott alapon
1 Nagy teljesítményű és magas rendelkezésreállású webalkalmazások fejlesztése elosztott alapon Nagy Péter Termékmenedzser Agenda Java alkalmazás grid Coherence Topológiák Architektúrák
RészletesebbenTeljesen elosztott adatbányászat pletyka algoritmusokkal. Jelasity Márk Ormándi Róbert, Hegedűs István
Teljesen elosztott adatbányászat pletyka algoritmusokkal Jelasity Márk Ormándi Róbert, Hegedűs István Motiváció Nagyméretű hálózatos elosztott alkalmazások az Interneten egyre fontosabbak Fájlcserélő rendszerek
RészletesebbenProgramozás alapjai II. (7. ea) C++
Programozás alapjai II. (7. ea) C++ Kiegészítő anyag: speciális adatszerkezetek Szeberényi Imre BME IIT M Ű E G Y E T E M 1 7 8 2 C++ programozási nyelv BME-IIT Sz.I. 2016.04.05. - 1
RészletesebbenMPP Adattárház Teradata alapokon
MPP Adattárház Teradata alapokon Tanulmány az Adatbázisok haladóknak c. tárgyhoz Lévai Ákos PRISE Kft. 2012/2013 tanév I. félév Tartalomjegyzék BEVEZETÉS...3 ELŐZMÉNYEK...3 AZ MPP ADATTÁRHÁZ...3 ADATTÁRHÁZAKRÓL
RészletesebbenMagic xpi 4.0 vadonatúj Architektúrája Gigaspaces alapokon
Magic xpi 4.0 vadonatúj Architektúrája Gigaspaces alapokon Mi az IMDG? Nem memóriában futó relációs adatbázis NoSQL hagyományos relációs adatbázis Más fajta adat tárolás Az összes adat RAM-ban van, osztott
RészletesebbenA programozás alapjai előadás. Amiről szólesz: A tárgy címe: A programozás alapjai
A programozás alapjai 1 1. előadás Híradástechnikai Tanszék Amiről szólesz: A tárgy címe: A programozás alapjai A számítógép részegységei, alacsony- és magasszintű programnyelvek, az imperatív programozási
RészletesebbenADATBÁZIS RENDSZEREK. Adatbázisok története, alapfogalmak, adatmodellek. Krausz Nikol, Medve András, Molnár Bence
ADATBÁZIS RENDSZEREK Adatbázisok története, alapfogalmak, adatmodellek Krausz Nikol, Medve András, Molnár Bence 2018.01.14. BEMUTATKOZÁS Molnár Bence molnar.bence@epito.bme.hu e-mail tárgya: [ABR] aktív
RészletesebbenAdatbázis rendszerek 7. előadás State of the art
Adatbázis rendszerek 7. előadás State of the art Molnár Bence Szerkesztette: Koppányi Zoltán Osztott adatbázisok Osztott rendszerek Mi is ez? Mi teszi lehetővé? Nagy sebességű hálózat Egyre olcsóbb, és
RészletesebbenGráf adatbázisok NoSql, neo4j. Gombos Gergő
Gráf adatbázisok NoSql, neo4j Gombos Gergő Áttekintés Miért használjunk gráfot? Mi a gráf? Hogy dolgozzunk gráfadatbázisokkal (neo4j) Korszerű adatbázisok Gráfadatbázisok 2 Gráf az egész világ Közösségi
RészletesebbenAlkalmazásokban. Dezsényi Csaba Ovitas Magyarország kft.
Tudásmodellezés Kereskedelmi Alkalmazásokban Dezsényi Csaba Ovitas Magyarország kft. Tudásmenedzsment Adat -> Információ -> Tudás Intézményi tudásvagyon hatékony kezelése az üzleti célok megvalósításának
RészletesebbenCélkitűzések Az Oracle10 g felépítésének, használatának alapszíntű megismerése
BEVEZETÉS Célkitűzések Az Oracle10g felépítésének, használatának alapszíntű megismerése A relációs adatbázis-kezelés elméleti és gyakorlati vonatkozásainak áttekintése Az SQL, PL/SQL nyelvek használatának
RészletesebbenIndexek és SQL hangolás
Indexek és SQL hangolás Ableda Péter abledapeter@gmail.com Adatbázisok haladóknak 2012. 2012. november 20. Miről lesz szó? Történelem Oracle B*-fa Index Felépítése, karbantartása, típusai Bitmap index
RészletesebbenInformatikai alapismeretek Földtudományi BSC számára
Informatikai alapismeretek Földtudományi BSC számára 2010-2011 Őszi félév Heizlerné Bakonyi Viktória HBV@ludens.elte.hu Titkosítás,hitelesítés Szimmetrikus DES 56 bites kulcs (kb. 1000 év) felcserél, helyettesít
RészletesebbenOracle GoldenGate Studio Nagyon rövid bemutató. Quick Talk. Gollnhofer Gábor
Oracle GoldenGate Studio Nagyon rövid bemutató Oracle GoldenGate Studio Quick Talk Gollnhofer Gábor 1 Alapelvek Adatmozgatási modellek 2 Rövid Oracle replikációs történet Change Data Capture (CDC) Oracle
RészletesebbenBig Data tömeges adatelemzés gyorsan
MEDIANET 2015 Big Data tömeges adatelemzés gyorsan STADLER GELLÉRT Oracle Hungary Kft. gellert.stadler@oracle.com Kulcsszavak: big data, döntéstámogatás, hadoop, üzleti intelligencia Az utóbbi években
RészletesebbenAdatbázisok (relációs, objektum relációs, NoSQL) Adatbáziskezelő rendszerek Adatbázisok felépítése Adatbázisok tervezése
Tartalom Adatbázisok (relációs, objektum relációs, NoSQL) Adatbáziskezelő rendszerek Adatbázisok felépítése Adatbázisok tervezése 2017. 11. 23. 1 Adatbázisok Az adatbázis fogalma Adatbázison valamely cél
RészletesebbenCOMPANY PROFILE SZOFI ALGORITHMIC RESEARCH KFT
COMPANY PROFILE SZOFI ALGORITHMIC RESEARCH KFT WWW.SZOFIUSA.COM CÉGTÖRTÉNET 1990 Alapítás 1990 Informatikai fejlesztések kezdete 1992 Felsőfokú informatikai képzési rendszer kidolgozása a kormányzat részére
RészletesebbenBudapest Műszaki és Gazdaságtudományi Egyetem Villamosmérnöki és Informatikai Kar Adatbázisok Oktatási Labor. Adatbázisok haladóknak VITMAV12
Budapest Műszaki és Gazdaságtudományi Egyetem Villamosmérnöki és Informatikai Kar Adatbázisok Oktatási Labor Adatbázisok haladóknak VITMAV12 Oszlopcsaládok Cassandra és HBase Szerző: Gábor Bernát Vezető
RészletesebbenValós idejű megoldások: Realtime ODS és Database In-Memory tapasztalatok
Valós idejű megoldások: Realtime ODS és Database In-Memory tapasztalatok Pusztai Péter IT fejlesztési senior menedzser Magyar Telekom Sef Dániel Szenior IT tanácsadó T-Systems Magyarország 2016. április
Részletesebben30 MB INFORMATIKAI PROJEKTELLENŐR ADATBÁZISOK MEGVALÓSÍTÁSA (ADATBÁZISOK, ADATBÁZISKEZELŐK, ADATBÁZISOK FELÉPÍTÉSE, ADATBÁZISOK TERVEZÉSE)
INFORMATIKAI PROJEKTELLENŐR 30 MB DOMBORA SÁNDOR ADATBÁZISOK MEGVALÓSÍTÁSA (ADATBÁZISOK, ADATBÁZISKEZELŐK, ADATBÁZISOK FELÉPÍTÉSE, ADATBÁZISOK TERVEZÉSE) 2016. 12. 31. MMK- Informatikai projektellenőr
RészletesebbenTABLE ACCESS FULL HASH CLUSTER BY INDEX ROWID BY USER ROWID BY GLOBAL INDEX ROWID BY LOCAL INDEX ROWID
Az eddigi pédákban szereplo muveletek (operation és option együtt) (Az összes létezo lehetoséget lásd -> Performance Tuning Guide 19.9 fejezet, 19.3. táblázat) TABLE ACCESS FULL HASH CLUSTER BY INDEX ROWID
RészletesebbenAz alapprobléma. Az SQL querydeklaratív Azt mondjuk meg, hogy mit akarunk eredménynek Nem azt, hogy milyen fizikai műveletek történjenek
1 2 Az alapprobléma Az SQL querydeklaratív Azt mondjuk meg, hogy mit akarunk eredménynek Nem azt, hogy milyen fizikai műveletek történjenek Rendelkezésre álló információk Maga az SQL lekérdezés Táblák,
RészletesebbenIBM SPSS Modeler 18.2 Újdonságok
IBM SPSS Modeler 18.2 Újdonságok 1 2 Új, modern megjelenés Vizualizáció fejlesztése Újabb algoritmusok (Python, Spark alapú) View Data, t-sne, e-plot GMM, HDBSCAN, KDE, Isotonic-Regression 3 Új, modern
RészletesebbenOracle SQL Developer Data Modeler és a DW adatmodellezés. Gollnhofer Gábor Meta Consulting Kft.
Oracle SQL Developer Data Modeler és a DW adatmodellezés Gollnhofer Gábor Meta Consulting Kft. Oracle Information Management & Big Data Reference Architecture 2 Mi a NoSQL modellezés célja? Forrás: Insights
RészletesebbenAdatbázis rendszerek. Molnár Bence. Szerkesztette: Koppányi Zoltán és Berényi Attila
Adatbázis rendszerek Molnár Bence Szerkesztette: Koppányi Zoltán és Berényi Attila A tárgyról A tárgyról 2 kredit 1 zárthelyi 2 házi feladat 70%-os jelenlét hibrid előadások http://web.fmt.bme.hu/abr http://www.fmt.bme.hu/fmt/htdocs/oktatas/
RészletesebbenExcel ODBC-ADO API. Tevékenységpontok: - DBMS telepítés. - ODBC driver telepítése. - DSN létrehozatala. -Excel-ben ADO bevonása
DBMS spektrum Excel ODBC-ADO API Tevékenységpontok: - DBMS telepítés - ODBC driver telepítése - DSN létrehozatala -Excel-ben ADO bevonása - ADOConnection objektum létrehozatala - Open: kapcsolat felvétel
RészletesebbenNyilvántartási Rendszer
Nyilvántartási Rendszer Veszprém Megyei Levéltár 2011.04.14. Készítette: Juszt Miklós Honnan indultunk? Rövid történeti áttekintés 2003 2007 2008-2011 Access alapú raktári topográfia Adatbázis optimalizálás,
RészletesebbenAdatbázisok I 2012.05.11. Adatmodellek komponensei. Adatbázis modellek típusai. Adatbázisrendszer-specifikus tervezés
Adatbázisok I Szemantikai adatmodellek Szendrői Etelka PTE-PMMK Rendszer és Szoftvertechnológiai Tanszék szendroi@pmmk.pte.hu Adatmodellek komponensei Adatmodell: matematikai formalizmus, mely a valóság
RészletesebbenOracle E-Business Suite üzemeltetés a Rába Járműipari Holding Nyrt.-nél
Oracle E-Business Suite üzemeltetés a Rába Járműipari Holding Nyrt.-nél 1 Kósa György Szenior Rendszermérnök (Oracle OCP és MSSQL DBA, EBS DBA) T-Systems Magyarország Zrt. Kósa György - T-Systems Magyarország
RészletesebbenOE-NIK 2010/11 ősz OE-NIK. 2010. ősz
2010/11 ősz 1. Word / Excel 2. Solver 3. ZH 4. Windows 5. Windows 6. ZH 7. HTML 8. HTML 9. ZH 10. Adatszerkezetek, változók, tömbök 11. Számábrázolási kérdések 12. ZH 13. Pótlás A Windows felhasználói
Részletesebben