Korszerű Adatbázisok. Gombos Gergő

Hasonló dokumentumok
Korszerű Adatbázisok. Gombos Gergő

Párhuzamos és Grid rendszerek

TELJESÍTÉNYMÉRÉS FELHŐ ALAPÚ KÖRNYEZETBEN AZURE CLOUD ANALÍZIS


Operációs rendszerek az iskolában

IBM felhő menedzsment

Alkalmazás és megjelenítés virtualizáció

VIRTUALIZÁCIÓS TECHNOLÓGIÁK EUCALYPTUS CLOUD PLATFORM

Felhőszámítástechnika (Cloud Computing) helye és szerepe az on-line világ folyamataiban. Dr. Élő Gábor Széchenyi István Egyetem ITOK 2013

Miért jó nekünk kutatóknak a felhő? Kacsuk Péter MTA SZTAKI

Amazon Web Services. Géhberger Dániel Szolgáltatások és alkalmazások március 28.

UNIX / Linux rendszeradminisztráció

Felhőszolgáltatások megvalósítása PureSystems eszközökön

Adatbázis rendszerek 7. előadás State of the art

Bárányfelhő vagy viharfelhő? A felhő alapú megoldások biztonsági kérdései. Császár Rudolf Műszaki fejlesztési vezető Digital Kft.

FELHŐ és a MAINFRAME. Irmes Sándor

Utolsó módosítás:

Felhő rendszerek és felhő föderációk. Kacsuk Péter MTA SZTAKI

Segesdi Dániel. OpenNebula. Virtualizációs technológiák és alkalmazásaik BMEVIMIAV ősz

Virtualizáció. egy hardveren több virtuális rendszer működik egyszerre, virtuális gépekben futó önálló vendég (guest) operációs rendszerek formájában

Windows Server 2012: a felhő OS

Felhőalkalmazások a. könyvvizsgálatban

A felhőről általában. Kacsuk Péter MTA SZTAKI

MTA Cloud Use cases MTA Cloud workshop. Hernáth Szabolcs MTA WIGNER FK

Infrastruktúra alapelemek és számítási felhők

Magyar Posta központi Oracle infrastruktúrája VMware alapokon

Könyvtári szervervirtualizáció Oracle Virtual Machine platformon

Felhő alapú hálózatok (VITMMA02) Virtualizáció

VIRTUALIZÁCIÓ KÉSZÍTETTE: NAGY ZOLTÁN MÁRK EHA: NAZKABF.SZE I. ÉVES PROGRAMTERVEZŐ-INFORMATIKUS, BSC

A virtualizáció a modern vállalati informatikai infrastruktúra alapja

Hogyan működtethető a telefonrendszer virtuális környezetben? Mészáros Tamás Műszaki fejlesztési vezető

TECHNOLÓGIAI JÖVİKÉP. Felhınézetben. Tázló József mőszaki igazgató Cisco Systems Magyarország Cisco Systems, Inc. All rights reserved.

Felhő alapú hálózatok (VITMMA02) Virtualizáció

EGI-InSPIRE. Café Grid március 24. Szeberényi Imre 3/25/ EGI-InSPIRE RI

A cloud szolgáltatási modell a közigazgatásban

Felhő számítástechnika

A felhő. Buday Gergely Károly Róbert Főiskola ősz

Nagyméretű webes projektek a felhőben

Veeam Agent for Windows and Linux

BIG DATA ÉS GÉPI TANULÁS KÖRNYEZET AZ MTA CLOUD-ON KACSUK PÉTER, NAGY ENIKŐ, PINTYE ISTVÁN, HAJNAL ÁKOS, LOVAS RÓBERT

ÉLET A FELHŐBEN - HATÉKONYSÁGNÖVELÉS CLOUD TECHNOLÓGIÁVAL. Baranyi Fanni Microsoft Online Szolgáltatások Értékesítési Szakértő

Virtualizációs Technológiák Felhő alapú rendszerek

Utolsó módosítás:

Bemutató Adatközponti címarchitektúra Cisco módra

MMK-Informatikai projekt ellenőr képzés 4

Az Invitel adatközponti virtualizációja IBM alapokon

A számítási felhő világa

A hibrid DB cloud biztonsági eszköztára. Kóródi Ferenc Budapest,

2011. November 8. Boscolo New York Palace Budapest. Extrém teljesítmény Oracle Exadata és Oracle Exalogic rendszerekkel

Korszerű technológiai és szolgáltatási modellek

Hiperkonvergens infrastruktúra. Brenner Zoltán rendszermérnök

Felhők teljesítményelemzése felhő alapokon

Andrews Kft. A technológia megoldás szállító. <zambo.marcell@andrews.hu>

Virtualizációs Technológiák Operációs rendszer szintű virtualizáció Konténerek Forrás, BME-VIK Virtualizációs technológiák

Szervervirtualizáció és fürtözés újdonságok a WS16 TP3-ban

A Magyar Posta Zrt Hyper-V infrastruktúrája. Bene Zsolt Infrastruktúra fejlesztő rendszermérnök Magyar Posta ZRT

SUSE Linux Enterprise Server 12 Hargitai Zsolt

ProofIT Informatikai Kft Budapest, Petzvál J. 4/a

Számítási felhők (Cloud Computing)

Cloud computing. Cloud computing. Dr. Bakonyi Péter.

Üdvözlöm Önöket a Konferencián!

30 MB INFORMATIKAI PROJEKTELLENŐR

Hadoop és használata az LPDS cloud-on

Cloud computing Dr. Bakonyi Péter.

IT trendek és lehetőségek. Puskás Norbert

GENERÁCIÓS ADATBÁZISOK A BIG DATA KÜLÖNBÖZŐ TERÜLETEIN

Copyright 2012, Oracle and/or its affiliates. All rights reserved.

Környezetbarát megoldások IBM virtualizációval

SUSE Linux megoldások. Horváth Gábor Kálmán vezető tanácsadó

CMDB architektúra megjelenítése SAMU-val Rugalmas megoldás. ITSMF Bekk Nándor Magyar Telekom / IT szolgáltatás menedzsment központ

Üzleti folyamatok a felhőben. ECM Szakmai Kongresszus 2011.október 4.

Az információs rendszerek adatai

Költséghatékony virtualizáció. Kósa Barna Hewlett Packard

Az információs rendszerek adatai

HAMOR Soft. Korszerű ügyvitel Linuxon, Cloudban, táblagéppel, okostelefonnal. Bodosi Imre ügyvezető, rendszertervező. Sántha Loránt programozó

Webes alkalmazások fejlesztése Bevezetés. Célkitűzés, tematika, követelmények. A.NET Core keretrendszer

Privát felhő megoldások és tapasztalatok

Hibrid Cloud az új Oracle Enterprise Manager Cloud Control 13c-vel

Webes alkalmazások fejlesztése Bevezetés. Célkitűzés, tematika, követelmények. A.NET Core keretrendszer

A T-Systems felhő koncepciója Frigó József

Léteznek nagyon jó integrált szoftver termékek a feladatra. Ezek többnyire drágák, és az üzemeltetésük sem túl egyszerű.

SUSE Linux Enterprise High Availability. Kovács Lajos Vezető konzultáns

Infrastruktúra lehetőségek idén

Virtualizációs Technológiák Felhő alapú rendszerek

Big Data tömeges adatelemzés gyorsan

Virtuális Obszervatórium. Gombos Gergő

Everything Over Ethernet

Virtualizációs Technológiák Bevezetés Kovács Ákos Forrás, BME-VIK Virtualizációs technológiák

Hitachi Flash Újdonságok. Szokol Zsolt Senior Solution Consultant 2016 március

SUSE Container as a Service Platform Nagyvállalati Kubernetes. Papp Zsolt Konzultáns

Mikor és hogyan érdemes virtualizálni?

NIIF szolgáltatások a múzeumok számára

Virtualizációs technológiák Linux alatt (teljesítményteszt)

Felhő alapú hálózatok (VITMMA02) OpenStack Neutron Networking

MTA Cloud a tudományos alkalmazások támogatására. Kacsuk Péter MTA SZTAKI

Cégbemutató, rövid áttekintés. Keszler Mátyás Territory Manager, Hungary

Agilis platform stratégiák IaaS, PaaS. Sárecz Lajos Principal Sales Consultant Oracle Hungary Kft november 22.

Kutatási fázis eredményei. Turi Péter

Cloud Computing a gyakorlatban. Szabó Gyula (GDF) Benczúr András (ELTE) Molnár Bálint (ELTE)

IVSZ adatközpont és felhő workshop. A kormányzati felhő kialakítása október 29. Gazdag Ferenc infrastruktúra főmérnök

Átírás:

Korszerű Adatbázisok Gombos Gergő

Elérhetőségek Email: ggombos@inf.elte.hu Szoba: 2-503 Honlap: http://ggombos.web.elte.hu

Tematika 1. Bevezetés: Virtualizáció, Cloud 2-3. XML XPath, XQuery 4. Szemantikus Web 5. NoSql adatbázisok (Neo4j) 6. NoSql adatbázisok (MongoDb) 7. NoSql adatbázisok (Redis) 8. Hadoop, HDFS, HBASE, MapReduce 9. Tudományos adatbázisok, Virtuális Obszervatóriumok 10. Spark (Batch) 11. Spark (Sql, Gráf, Stream)

Gyakorlati követelmények Minden témához tartozik egy házi feladat! Házi feladatokból szerzett pontok alapján számítódik a gyakorlati jegy. Érdemjegy határok: 50%- (2) 60%- (3) 75%- (4) 85%- (5)

Gyakorlati követelmények Házi feladatok: XML Szemantikus Web NoSql (Neo4J) NoSql (MongoDb) NoSql (Redis) Hadoop MapReduce Spark Batch

Megajánlott EA Vizsgajegy Rövid kérdések 15-20 perces kis ZH Minden téma utáni hét előadás idejében

Korszerű Adatbázisok Relációs adatbázisok korlátai Skálázhatóság Tárhely növelés = nagyobb szerver Gyorsaság Adat tárolás, Stream típusú adat Lekérdezések, más struktúrájú adatok (gráf, kulcs-érték) Adatfeldolgozás SQL, mindenre elég?

Korszerű Adatbázisok Skálázhatóság Osztott rendszerek, osztott tárolás Gyorsaság Stream feldolgozó rendszerek NoSql adatbázisok Adatfeldolgozás Új technikák: Osztott számítások, Mapreduce

Korszerű Adatbázisok Hatékonysági szempontból Felhőben tárolják Mi az a Felhő? Mi az a virtualizáció?

Szerver üzemeltetés A szervereken nincs minden erőforrás mindig használva. Egy szerver üzemeltetésének költségei: Karbantartás Hálózat Fizikai hely Hűtés Áram Katasztrófa megoldások 10

Mi a virtualizáció? A virtualizáció egy olyan technikai megoldás, ami lehetővé teszi a rendszer erőforrásainak felosztását több (esetleg eltérő) virtuális számítógépre. 11

VM teljesítmény multiplexálása Separate VM sizing VM multiplexing s 3 s 2 s 1 Multiplex VM-ek teljesítménye ugyanazon a fizikai szerveren Aggregáljuk a teljesítményeket. Kiszámoljuk a szükséges erőforrást az aggregált érték alapján. 12

Virtualizáció felhasználásával Csökkentett hardver-, áram-, helyköltségek Egy fizikai számítógépen akár több operációs rendszer (biztonsági szempontok sandbox - izoláció, átláthatóság, hibakeresés) Rugalmas infrastruktúra (egyszerűbb létrehozás/törlés/mozgatás/módosítás) 13

A Virtualizáció hátránya Ha a fizikai hardver sérül: a virtuális gépek leállhatnak szélsőséges esetben adatvesztés Túl sok virtuális gép fut, akkor harcolhatnak az erőforrásért 14

A Virtualizációról A különböző virtualizációs programok: szerver megoldások Magas rendelkezésre állás asztali megoldások könnyű kezelhetőség átlátható grafikus felület Fontos: Ismerni kell az alap hardvert nem érdemes több CPU-t / memóriát / tárhelyet kiosztani, mint ami rendelkezésre áll 15

Kezdetek Memória virtualizálás Először - Manchester-i egyetem Atlas Olyan rendszereknél, ahol kevés a memória Elhitetjük az alkalmazásokkal hogy több memóriánk van Ilyen pl.: swap partíció linuxon 16

Virtualizáció Típusai I. Erőforrás virtualizáció Operációs rendszerek végzik pl. processzor-ütemezés, virtuális memória elhitetik a programokkal, hogy több erőforrás áll rendelkezésre, mint valójában. 17

Virtualizáció Típusai II. Alkalmazás szintű virtualizáció A platformok közti átjárhatóságon a hangsúly, a cél,hogy különböző operációs rendszereken a program gond nélkül fusson. Elhitetik a programokkal, hogy másmilyen hardver van a számítógépben, mint ami ténylegesen adott. Pl. Java saját futtatókörnyezet, wine/cygwin 18

Virtualizáció Típusai III. Desktop virtualizáció Egy kliens segítségével a hálózaton keresztül lehet bejelentkezni a saját számítógépre, így megvan a felület, de a programok nem a helyi gépen futnak, csak a megjelenítés kerül át. Gyakorlatilag ez a távoli asztal (VNC, Microsoft - Remote Desktop Protocol = RDP) 19

Virtualizáció Típusai IV. Emuláció Az emuláció során a fizikai hardvertől teljesen különböző virtuális hardverelemeket lehet létrehozni A teljesítmény gyakran a natív futáshoz képest 20%-os veszteséget is eléri. pl. C64, Nintendo, Dos, Amiga emulátorok 20

Virtualizáció Típusai V. Platform virtualizáció Elvárás: A virtualizált operációs rendszer ugyanúgy fusson, mintha közvetlenül lenne feltelepítve, és kizárólagos hozzáférése lenne az erőforrásokhoz. Fajtái: Operációs rendszer szintű virtualizáció Type-2 hypervisor vagy hibrid esetleg hosted virtualizáció Bare-metal vagy Type-1 hypervisor 21

Platform Virtualizáció Operációs rendszer szintű virtualizáció Egy meglévő futtatunk több példányban közös kernel van lehetőség külön eszközök kialakítására a példányokon (saját hálózati interfész / memóriaterület / tárhely / felhasználói csoport) Teljes értékű operációs rendszer Pl.: Docker 22

Platform Virtualizáció Type-2 hypervisor vagy hibrid esetleg hosted virtualizáció Az operációs rendszer maga a Virtual Machine Manager kliens alapú megoldások pl. Sun Virtualbox, Microsoft Virtual PC, VMware Worksation/Player/Server. A hardverre közvetlenül telepítve van egy operációs rendszer (host OS), és efelett fut egy virtualizációs szoftver, ami futtatja a virtuális gépeket (guest OS) és a virtuális hardverkörnyezetet biztosítja. 23

Platform Virtualizáció Bare-metal vagy Type-1 hypervisor A Virtual Machine Manager az operációs rendszer és a hardver közé kerül. Amikor feltelepül az operációs rendszer, azzal együtt feltelepül a hypervisor speciális operációs rendszer kernel, ami virtuális hardverkörnyezetet biztosít Pl. Oracle VM, VMware ESX, Citrix XenServer és Microsoft Hyper-V. 24

VM-ek migrálása Migrálás: egy virtuális gép átmozgatása egy másik hardware-re Cold migration Gépet leállítjuk Átmásoljuk az új hostra Elindítjuk az új hoston Live migration A gépet leállítás nélkül másoljuk át az új hostra 25

Server virtualization approaches Virtualizációs megoldások 1 st Generation: Full virtualization (Binary rewriting) Software Based VMware and Microsoft Virtual Machine Virtual Machine Dynamic Translation Operating System 2 nd Generation: Paravirtualization Cooperative virtualization Modified guest VMware, Xen VM Hypervisor VM 3 rd Generation: Siliconbased (Hardwareassisted) virtualization Unmodified guest VMware and Xen on virtualization-aware hardware platforms Virtual Machine Hypervisor Virtual Machine Hardware Time Hardware Hardware Virtualization Logic 26

Felhők 27

Felhők NIST (National Institute of Standards) A számítási felhő (Cloud Computing) modell révén a felhasználók kényelmesen és igény szerint férhetnek hozzá a megosztott, beállítható informatikai erőforrásokhoz amelyeket gyorsan és minimális adminisztrációs megterhelés vagy szolgáltatói beavatkozás mellett rendelkezésre lehet bocsátani és fel lehet szabadítani. 28

Alap elvek A nem-kell-ismerni elv: nem kell ismernünk a felhő alatt lévő infrastruktúrát API-n keresztül érjük el Annyit-fizess-amennyit-használsz elv: Minden erőforrás használat mérhető Csak a tényleges erőforrás használatért kell fizetni 29

Alap tulajdonság Igény szerinti önkiszolgáló A felhasználó automatikusan igényelhet több erőforrást (számítási, tárolási) ha szükséges. Széles hálózati hozzáférés Az erőforrások vékony kliensen elérhetőek több platformon keresztül is. (mobil, pc, stb.) forrás: NIST Special Publication 800-145 30

Szolgáltatás modellek Software/ Application Platform Infrastructure 31

A Felhő rétegei Infrastructure as a Service IaaS Háttértárat és számítási kapacitást nyújt Gyakorlatilag a hardver szolgáltatásként való bérlése. Tartozhat hozzá dinamikus skálázhatóság, hogyha több/kevesebb erőforrásra lenne szükség Egyik legnagyobb szolgáltató: Amazon Elastic Compute Cloud (E2C) 32

A Felhő rétegei Platform as a Service PaaS Fejlesztői környezetet nyújt, aminek segítségével felhő-kész alkalmazásokat lehet létrehozni általában webes felületen. Bezár a felhőbe azokat az eszközöket kell használni, amit a felhő nyújt, az exportálás kizárásának lehetősége is előfordul -> Open PaaS Például a Google App Engine, Microsoft Azure 33

A Felhő rétegei Software as a Service SaaS Adott feladatra szánt alkalmazásokat nyújt Leggyakoribb alkalmazása a CRM (Customer Relationship Management ) rendszer Pl. salesforce, facebook, ebay, skype, paypal, youtube, wikipedia, twitter, Google, 34

35

Felhő típusok Eddig a Publikus Felhőről volt szó. Privát Felhő magasan virtualizált felhő-adatközpont, a (céges) tűzfalon belül jól menedzselhető környezettel a helyi informatikusok rendelkeznek a szolgáltatások és erőforrások kiosztása felett Hibrid Felhő a publikus és privát felhők vegyítése. Például hogyha egy vállalatnak tetszik az egyik szolgáltató SaaS alkalmazása, és azt szeretnék használni egy privát felhőben (biztonsági okokból), akkor kapnak hozzá egy VPN megoldást, így már megfelelő számukra a környezet. 36

Cloud vs Own Igény: 128 Server (1024 CPU mag), 524 TB háttértár M hónapra Cloud (AWS) Tárolás (S3) költségek: 0.12$ per GB Számítási (EC2) költségek: 0.10$ per CPU hour Teljes költség = tárolás + számítás =0.12*524*1000 + 0.10 *1024 * 24 * 30 ~ 136K $ / M Saját szerver Tárolás ~ 349K $ /M Teljes ~ 1555 K $ / M + 7.5K $ (1 admin/ 100 gépre) 37

Felhő számítási kockázatok Kockázatos területek Szolgáltatói Technikai, meghibásodási Külső (Overseas) Felügyeleti Biztonság / Elérési / Adatvédelmi 38

Adatközpont 39

Adatközpont 40

Adatközpont 41

Biztonságos adatközpont 42

Hűtés 43

Számok a nagyoknál (gépek száma) Facebook [GigaOm, 2012] 30K (2009), 60K (2010), 180K (2012) Microsoft [NYTimes, 2008] 150K (+10K / months) Yahoo! [2009] 100K AWS EC2 [Randy Bias, 2009] 40K ebay [2012] 50K HP [2012] 380K 44

Adatközpont mérőszámok Green Grid vezette be őket: PUE (Power usage Effectivness) = Total Facility Power / IT Equipment Energy Az épület fenntartása vs az adatközpont fenntartása. WUE (Water Usage Effectivness) = Water Usage / IT Equipment Energy (L/kWh) Mennyi vízre van szükség hogy hűteni tudjuk az adatközpontot. GPUE (Green Power Usage Effectivness) = G PUE G = Súlyozott energiaforrások (szén, víz, nap) 45

Felhő számítás és zöld IT Google datacenters 46

Új programozási pardigmák Google: MapReduce Indexelés: 24 job-ból álló lánc ~200K job dolgoz fel a 50PB havonta (2006) Facebook (Hadoop + Hive) 3K job dolgoz fel 55TB adatot naponta 47

Köszönöm a Figyelmet! Felhasznált források: https://www.coursera.org/course/cloudcomputing http://nvlpubs.nist.gov/nistpubs/legacy/sp/nistspecialpublication800-145.pdf http://cse.unl.edu/~ylu/csce896/notes/vm%20multiplex_weiyue.ppt https://hu.wikipedia.org/wiki/virtualiz%c3%a1ci%c3%b3_(egy%c3%a9rt elm%c5%b1s%c3%adt%c5%91_lap)