MTA Cloud a tudományos alkalmazások támogatására. Kacsuk Péter MTA SZTAKI

Hasonló dokumentumok
Az MTA Cloud a tudományos alkalmazások támogatására. Kacsuk Péter MTA SZTAKI

A felhőről általában. Kacsuk Péter MTA SZTAKI

Miért jó nekünk kutatóknak a felhő? Kacsuk Péter MTA SZTAKI

Felhő rendszerek és felhő föderációk. Kacsuk Péter MTA SZTAKI

MTA Cloud Use cases MTA Cloud workshop. Hernáth Szabolcs MTA WIGNER FK

BIG DATA ÉS GÉPI TANULÁS KÖRNYEZET AZ MTA CLOUD-ON KACSUK PÉTER, NAGY ENIKŐ, PINTYE ISTVÁN, HAJNAL ÁKOS, LOVAS RÓBERT

alkalmazásfejlesztő környezete

GUSE BEMUTATÓ. Az MTA CLOUD felhasználói számára készült guse bemutató v2.0. MTA Cloud csapat

Párhuzamos és Grid rendszerek

EGI-InSPIRE. Café Grid március 24. Szeberényi Imre 3/25/ EGI-InSPIRE RI

Az MTA Cloud használatának alapismeretei (tutorial) Lovas Róbert MTA SZTAKI

TELJESÍTÉNYMÉRÉS FELHŐ ALAPÚ KÖRNYEZETBEN AZURE CLOUD ANALÍZIS

Bevezetés a párhuzamos programozási koncepciókba

Felhő-alapú technológiák az Ipar 4.0 szolgálatában (kibővített előadás az EOQ MNB fórumra)

Felhő alapú hálózatok Konténerek orkesztrálása Simon Csaba. Budapesti Műszaki és Gazdaságtudományi Egyetem

VIRTUALIZÁCIÓS TECHNOLÓGIÁK EUCALYPTUS CLOUD PLATFORM

Felhő demonstráció Gergely Márk MTA SZTAKI

FEM 2.5-D EGY GEOFIZIKAI RENDSZER MEGVALÓSÍTÁSA A GRID-

Esri Magyarország Felhasználói Konferencia Portal for ArcGIS. Kisréti Ákos

Adatbázis rendszerek 7. előadás State of the art

Cloud Akkreditációs Szolgáltatás indítása CLAKK projekt. Kozlovszky Miklós, Németh Zsolt, Lovas Róbert 9. LPDS MTA SZTAKI Tudományos nap

Bárányfelhő vagy viharfelhő? A felhő alapú megoldások biztonsági kérdései. Császár Rudolf Műszaki fejlesztési vezető Digital Kft.

Networkshop Kaposvár Balaskó Á., Kozlovszky M., Karóczkai K., Márton I., Kacsuk P. MTA SZTAKI

Windows Server 2012: a felhő OS

Hozzáférés a HPC-hez, kezdő lépések (előadás és demó)

Amazon Web Services. Géhberger Dániel Szolgáltatások és alkalmazások március 28.

A hibrid DB cloud biztonsági eszköztára. Kóródi Ferenc Budapest,

Kutatási fázis eredményei. Turi Péter

SUSE Container as a Service Platform Nagyvállalati Kubernetes. Papp Zsolt Konzultáns

JavaScript Web AppBuilder használata

Felhőszolgáltatások megvalósítása PureSystems eszközökön

Segesdi Dániel. OpenNebula. Virtualizációs technológiák és alkalmazásaik BMEVIMIAV ősz

Oracle Enterprise Manager: Az első teljesértékű felhő üzemeltetési megoldás

Kommunikációs rendszerek teljesítőképesség-vizsgálata

Felhőszámítástechnika (Cloud Computing) helye és szerepe az on-line világ folyamataiban. Dr. Élő Gábor Széchenyi István Egyetem ITOK 2013

Hadoop és használata az LPDS cloud-on

NIIF szolgáltatások a múzeumok számára

Processzusok (Processes), Szálak (Threads), Kommunikáció (IPC, Inter-Process Communication)

Webes alkalmazások fejlesztése Bevezetés. Célkitűzés, tematika, követelmények. A.NET Core keretrendszer

Dr. Schuster György október 30.

Webes alkalmazások fejlesztése Bevezetés. Célkitűzés, tematika, követelmények. A.NET Core keretrendszer

TECHNOLÓGIAI JÖVİKÉP. Felhınézetben. Tázló József mőszaki igazgató Cisco Systems Magyarország Cisco Systems, Inc. All rights reserved.

Párhuzamos és Grid rendszerek. Hol tartunk? Klaszter. Megismerkedtünk az alapfogalmakkal,

Konszolidáció és költségcsökkentés a gyakorlatban. Az Országos Tisztifőorvosi Hivatal Oracle adatbázis konszolidációja

Veeam Agent for Windows and Linux

ALKALMAZÁS MONITOROZÁS A MERCURY MONITORRAL A CLUSTERGRID INFRASTRUKTÚRÁN. Gombás Gábor, gombasg@sztaki.hu MTA SZTAKI

Korszerű Adatbázisok. Gombos Gergő

Big Data adattárházas szemmel. Arató Bence ügyvezető, BI Consulting

Virtualizációs Technológiák Felhő alapú rendszerek

Cloud computing. Cloud computing. Dr. Bakonyi Péter.

Cloud computing Dr. Bakonyi Péter.

Közösség, projektek, IDE

A Docker alapjai. Takács Ákos PTE Egyetemi Könyvtár és Tudásközpont TAKÁCS ÁKOS - IPSZILON SZEMINÁRIUM - A DOCKER ALAPJAI 1

BMD Rendszerkövetelmények

Robot Operating System

Mechatronika segédlet 6. gyakorlat

Webes alkalmazások fejlesztése

DAT adatcserefájl AutoCAD MAP DWG mapobject konvertáló program dokumentáció

IBM Informix on Cloud

A Java EE 5 plattform

Orvosi készülékekben használható modern fejlesztési technológiák lehetőségeinek vizsgálata

HAWK-3. Az OMSZ saját fejlesztésű időjárási megjelenítő rendszere

IT trendek és lehetőségek

Felhőalapú szolgáltatás, mint a vállalati innováció hajtóereje

Magic xpi 4.0 vadonatúj Architektúrája Gigaspaces alapokon

RHadoop. Kocsis Imre Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék

Számítási felhők (Cloud Computing)

Viczián István IP Systems JUM XIX szeptember 18.

Ellenőrzőpont támogatás PVM alkalmazások számára a magyar ClusterGriden

A DevOps-kultúra eszközei

Hálózati szolgáltatások OpenStack környezetben

Virtualizációs Technológiák Felhő alapú rendszerek

Papírzúzás, hiteles archiválás felhők segítségével. (edox Archiver)

Java I. A Java programozási nyelv

MTA SZTAKI - A Grid fejlesztők és felhasználók szolgálatában

Utolsó módosítás:

A telepítési útmutató tartalma

CancerGrid - Grid alkalmazása rákellenes hatóanyagok keresésének felgyorsítására

OpenCL alapú eszközök verifikációja és validációja a gyakorlatban

Composable Infrastruktúra

Budapest Sysadmin Meetup Failover Cluster 1x1. Gál Tamás. Cloud Infrastructure TSP Microsoft Magyarország

IBM SPSS Modeler 18.2 Újdonságok

Slamovits Tibor Államigazgatásiüzletág-vezető EMC Magyarország

OpenCL - The open standard for parallel programming of heterogeneous systems

Köszönjük, hogy a Conceptronic DVB-T USB-adaptert választotta.

A cloud szolgáltatási modell a közigazgatásban

Hogyan lettem Cloud Champion?

Párhuzamos programozási platformok

Webes alkalmazások fejlesztése 11. előadás. Alkalmazások felhőben Giachetta Roberto

IBM felhő menedzsment

Webes alkalmazások fejlesztése 11. előadás. Alkalmazások felhőben. Alkalmazások felhőben Számítástechnikai felhő

Muppet: Gyors adatok MapReduce stílusú feldolgozása. Muppet: MapReduce-Style Processing of Fast Data

Papp Attila. BI - mindenkinek

ÁSZF 1. melléklet. GST-Max Kereskedelmi és Szolgáltató Kft Budapest, Völgy utca 32/b. részéről

FELHŐ és a MAINFRAME. Irmes Sándor

Az MTA Cloud projekt MTA Cloud projektzáró június 28.

Felhők teljesítményelemzése felhő alapokon

Párhuzamos programozási platformok

Nagyméretű webes projektek a felhőben

Crossplatform mobil fejlesztőkörnyezet kiválasztását támogató kutatás

Átírás:

MTA Cloud a tudományos alkalmazások támogatására Kacsuk Péter MTA SZTAKI Kacsuk.Peter@sztaki.mta.hu

Az előadásban felhasznált anyagok Guilherme Galante et al.: An Analysis of Public Clouds Elasticity in the Execution of Scientific Applications: a Survey, Journal of Grid Computing, vol. 14, No. 2, 2016, pp. 193-216 o http://www.springer.com/computer/communication+networks/jo urnal/10723 EU FP7 CloudSME project: Cloud based Simulation platform for Manufacturing and Engineering o http://cloudsme.eu/ EU FP7 SCI-BUS project: SCIentific gateway Based User Support o http://www.sci-bus.eu/

A felhő szolgáltatások 3 szintje Példák SaaS Software as a Service Gmail, AutoDock PaaS Platform as a Service Google App Engine WS-PGRADE/gUSE IaaS Infrastructure as a Service Amazon EC2, Rackspace, CloudSigma, MTA Cloud, stb. 3

Tudományos alkalmazások és skálázhatóság Kétféle skálázhatóság: o Vertikális: dinamikusan változik a VM mérete (CPU core száma, memória, tároló) általában nem támogatott o Horizontális: a virtuális gépek száma dinamikusan változik ezt lehet különböző eszközökkel támogatni, ez egyfajta párhuzamos végrehajtást feltételez a felhőben Erről szól ez az előadás

A tudományos feldolgozások típikus esetei Cél: Nagy adatmennyiség feldolgozása 1. Egyszerű szekvenciális algoritmus végrehajtása 1. párhuzamosítás nélkül 2. HTC (high throughput computing) párhuzamosítással. Tipikus elnevezések: 1. lazán csatolt párhuzamosság 2. Parameter söprés (sweep) párhuzamosság 3. Embarrassly parallel párhuzamosság 2. HPC (high performance computing) algoritmus végrehajtása 1. MPI alkalmazás 2. OpenMP alkalmazás 3. Docker alkalmazás végrehajtása 1. párhuzamosítás nélkül 2. Párhuzamosítással docker klaszteren 4. Mapreduce/Hadoop alkalmazás végrehajtása 5. Pipeline alkalmazás végrehajtása 1. Egyedi adattal működő pipeline 2. Adat folyam (data stream) pipeline 6. Workflow alkalmazás (a fentiek kombinációja) végrehajtása

A tudományos feldolgozások típikus esetei 5.1 Egyedi pipeline: Seq MPI OpenMP 5.2 Adat folyam pipeline: Adat 3 Adat 2 Adat 1 Seq1 Seq2 Seq3 6. workflow alkalmazás: Seq1 MPI Open MP Seq2 MPI2

Felhőigények az egyes esetekben 1.1 Egyszerű szekvenciális algoritmus végrehajtása párhuzamosítás nélkül Igények és kielégítésük az MTA Felhőben: 1. Az alkalmazás méretétől függő Linux vagy Windows gép gyors létrehozása a felhőben Linux és Windows lemezképeket adunk, amikből a kívánt gépek indíthatóak Négyféle mérettel lehet ezeket elindítani (ld. Következő slide) További kiegészítő tároló (volume) csatlakoztatása a VM-hez Feldolgozandó adatok feltöltése a csatolt tárolóba 2. Szekvenciális alkalmazás telepítése a létrehozott gépen 3. A létrehozott gépről elérni a tárolót, ami a feldolgozandó adatot tárolja 4. Futtatni az alkalmazást a létrehozott gépen Tipikus IaaS alkalmazás, ld. demo és gyakorlat Ez az, amit ma megtanítunk használni

Az Openstack 5-féle VM alaptípust támogat Ezek közül a tiny-t nem támogatjuk, mert az túl kicsi.

1.2 Paraméter söprés (PS) alkalmazások végrehajtása HTC párhuzamosítással Input paraméter tér generálása GEN Programozására 2 lehetőség: 1. Az IaaS Cloud API felhasználásával a felhasználó programozza be (komoly fejlesztési munka) SEQ SEQ SEQ SEQ PS job (pl. Autodock) Paraméterezhető, hogy hány felhő processzoron fusson COLL Eredmények kiértékelése

1.2 Paraméter söprés (PS) alkalmazások végrehajtása HTC párhuzamosítással GEN 2. lehetőség: PaaS fejlesztő rendszer használata Input paraméter tér generálása SEQ SEQ SEQ SEQ PS job (pl. LP-solver) Paraméterezhető, hogy hány felhő processzoron fusson COLL WS-PGRADE/gUSE Eredmények kiértékelése

2.1 MPI alkalmazás végrehajtása Igények és kielégítésük az MTA Felhőben: 1. Az alkalmazás méretétől függő MPI futtató rendszert tartalmazó Linux vagy Windows gép gyors létrehozása a felhőben lemezképet adunk, amiből a kívánt gép indítható (ld. Demo) Négyféle mérettel lehet ezeket elindítani (small és medium ajánlott teszteléshez, large és xlarge ajánlott futtatáshoz) 2. MPI alkalmazás telepítése a létrehozott gépen vagy beküldése a gépre 3. A létrehozott gépről elérni a tárolót, ami a feldolgozandó adatot tárolja 4. Futtatni az alkalmazást a létrehozott gépen Ez már egy komplexebb IaaS alkalmazás, aminek a lemezképét később fogjuk közzé tenni az MTA Cloud web lapon

2.2 OpenMP alkalmazás végrehajtása Igények és kielégítésük az MTA Felhőben: 1. Nagyon hasonló az MPI-hoz Ez is egy komplexebb IaaS alkalmazás, aminek a támogatását később fogjuk közzé tenni az MTA Cloud web lapon

.1 Docker alkalmazás végrehajtása párhuzamosítás nélkül Igények és kielégítésük az MTA Felhőben: 1. Az alkalmazás méretétől függő, docker konténert tartalmazó Linux vagy Windows gép gyors létrehozása a felhőben Linux és Windows lemezképeket adunk, amikből a kívánt gépek indíthatóak Négyféle mérettel lehet ezeket elindítani 2. szekvenciális alkalmazás telepítése a docker konténerben 3. A docker konténerből elérni a tárolót, ami a feldolgozandó adatot tárolja 4. Futtatni az alkalmazást a létrehozott gépen Tipikus IaaS alkalmazás, ld. demo és gyakorlat Ez az, amit ma megtanítunk használni

3.1 Docker alkalmazás végrehajtása párhuzamosítással docker klaszteren Igények és kielégítésük az MTA Felhőben: 1. Az alkalmazás méretétől függő, docker klaszter létrehozása a felhőben A szükséges lemezképeket, Occopus szervízt és Occopus fájl leírókat adjuk 2. Docker alkalmazás telepítése a docker konténerben 3. A docker konténerből elérni a tárolót, ami a feldolgozandó adatot tárolja 4. Futtatni az alkalmazást a létrehozott docker klaszteren Komplex IaaS alkalmazás, ld. demo

Docker klaszter felépírése

Docker klaszter létrehozása a felhőben Occopus-szal Ld. demo 2 4 1 N O V A Occopus (docker kl. Leíró) 3 Docker Head 3 3 Docker Worker Docker Worker 1. lépés: Occopus VM indítása 2. lépés: Belépés az Occopus VM-re és a Docker Klaszter Leíróval az Occopus indítása 3. lépés: Occopus automatikusan létrehozza a Docker Klasztert a felhőben 4. lépés: Belépés a Docker Klaszterbe és használata

4. Mapreduce/Hadoop alkalmazás végrehajtása Igények és kielégítésük az MTA Felhőben: 1. Az alkalmazás méretétől függő Hadoop klaszter létrehozása a felhőben Verzió 1: WS-PGRADE-ben workflow-ként definiálva (EGI FedCloudon megy, de MTA Cloud-ra még adaptálni kell) Verzió 2: Occopus segítségével (fejlesztés alatt) 2. mapreduce alkalmazás végrehajtása a létrehozott Hadoop klaszteren Verzió 1: WS-PGRADE-ben workflow-ként definiálva Verzió 2: Occopus segítségével Tipikus PaaS alkalmazás

Mapreduce/Hadoop alkalmazás végrehajtása WS-PGRADE/gUSE segítségével

5.1 Egyedi pipeline alkalmazás végrehajtása Két opció: o IaaS API segítségével a felhasználó programozza be o PaaS eszköz segítségével (pl. WS-PGRADE/gUSE) 1. Opció: IaaS API használata Igények és kielégítésük az MTA Felhőben: 1. Az alkalmazás méretétől függő Linux vagy Windows gépek gyors létrehozása a felhőben 2. Ezeket a pipeline sorrendnek megfelelően egymás felé láthatóvá és elérhetővé kell tenni 3. szekvenciális alkalmazás telepítése a létrehozott gépeken 4. A létrehozott gépekről elérni a tároló(ka)t, ami(k) a feldolgozandó adatot tárolja(ják) 5. Futtatni az alkalmazást a létrehozott gépeken Tipikus komplex IaaS alkalmazás -> érdemes Occopus-t használni

5.1 Egyedi pipeline alkalmazás végrehajtása 2. Opció o PaaS eszköz segítségével (WS-PGRADE/gUSE) Igények és kielégítésük az MTA Felhőben WS-PGRADE/gUSE esetén: 1. Az alkalmazás pipeline definiálása, mint workflow 2. Az alkalmazást a bemenő adatokkal beküldeni a felhőbe Tipikus PaaS alkalmazás -> érdemes WS-PGRADE/gUSE-t használni Például a korábban látott mapreduce/hadoop alkalmazás ilyen pipeline workflow-ként is használható a WS-PGRADE/gUSE-ban

Mapreduce/Hadoop alkalmazás végrehajtása WS-PGRADE/gUSE segítségével

5.2 Adat folyam pipeline alkalmazás végrehajtása Két opció: o IaaS API segítségével a felhasználó programozza be o PaaS eszköz segítségével (Flowbster, ami Occopus-ra épül) 1. Opció: IaaS API használata Igények és kielégítésük az MTA Felhőben: 1. Az alkalmazás méretétől függő Linux vagy Windows gépek gyors létrehozása a felhőben 2. Ezeket a pipeline sorrendnek megfelelően egymás felé láthatóvá és elérhetővé kell tenni 3. szekvenciális alkalmazás telepítése a létrehozott gépeken 4. Átfolyatni az adatokat a létrehozott pipeline-ba kapcsolt gépeken Tipikus komplex IaaS alkalmazás -> érdemes Occopus-t használni

5.2 Adat folyam pipeline alkalmazás végrehajtása 2. opció: o PaaS eszköz segítségével (Flowbster, ami Occopus-ra épül)

Flowbster koncepció one_file two_file B out_file Feeder one_file two_file A out_file one_file two_file D out_file Gather one_file two_file C out_file Adattároló Flowbster alkalmazás leíró réteg Adattároló Flowbster workflow rendszer réteg Occopus réteg MTA Cloud

5.2 Adat folyam pipeline alkalmazás végrehajtása 2. opció: o PaaS eszköz segítségével (Flowbster, ami Occopus-ra épül) Igények és kielégítésük az MTA Felhőben Flowbster esetén: 1. Flowbster (pipeline) node-ok és kapcsolatuk definiálása a Flowbster alkalmazás leíró réteg segítségével. Két opció: 1. Szövegesen Occopusnak megfelelő fájl leíró nyelven (Occopus tudást igényel) 2. Grafikusan (semmilyen előismeret nem kell hozzá) fejlesztés alatt 2. szekvenciális alkalmazások definiálása a pipeline node-ok számára (Flowbster node-ok konfigurálása) 3. Szükséges virtuális gépek indítása a felhőben és összekapcsolásuk a Flowbster definició szerint Occopus végzi el 4. Átfolyatni az adatokat a létrehozott pipeline-ba kapcsolt gépeken

6. Workflow alkalmazás végrehajtása Seq1 MPI Open MP Seq2 MPI2

6. Workflow alkalmazás végrehajtása Két opció: o IaaS API segítségével a felhasználó programozza be o PaaS eszköz segítségével (WS-PGRADE/gUSE) 1. Opció: IaaS API használata Igények és kielégítésük az MTA Felhőben: 1. Az alkalmazás méretétől függő Linux vagy Windows gépek gyors létrehozása a felhőben 2. Ezeket a workflow sorrendnek megfelelően egymás felé láthatóvá és elérhetővé kell tenni 3. szekvenciális alkalmazás telepítése a létrehozott gépeken 4. A létrehozott gépekről elérni a tároló(ka)t, ami(k) a feldolgozandó adatot tárolja(ják) 5. Futtatni az alkalmazást a létrehozott gépeken Tipikus komplex IaaS alkalmazás -> érdemes Occopus-t használni

6. Workflow alkalmazás végrehajtása 2. opció: o PaaS eszköz segítségével (WS-PGRADE/gUSE) Igények és kielégítésük az MTA Felhőben WS-PGRADE/gUSE esetén: 1. Az alkalmazás definiálása, mint workflow 2. Az alkalmazást a bemenő adatokkal beküldeni a felhőbe Tipikus PaaS alkalmazás -> érdemes WS-PGRADE/gUSE-t használni

WS-PGRADE workflow Irányított aciklikus gráf, ahol o A node-ok job-okat, szervízeket, vagy beágyazott workflow-t reprezentálnak o A port-ok input/output fájlokat reprezentálnak o Az élek a node-ok közötti adatmozgatást és függőséget reprezentálják Workflow szemantika: o Egy node tüzelhet, azaz a hozzátartozó job végrehajtódhat, ha minden input fájl megérkezett

Három szintű párhuzamosság Multiple instances of the same workflow with different data files Parallel execution inside a workflow node Parallel execution among workflow nodes Parameter study execution of the workflow Multiple jobs run parallel Each job can be a parallel program

Paraméter söprés (PS) párhuzamosítás GEN Input paraméter tér generálása PS job (pl. beágyazott workflow) Paraméterezhető, hogy hány felhő processzoron fusson SEQ SEQ SEQ SEQ Eredmények kiértékelése COLL WS-PGRADE/gUSE

WS-PGRADE/gUSE használata A sok-felhő rendszerre az alkalmazások fejlesztését és futtatását támogatja Ennek segítségével különböző tudományterületekre specializált SaaS szolgáltatásokat lehet kifejleszteni (pl. Autodock gateway kémiai és gyógyszerkutatási alkalmazásokhoz) Felhasználása európai projektekben: Több mint 30 projekt használja EGI FedCloud DRIHM meteorológiai és vízgazdálkodási alkalmazások VERCE földtudományok CloudSME vállalati és gyártástechnológiai szimulációk

Konklúzió A standard OpenStack IaaS támogatás készen áll, július 1-től béta verzióban elérhető a szolgáltatás Bonyolultabb IaaS VM szerkezetek (pl. docker klaszter, pipeline, stb.) létrehozásához érdemes az Occopus szolgáltatást használni, ami július 1-től béta verzióban elérhető szolgáltatás Magasabb szintű alkalmazásokhoz érdemes PaaS eszközöket alkalmazni: o WS-PGRADE/gUSE: sokféle felhővel megy már, de az MTA Felhőhöz még adaptálni kell (várhatóan az októberi átadásra menni fog) o Flowbster: parancssoros verzió rendelkezésre áll, a grafikus verzió várhatóan az októberi átadásra menni fog