Az MTA Cloud a tudományos alkalmazások támogatására. Kacsuk Péter MTA SZTAKI

Hasonló dokumentumok
MTA Cloud a tudományos alkalmazások támogatására. Kacsuk Péter MTA SZTAKI

A felhőről általában. Kacsuk Péter MTA SZTAKI

BIG DATA ÉS GÉPI TANULÁS KÖRNYEZET AZ MTA CLOUD-ON KACSUK PÉTER, NAGY ENIKŐ, PINTYE ISTVÁN, HAJNAL ÁKOS, LOVAS RÓBERT

MTA Cloud Use cases MTA Cloud workshop. Hernáth Szabolcs MTA WIGNER FK

Miért jó nekünk kutatóknak a felhő? Kacsuk Péter MTA SZTAKI

alkalmazásfejlesztő környezete

Felhő rendszerek és felhő föderációk. Kacsuk Péter MTA SZTAKI

Bevezetés a párhuzamos programozási koncepciókba

Az MTA Cloud használatának alapismeretei (tutorial) Lovas Róbert MTA SZTAKI

TELJESÍTÉNYMÉRÉS FELHŐ ALAPÚ KÖRNYEZETBEN AZURE CLOUD ANALÍZIS

Felhő alapú hálózatok Konténerek orkesztrálása Simon Csaba. Budapesti Műszaki és Gazdaságtudományi Egyetem

Felhő demonstráció Gergely Márk MTA SZTAKI

GUSE BEMUTATÓ. Az MTA CLOUD felhasználói számára készült guse bemutató v2.0. MTA Cloud csapat

Felhő-alapú technológiák az Ipar 4.0 szolgálatában (kibővített előadás az EOQ MNB fórumra)

Hozzáférés a HPC-hez, kezdő lépések (előadás és demó)

FEM 2.5-D EGY GEOFIZIKAI RENDSZER MEGVALÓSÍTÁSA A GRID-

Cloud Akkreditációs Szolgáltatás indítása CLAKK projekt. Kozlovszky Miklós, Németh Zsolt, Lovas Róbert 9. LPDS MTA SZTAKI Tudományos nap

Felhőszolgáltatások megvalósítása PureSystems eszközökön

Webes alkalmazások fejlesztése Bevezetés. Célkitűzés, tematika, követelmények. A.NET Core keretrendszer

Webes alkalmazások fejlesztése Bevezetés. Célkitűzés, tematika, követelmények. A.NET Core keretrendszer

Párhuzamos és Grid rendszerek. Hol tartunk? Klaszter. Megismerkedtünk az alapfogalmakkal,

Párhuzamos és Grid rendszerek

Processzusok (Processes), Szálak (Threads), Kommunikáció (IPC, Inter-Process Communication)

Segesdi Dániel. OpenNebula. Virtualizációs technológiák és alkalmazásaik BMEVIMIAV ősz

A hibrid DB cloud biztonsági eszköztára. Kóródi Ferenc Budapest,

Robot Operating System

VIRTUALIZÁCIÓS TECHNOLÓGIÁK EUCALYPTUS CLOUD PLATFORM

SUSE Container as a Service Platform Nagyvállalati Kubernetes. Papp Zsolt Konzultáns

Windows Server 2012: a felhő OS

Orvosi készülékekben használható modern fejlesztési technológiák lehetőségeinek vizsgálata

Oracle Enterprise Manager: Az első teljesértékű felhő üzemeltetési megoldás

Muppet: Gyors adatok MapReduce stílusú feldolgozása. Muppet: MapReduce-Style Processing of Fast Data

Mechatronika segédlet 6. gyakorlat

Amazon Web Services. Géhberger Dániel Szolgáltatások és alkalmazások március 28.

Budapest Sysadmin Meetup Failover Cluster 1x1. Gál Tamás. Cloud Infrastructure TSP Microsoft Magyarország

Az MTA Cloud projekt MTA Cloud projektzáró június 28.

EGI-InSPIRE. Café Grid március 24. Szeberényi Imre 3/25/ EGI-InSPIRE RI

Programozási technológia 2.

Szoftver technológia. Continuous integration & delivery. Cserép Máté ELTE Informatikai Kar 2019.

Hadoop és használata az LPDS cloud-on

OpenCL alapú eszközök verifikációja és validációja a gyakorlatban

Dr. Schuster György október 30.

Integrációs mellékhatások és gyógymódok a felhőben. Géczy Viktor Üzletfejlesztési igazgató

OpenCL - The open standard for parallel programming of heterogeneous systems

Cloud computing. Cloud computing. Dr. Bakonyi Péter.

RHadoop. Kocsis Imre Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék

NIIF Központi Elosztott Szolgáltatói Platform

Cloud computing Dr. Bakonyi Péter.

JavaScript Web AppBuilder használata

Veeam Agent for Windows and Linux

A Java EE 5 plattform

DAT adatcserefájl AutoCAD MAP DWG mapobject konvertáló program dokumentáció

Multimédiás adatbázisok

Párhuzamos programozási platformok

HAWK-3. Az OMSZ saját fejlesztésű időjárási megjelenítő rendszere

Big Data adattárházas szemmel. Arató Bence ügyvezető, BI Consulting

FELHŐ és a MAINFRAME. Irmes Sándor

UMN Mapserver és a Grass használata a Geológiában. Soós Dániel, Phd. Hallgató Miskolci Egyetem Geodéziai és Bányaméréstani Intézeti Tanszék

Oktatási cloud használata

Utolsó módosítás:

NIIF szolgáltatások a múzeumok számára

Operációs rendszerek. 9. gyakorlat. Reguláris kifejezések - alapok, BASH UNIVERSITAS SCIENTIARUM SZEGEDIENSIS UNIVERSITY OF SZEGED

Párhuzamos programozási platformok

Utolsó módosítás:

MMK-Informatikai projekt ellenőr képzés 4

Webes alkalmazások fejlesztése

Cloud Computing a gyakorlatban. Szabó Gyula (GDF) Benczúr András (ELTE) Molnár Bálint (ELTE)

A telepítési útmutató tartalma

Java-s Nyomtatványkitöltő Program Súgó

IBM Informix on Cloud

P-GRADE fejlesztőkörnyezet és Jini alapú GRID integrálása PVM programok végrehajtásához. Rendszerterv. Sipos Gergely

Előszó A Windows alkalmazásfejlesztés rövid története A Windows életútja A Windows 8 paradigmaváltása... 16

Operációs rendszerek. 9. gyakorlat. BASH recap, reguláris kifejezések UNIVERSITAS SCIENTIARUM SZEGEDIENSIS UNIVERSITY OF SZEGED

Image Processor BarCode Service. Felhasználói és üzemeltetői kézikönyv

Adatbázis rendszerek 7. előadás State of the art

Ellenőrzőpont támogatás PVM alkalmazások számára a magyar ClusterGriden

Konszolidáció és költségcsökkentés a gyakorlatban. Az Országos Tisztifőorvosi Hivatal Oracle adatbázis konszolidációja

Networkshop Kaposvár Balaskó Á., Kozlovszky M., Karóczkai K., Márton I., Kacsuk P. MTA SZTAKI

ALKALMAZÁS MONITOROZÁS A MERCURY MONITORRAL A CLUSTERGRID INFRASTRUKTÚRÁN. Gombás Gábor, gombasg@sztaki.hu MTA SZTAKI

Hardver összetevők ellenőrzése Linux alatt. Hardverguruk előnyben...

A Docker alapjai. Takács Ákos PTE Egyetemi Könyvtár és Tudásközpont TAKÁCS ÁKOS - IPSZILON SZEMINÁRIUM - A DOCKER ALAPJAI 1

A DevOps-kultúra eszközei

Mobil Partner telepítési és használati útmutató

Esri Magyarország Felhasználói Konferencia Portal for ArcGIS. Kisréti Ákos

Operációs rendszerek. UNIX fájlrendszer

BMD Rendszerkövetelmények

A GeoEasy telepítése. Tartalomjegyzék. Hardver, szoftver igények. GeoEasy telepítése. GeoEasy V2.05 Geodéziai Feldolgozó Program

Java I. A Java programozási nyelv

Bárányfelhő vagy viharfelhő? A felhő alapú megoldások biztonsági kérdései. Császár Rudolf Műszaki fejlesztési vezető Digital Kft.

WebService tesztelés. SOAPui Pro, GreenPepper és Confluence használatával. Verhás & Verhás Szoftver Manufaktúra KNOW-HOW

A GeoEasy telepítése. Tartalomjegyzék. Hardver, szoftver igények. GeoEasy telepítése. GeoEasy V2.05+ Geodéziai Feldolgozó Program

Magyar Nemzeti Bank FELHASZNÁLÓI SEGÉDLET

Virtualizációs technológiák és alkalmazások. Házi feladat. A Virtualbox. készítette: Andrus Tamás

GDi Esri Magyarország Felhasználói Konferencia Timár Gábor: Konkurens adatfeldolgozás ArcGIS rendszerben

Selling Platform Telepítési útmutató Gyakori hibák és megoldások

A perzisztens adatkezelő rendszer tesztelése és demonstrálása a GRID környezetben

Könyvtári kölcsönzések kezelése

SAT probléma kielégíthetőségének vizsgálata. masszív parallel. mesterséges neurális hálózat alkalmazásával

Folyamatok rugalmas irányítása. FourCorm Kft.

A cloud szolgáltatási modell a közigazgatásban

Átírás:

Az MTA Cloud a tudományos alkalmazások támogatására Kacsuk Péter MTA SZTAKI Kacsuk.Peter@sztaki.mta.hu

Tudományos alkalmazások és skálázhatóság Kétféle skálázhatóság: o Vertikális: dinamikusan változik a VM mérete (CPU core száma, memória, tároló) általában nem támogatott o Horizontális: a virtuális gépek száma dinamikusan változik ezt lehet különböző eszközökkel támogatni, ez egyfajta párhuzamos végrehajtást feltételez a felhőben Erről szól ez az előadás

A tudományos feldolgozások típikus esetei Egyszerű (1 lépésből álló) alkalmazások: 1. Egyszerű szekvenciális algoritmus végrehajtása 1. párhuzamosítás nélkül 2. HTC (high throughput computing) párhuzamosítással. Tipikus elnevezések: 1. lazán csatolt párhuzamosság 2. Parameter sweep párhuzamosság 3. Embarrassly parallel párhuzamosság 2. HPC (high performance computing) algoritmus végrehajtása 1. MPI alkalmazás 2. OpenMP alkalmazás MPI Open MP Seq Seq

A tudományos feldolgozások típikus esetei Összetett (több lépésből álló) alkalmazások: 1. Docker alkalmazás végrehajtása 1. Párhuzamosítás nélkül 2. Párhuzamosítással docker klaszteren Master 2. PBS (Condor, stb.) klaszteren futó alkalmazások 3. Mapreduce alkalmazás végrehajtása Hadoop klaszteren Worker Worker 4. Pipeline alkalmazás végrehajtása 1. Egyedi adattal működő pipeline 2. Adat folyam (data stream) pipeline 5. Workflow alkalmazás (a fentiek kombinációja) végrehajtása

A tudományos feldolgozások típikus esetei 5.1 Egyedi pipeline: Seq MPI OpenMP 5.2 Adat folyam pipeline: Adat 3 Adat 2 Adat 1 Seq1 Seq2 Seq3 6. workflow alkalmazás: Seq1 MPI Open MP Seq2 MPI2

Felhőigények az egyes esetekben 1.1 Egyszerű szekvenciális algoritmus végrehajtása párhuzamosítás nélkül Igények és kielégítésük az MTA Felhőben: 1. Az alkalmazás méretétől függő Linux vagy Windows gép gyors létrehozása a felhőben Linux és Windows lemezképeket adunk, amikből a kívánt gépek indíthatóak Négyféle mérettel lehet ezeket elindítani (ld. Következő slide) További kiegészítő tároló (volume) csatlakoztatása a VM-hez Feldolgozandó adatok feltöltése a csatolt tárolóba 2. Szekvenciális alkalmazás telepítése a létrehozott gépen 3. A létrehozott gépről elérni a tárolót, ami a feldolgozandó adatot tárolja 4. Futtatni az alkalmazást a létrehozott gépen

Az Openstack 5-féle VM alaptípust támogat Ezek közül a tiny-t nem támogatjuk, mert az túl kicsi.

Paraméter sweep (PS) alkalmazások végrehajtása HTC párhuzamosítással Input paraméter tér generálása GEN Programozására 2 lehetőség: 1. Az IaaS Cloud API felhasználásával a felhasználó programozza be (komoly fejlesztési munka) SEQ SEQ SEQ SEQ PS job (pl. Autodock) Paraméterezhető, hogy hány VM-en fusson COLL Eredmények kiértékelése

Paraméter sweep (PS) alkalmazások végrehajtása HTC párhuzamosítással GEN 2. lehetőség: PaaS fejlesztő rendszer használata Input paraméter tér generálása SEQ SEQ SEQ SEQ PS job (pl. LP-solver) Paraméterezhető, hogy hány VM-en fusson COLL WS-PGRADE/gUSE Eredmények kiértékelése

2.1 MPI alkalmazás végrehajtása Igények és kielégítésük az MTA Felhőben: 1. Az alkalmazás méretétől függő MPI futtató rendszert tartalmazó Linux vagy Windows gép gyors létrehozása a felhőben lemezképet adunk, amiből a kívánt gép indítható Négyféle mérettel lehet ezeket elindítani (small és medium ajánlott teszteléshez, large és xlarge ajánlott futtatáshoz) 2. MPI alkalmazás telepítése a létrehozott gépen vagy beküldése a gépre 3. A létrehozott gépről elérni a tárolót, ami a feldolgozandó adatot tárolja 4. Futtatni az alkalmazást a létrehozott gépen Ez már egy komplexebb IaaS alkalmazás, aminek a lemezképét később fogjuk közzé tenni az MTA Cloud web lapon

2.2 OpenMP alkalmazás végrehajtása Igények és kielégítésük az MTA Felhőben: 1. Nagyon hasonló az MPI-hoz Ez is egy komplexebb IaaS alkalmazás, aminek a támogatását később fogjuk közzé tenni az MTA Cloud web lapon

.1 Docker alkalmazás végrehajtása párhuzamosítás nélkül Igények és kielégítésük az MTA Felhőben: 1. Az alkalmazás méretétől függő, docker konténert tartalmazó Linux vagy Windows gép gyors létrehozása a felhőben Linux és Windows lemezképeket adunk, amikből a kívánt gépek indíthatóak Négyféle mérettel lehet ezeket elindítani 2. szekvenciális alkalmazás telepítése a docker konténerben 3. A docker konténerből elérni a tárolót, ami a feldolgozandó adatot tárolja 4. Futtatni az alkalmazást a létrehozott gépen

3.1 Docker alkalmazás végrehajtása párhuzamosítással docker klaszteren Igények és kielégítésük az MTA Felhőben: 1. Az alkalmazás méretétől függő, docker klaszter létrehozása a felhőben A szükséges lemezképeket, Occopus szervízt és Occopus fájl leírókat adjuk. Ld.: http://occopus.lpds.sztaki.hu/tutorials;jsessionid=0f6d68daa0463 9B99D039D6FBE9F2A6B 2. Belépés a Docker klaszter master node-ra és a Docker alkalmazás telepítése docker konténerben 3. A docker konténerből elérni a tárolót, ami a feldolgozandó adatot tárolja 4. Futtatni az alkalmazást a létrehozott docker klaszteren

Docker klaszter létrehozása a felhőben Occopus-szal 2 4 1 N O V A Occopus (docker kl. Leíró) 3 Docker Head 3 3 Docker Worker Docker Worker 1. lépés: Occopus VM indítása 2. lépés: Belépés az Occopus VM-re és a Docker Klaszter Leíróval az Occopus indítása 3. lépés: Occopus automatikusan létrehozza a Docker Klasztert a felhőben 4. lépés: Belépés a Docker Klaszterbe és használata

Skálázható docker klaszter felépítése

Mapreduce/Hadoop alkalmazás végrehajtása Ld. Nagy Enikő előadásában

5.1 Egyedi pipeline alkalmazás végrehajtása Két opció: o IaaS API segítségével a felhasználó programozza be o PaaS eszköz segítségével (pl. WS-PGRADE/gUSE) 1. Az alkalmazás pipeline definiálása, mint workflow 2. Az alkalmazást a bemenő adatokkal beküldeni a felhőbe 5.1 Egyedi pipeline: Seq MPI OpenMP

5.2 Adat folyam pipeline alkalmazás végrehajtása Két opció: o IaaS API segítségével a felhasználó programozza be o PaaS eszköz segítségével (Flowbster, ami Occopus-ra épül) 1. Flowbster (pipeline) node-ok és kapcsolatuk definiálása a Flowbster alkalmazás leíró réteg segítségével. Két opció: 1. Szövegesen Occopusnak megfelelő fájl leíró nyelven (Occopus tudást igényel) 2. Grafikusan (semmilyen előismeret nem kell hozzá) fejlesztés alatt 2. szekvenciális alkalmazások definiálása a pipeline node-ok számára (Flowbster node-ok konfigurálása) 3. Szükséges virtuális gépek indítása a felhőben és összekapcsolásuk a Flowbster definició szerint Occopus végzi el 4. Átfolyatni az adatokat a létrehozott pipeline-ba kapcsolt gépeken

Flowbster koncepció one_file two_file B out_file Feeder one_file two_file A out_file one_file two_file D out_file Gather one_file two_file C out_file Adattároló Flowbster alkalmazás leíró réteg Adattároló Flowbster workflow rendszer réteg Occopus réteg MTA Cloud

6. Workflow alkalmazás végrehajtása Seq1 MPI Open MP Seq2 MPI2

6. Workflow alkalmazás végrehajtása Két opció: o IaaS API segítségével a felhasználó programozza be o PaaS eszköz segítségével (WS-PGRADE/gUSE) 1. Az alkalmazás definiálása, mint WS-PGRADE workflow 2. Az alkalmazást a bemenő adatokkal beküldeni a felhőbe

WS-PGRADE workflow Irányított aciklikus gráf, ahol o A node-ok job-okat, szervízeket, vagy beágyazott workflow-t reprezentálnak o A port-ok input/output fájlokat reprezentálnak o Az élek a node-ok közötti adatmozgatást és függőséget reprezentálják Workflow szemantika: o Egy node tüzelhet, azaz a hozzátartozó job végrehajtódhat, ha minden input fájl megérkezett

Három szintű párhuzamosság Multiple instances of the same workflow with different data files Parallel execution inside a workflow node Parallel execution among workflow nodes Parameter study execution of the workflow Multiple jobs run parallel Each job can be a parallel program

Konklúzió A standard OpenStack IaaS támogatás készen áll, október 1-től elérhető a kész szolgáltatás Bonyolultabb IaaS VM szerkezetek (pl. docker klaszter, pipeline, stb.) létrehozásához érdemes az Occopus szolgáltatást használni Magasabb szintű alkalmazásokhoz érdemes PaaS eszközöket alkalmazni: o WS-PGRADE/gUSE: sokféle felhővel megy már, így az MTA Clouddal is o Flowbster: a prototípus rendelkezésre áll A Flowbster kivételével minden felsorolt és bemutatott eszköz elérhető és használható az MTA Cloudon