Hol tartunk? Párhuzamos és Grid rendszerek. Klaszterek története. Klaszter. TOP november. Klaszterek ma. Megismerkedtünk az alapfogalmakkal,

Hasonló dokumentumok
Párhuzamos és Grid rendszerek

Párhuzamos és Grid rendszerek. Hol tartunk? Klaszter. Megismerkedtünk az alapfogalmakkal,

Condor rendszer röviden. IKTA NI-2000/0008 munkaszkasz zárókonferencia

Hol tartunk? Párhuzamos és Grid rendszerek (3. ea) cluster rendszerek, hosszútávú ütemezők. Klaszterek története. Klaszter.

Az NIIF új szuperszámítógép infrastruktúrája Új lehetőségek a kutatói hálózatban

Processzusok (Processes), Szálak (Threads), Kommunikáció (IPC, Inter-Process Communication)

Az NIIF új szuperszámítógép infrastruktúrája Új lehet!ségek a kutatói hálózatban Debreceni Egyetem

Processzusok (Processes), Szálak (Threads), Kommunikáció (IPC, Inter-Process Communication)

Az MTA Cloud a tudományos alkalmazások támogatására. Kacsuk Péter MTA SZTAKI

NIIFI HPC Szolgáltatás

Építsünk szuperszámítógépet szabad szoftverből!

ClusterGrid infrastruktúra: Hogyan? Stefán Péter, Szalai Ferenc, Vitéz Gábor,

Számítógépes alapismeretek

Hozzáférés a HPC-hez, kezdő lépések (előadás és demó)

Live free() or die() Az openmosix cluster szoftver

Operációs rendszerek. Bemutatkozás

Informatikai Rendszerek Intézete Gábor Dénes Foiskola. Operációs rendszerek oldal LINUX

MTA Cloud Use cases MTA Cloud workshop. Hernáth Szabolcs MTA WIGNER FK

Példa: LHC, CERN, Genf Enabling Grids for E-sciencE

Magic xpi 4.0 vadonatúj Architektúrája Gigaspaces alapokon

Üzleti kritikus alkalmazások Novell Open Enterprise Serveren

Új tehetséggondozó programok és kutatások

Hogyan működtethető a telefonrendszer virtuális környezetben? Mészáros Tamás Műszaki fejlesztési vezető

TELJESÍTÉNYMÉRÉS FELHŐ ALAPÚ KÖRNYEZETBEN AZURE CLOUD ANALÍZIS

Enabling Grids for E-sciencE. Grid bevezető INFSO-RI

UNIX / Linux rendszeradminisztráció

Párhuzamos és Grid rendszerek

Párhuzamos és Grid rendszerek. Elosztott fájlrendszerek. AFS (Andrew File System) Nagyméretű klaszterekhez. Elosztott fájlrendszerek

Linux alapú hálózati infrastruktúra Open Enterprise Server 2. Hargitai Zsolt kereskedelemtámogatási vezető, Novell Kft.

Ellenőrzőpont támogatás PVM alkalmazások számára a magyar ClusterGriden

Bevezetés a párhuzamos programozási koncepciókba

EGI-InSPIRE. Café Grid március 24. Szeberényi Imre 3/25/ EGI-InSPIRE RI

Utolsó módosítás:

MMK-Informatikai projekt ellenőr képzés 4

NIIF Intézet szolgáltatásai 2. (alapszolgáltatások, szuperszámítástechnika) Marlok Tamás Sebők Tamás

Csoportos üzenetszórás optimalizálása klaszter rendszerekben

Miért jó nekünk kutatóknak a felhő? Kacsuk Péter MTA SZTAKI

Párhuzamos és Grid rendszerek

Data Integrátorok a gyakorlatban Oracle DI vs. Pentaho DI Fekszi Csaba Ügyvezető Vinnai Péter Adattárház fejlesztő február 20.

SUSE Linux Enterprise High Availability. Kovács Lajos Vezető konzultáns

Párhuzamos és Grid rendszerek

Worldwide LHC Computing Grid

Exadata, a világ leggyorsabb adatbázisgépe

Matematikai és Informatikai Intézet. 4. Folyamatok

Elosztott fájlrendszerek. Párhuzamos és Grid rendszerek. AFS (Andrew File System) AFS történelem Carnegie Mellon Egyetemen 1984-ben.

Párhuzamos programozási platformok

(kernel3d vizualizáció: kernel245_graph.mpg)

2011. November 8. Boscolo New York Palace Budapest. Extrém teljesítmény Oracle Exadata és Oracle Exalogic rendszerekkel

Virtualizációs Technológiák Bevezetés Kovács Ákos Forrás, BME-VIK Virtualizációs technológiák

Párhuzamos programozási platformok

Privát felhő megoldások és tapasztalatok

MTA Cloud a tudományos alkalmazások támogatására. Kacsuk Péter MTA SZTAKI

Virtualizáció. egy hardveren több virtuális rendszer működik egyszerre, virtuális gépekben futó önálló vendég (guest) operációs rendszerek formájában

Utolsó módosítás:

Ami az Intel szerint is konvergens architektúra

Párhuzamos és Grid rendszerek. Hol tartunk? Elosztott rendszerek reneszánsza. Megismerkedtünk az alapfogalmakkal,

Hol tartunk? Párhuzamos és Grid rendszerek. Grid koncepció. Elosztott rendszerek reneszánsza. Grid hasonlat. Klaszter

Párhuzamos és Grid rendszerek

GENERÁCIÓS ADATBÁZISOK A BIG DATA KÜLÖNBÖZŐ TERÜLETEIN

GRID AZ OKTATÁSBAN. Kápolnai Richárd, Németh Dénes, Dr. Szeberényi Imre,

A JGrid rendszer biztonsági architektúrája. Magyaródi Márk Juhász Zoltán Veszprémi Egyetem

A futtatás elıtt az alábbi két dolgot kell tenni:

Virtualizációs Technológiák Operációs rendszer szintű virtualizáció Konténerek Forrás, BME-VIK Virtualizációs technológiák

6.2. TMS320C64x és TMS320C67xx DSP használata

The Power To Develop. i Develop

PVM programok áthelyezése GRID környezetbe

Operációs rendszerek

Operációs rendszerek III.

univerzum Standard,Vanilla,PVM,MPI,Globus és Java. condor_shadow

Autóipari beágyazott rendszerek. Komponens és rendszer integráció

NIIF Központi Elosztott Szolgáltatói Platform

Párhuzamos és Grid rendszerek

Az informatika alapjai. 10. elıadás. Operációs rendszer

Párhuzamos és Grid rendszerek. Összefogalás. Jellemző szupersz.gép típusok. Párhuzamos architektúrák. Párh. prog. fejlesztési módszerek

Összefogalás. Párhuzamos és Grid rendszerek. Párhuzamos gépek osztályai. Jellemző szupersz.gép típusok. Flynn-féle architektúra modell

Adatbányászat és Perszonalizáció architektúra

LabView Academy. 4. óra párhuzamos programozás

Könyvtári szervervirtualizáció Oracle Virtual Machine platformon

Operációs rendszerek Folyamatok 1.1

Felhő rendszerek és felhő föderációk. Kacsuk Péter MTA SZTAKI

BIG DATA ÉS GÉPI TANULÁS KÖRNYEZET AZ MTA CLOUD-ON KACSUK PÉTER, NAGY ENIKŐ, PINTYE ISTVÁN, HAJNAL ÁKOS, LOVAS RÓBERT

Felhő alapú hálózatok Konténerek orkesztrálása Simon Csaba. Budapesti Műszaki és Gazdaságtudományi Egyetem

Párhuzamos és Grid rendszerek

P-GRADE fejlesztőkörnyezet és Jini alapú GRID integrálása PVM programok végrehajtásához. Rendszerterv. Sipos Gergely

Hálózatba kapcsolt erőforrás platformok és alkalmazásaik. Simon Csaba TMIT 2017

Feladatok (task) kezelése multiprogramozott operációs rendszerekben

Párhuzamos és Grid rendszerek

webalkalmazások fejlesztése elosztott alapon

Dr. Schuster György október 30.

OpenCL - The open standard for parallel programming of heterogeneous systems

Automatikus infrastruktúra menedzsment és alkalmazástelepítés

Nyíregyházi Egyetem Matematika és Informatika Intézete. Fájl rendszer

VMware. technológiával. ADATMENTÉS VMware környezetben IBM Tivoli eszközökkel

A ClusterGrid bróker rendszere. Stefán Péter Szalai Ferenc Vitéz Gábor

Private Cloud architektúra keretrendszer

A számítógép egységei

Ezeket a kiemelkedı sebességő számítógépeket nevezzük szuperszámítógépeknek.

Kommunikációs rendszerek teljesítőképesség-vizsgálata

Építsünk szuperszámítógépet szabad szoftverb l!

A felhőről általában. Kacsuk Péter MTA SZTAKI

Átírás:

Hol tartunk? Párhuzamos és Grid rendszerek (3. ea) cluster rendszerek, hosszútávú ütemezők zeberényi Imre BME IIT <szebi@iit.bme.hu> Megismerkedtünk az alapfogalmakkal, architektúrákkal. Egyszerű absztrakciós modellt alkottunk a párhuzamos gépek leírására. Megismertük a párhuzamos programok tervezésének egy módszerét (PCAM). M Ű E G Y E T E M 1 7 8 2-1 - - 2 - Klaszter Párhuzamos rendszerek fejlődésének egyik fontos állomása, amit ma több gyártó ismét elővett. közös állományrendszer laza szoros csatolás batch feldolgozás hosszútávú ütemezés Klaszterek története Kezdetek: szg. hálózatok megjelenése 60- as évek vége 70-es évek eleje. Igazi fejlődés a 70-es évek vége, 80-as évek eleje. (DEC, VAXcluster) elosztott, párhuzamos számítás megosztott fájlrendszer megosztott perifériák - 3 - - 4 - Klaszterek ma Nagy rendelkezésre állást biztosító klaszter Terheléskiegyenlítő klaszter zámítási klaszter házi: beowulf gyártóktól: TOP500 Grid klaszter grid site-ok Elosztott + redundáns adattárolás, big data Hadoop TOP 500 2012 november Csak 5. az első európai A 8. pedig kínai - 5 - - 6 -

Architektúra alakulása -7- -8- -9- - 10 - TOP 500 2012 november TOP 500 2012 november 84.4% legalább 6 magos, 46% pedig legalább 8 magos 100. helyen 243.9 Tflop/s az 500. helyen 76.5 Tflop/s 75.8% INTEL 12% AMD Opteron 10% IBM Power IBM 193 HP: 146 Cray: 31 45% InfiniBand (2x nagyobb telj. adnak) 37% Gigabit Ethernet Power eff.: 2450Mflops/watt- 90Mflops/watt Kínában 72 rendszer, Japánban 31 Angliában, Franciaországban, Németországban közel azonos: 24, 21, 19 Linux: 469, UNIX: 20, Windows: 3-11 - - 12 -

Myrinet 10G, réz v. üveg Gigabit Ethertnet 1G, réz v. üveg Infiniband 10-300 Gbit/s, réz NUMAlink 7.5G, réz Összeköttetések Fájlrendszerek NF (NF 1,2,3,4) (1985, un) V4-et kivéve állapotmentes AF (CMU) Kerberos, nagy cache, nagy cellaszám jól skálázható F (Lustre, un) objektum orientált jól skálázható - 13 - - 14 - Ütemezők Condor (Uni. of Wisconsin) DQ (Florida tate Uni) LoadLeveler (IBM) Maui, Moab (Cluster Resources) LF (Platform) PB, OpenPB (Alatair) un Grid Engne (UN) Torque (Cluster Resources) A Condor rendszer jellemzői peciális ütemező (batch) rendszer Elosztott, heterogén rendszerben működik. Alapvetően a szabad CPU ciklusok kihasználására tervezték. Képes egy működő feladatot áthelyezni az egyik gépről a másikra (migráció). Az ún. ClassAds mechanizmussal képes a rendszerben levő változó erőforrásokat az igényeknek megfelelően elosztani. Opportunista környezet. - 15 - - 16 - Condor pool Központi ütemező - 17 - ClassAds lényege A rendszerben levő erőforrások különböző jellemzőkkel (teljesítmény, architektúra, op. rendszer, stb.) rendelkeznek. A job összeállításánál ezekre a jellemzőkre igényeket lehet előírni, amit a Condor rendszer megpróbál kielégíteni. (Párosítja az igényt az erőforrással) A job összeállításánál lehetőség van preferenciák megadására, ami alapján a Condor rangsorolni fog és kiválasztja az igénynek leginkább megfelelő gépet. - 18 -

ClassAds lényege (2) Így nincs szükség a batch rendszerekben megszokott sorokra. (Úgyis a rosszat választanánk) Követelmény és rangsor Követelmény: Requirements = Arch=="UN4u Pontosan kell illeszkednie. Rangsor: Rank = Memory + Mips Ha választhat, akkor a nagyobbat fogja választani - 19 - - 20 - A dolgok két oldala (1) A kifejezések a két hirdetés adatterében értékelőd- nek ki (ada, adb). Felhasználó (igénylő) oldala: Requirements = Arch == "INTEL" && Opys == "LINUX" Rank = TARGET.Memory * 10 + TARGET.Disk + Mips Erőforrás oldal: A dolgok két oldala (2) Friend = Owner == "haver" Trusted = Owner!= "judas" Mygroup = Owner == "zoli" Owner == "jani" Requirements = Trusted && (Mygroup LoadAvg < 0.5 && KeyboardIdle > 10*60) Rank = Friend + MyGroup*10-21 - - 22 - Central Manager Execute Machine ubmit Machine Checkpoint erver Feladatkörök - 23 - Condor Pool = Process pawned Cluster Node Central Manager (Frieda s) = ClassAd Communication Pathway negotiator schedd collector Cluster Node Desktop schedd Desktop schedd - 24 -

Job indítás Condor flock chedd tartd tarter Condor job-ok personal your workstation Condor Condor Pool hadow Customer Job "Barát" Condor Pool ubmit Condor yscall Lib - 25 - - 26 - Milyen feladatok lehetnek? Elsősorban hosszú futási idejű, számításigényes feladatok. Különböző univerzumok léteznek tandard Vanilla MPI Grid Java cheduler Local Parallel VM tandard univerzum checkpointing, automatikus migráció meglevő programot újra kell fordítani, esetleg csak linkelni az alkalmazás nem használhat bizonyos rendszerhívásokat: pl. fork, socket, alarm, mmap ( elkapja a file műveleteket) - 27 - - 28 - Vanilla univerzum nincs checkpointing, nincs migráció meglevő futtatható kódot nem kell vátoztatni nincs korlátozás a rendszerhívásokkal szemben. NF, vagy AF kell!!!! PVM univerzum MW jellegű PVM programok környezete Binárisan kompatibilis PVM 3.4.2 + taszk kezeléshez kieg. Dinamikus VM kialakítás. Heterogén környezet támogatása Egy user csak egy példányban futathat deamont - 29 - - 30 -

Condor felépíti a virtuális gépet MPI univerzum PVM alkalmazás M Master pmvd lave pmvd MPICH változtatás nélkül. Bináris kompatibilitás Csak ch_p4 device Dinamikusan nem változhat Nem állhat meg. NF vagy AF kell. C #1 #2 #3 #4 #5 #6-31 - - 32 - Futtatás lépései A job összeállítása Job bejelentése a Condor-nak Job-ot a Condor futtatja az általa kiválasztott gép(eken), szükség esetén átmozgatja egy másik gépre. Job befejeződik, a Condor e-mail-t küld a felhasználónak. Egy egyszerű jobleíró universe = vanilla executable = mathematica input = in$(process).dat output = out$(process).dat queue 50-33 - - 34 - Egy másik jobleíró un Grid Engine (GE) universe = vanilla executable = /bin/hostname output = hostname.out.$(process) error = hostname.err.$(process) log = hostname.log queue 3 A Condor-hoz hasonló ütemező. Queue-kat definiál. Hangsúlyos a terhelés kiegyensúlyozása. Backup ütemező. Check-point. Migrálási lehetőség. Négy szerepkör:, submit, exec, admin, - 35 - - 36 -

GE komponensei - 37 -