Párhuzamos és Grid rendszerek

Hasonló dokumentumok
Párhuzamos és Grid rendszerek. Hol tartunk? Klaszter. Megismerkedtünk az alapfogalmakkal,

Hol tartunk? Párhuzamos és Grid rendszerek. Klaszterek története. Klaszter. TOP november. Klaszterek ma. Megismerkedtünk az alapfogalmakkal,

Condor rendszer röviden. IKTA NI-2000/0008 munkaszkasz zárókonferencia

Hol tartunk? Párhuzamos és Grid rendszerek (3. ea) cluster rendszerek, hosszútávú ütemezők. Klaszterek története. Klaszter.

Az NIIF új szuperszámítógép infrastruktúrája Új lehetőségek a kutatói hálózatban

Processzusok (Processes), Szálak (Threads), Kommunikáció (IPC, Inter-Process Communication)

Processzusok (Processes), Szálak (Threads), Kommunikáció (IPC, Inter-Process Communication)

Az NIIF új szuperszámítógép infrastruktúrája Új lehet!ségek a kutatói hálózatban Debreceni Egyetem

Az MTA Cloud a tudományos alkalmazások támogatására. Kacsuk Péter MTA SZTAKI

ClusterGrid infrastruktúra: Hogyan? Stefán Péter, Szalai Ferenc, Vitéz Gábor,

Hozzáférés a HPC-hez, kezdő lépések (előadás és demó)

Építsünk szuperszámítógépet szabad szoftverből!

Párhuzamos és Grid rendszerek

Párhuzamos és Grid rendszerek. Elosztott fájlrendszerek. AFS (Andrew File System) Nagyméretű klaszterekhez. Elosztott fájlrendszerek

NIIFI HPC Szolgáltatás

Elosztott fájlrendszerek. Párhuzamos és Grid rendszerek. AFS (Andrew File System) AFS történelem Carnegie Mellon Egyetemen 1984-ben.

Számítógépes alapismeretek

Magic xpi 4.0 vadonatúj Architektúrája Gigaspaces alapokon

UNIX / Linux rendszeradminisztráció

Live free() or die() Az openmosix cluster szoftver

Operációs rendszerek. Bemutatkozás

Informatikai Rendszerek Intézete Gábor Dénes Foiskola. Operációs rendszerek oldal LINUX

GRID AZ OKTATÁSBAN. Kápolnai Richárd, Németh Dénes, Dr. Szeberényi Imre,

Üzleti kritikus alkalmazások Novell Open Enterprise Serveren

Párhuzamos és Grid rendszerek

Párhuzamos és Grid rendszerek. Összefogalás. Jellemző szupersz.gép típusok. Párhuzamos architektúrák. Párh. prog. fejlesztési módszerek

Összefogalás. Párhuzamos és Grid rendszerek. Párhuzamos gépek osztályai. Jellemző szupersz.gép típusok. Flynn-féle architektúra modell

Privát felhő megoldások és tapasztalatok

TELJESÍTÉNYMÉRÉS FELHŐ ALAPÚ KÖRNYEZETBEN AZURE CLOUD ANALÍZIS

Hogyan működtethető a telefonrendszer virtuális környezetben? Mészáros Tamás Műszaki fejlesztési vezető

Új tehetséggondozó programok és kutatások

MTA Cloud Use cases MTA Cloud workshop. Hernáth Szabolcs MTA WIGNER FK

Párhuzamos és Grid rendszerek

Matematikai és Informatikai Intézet. 4. Folyamatok

NIIF Központi Elosztott Szolgáltatói Platform

Utolsó módosítás:

EGI-InSPIRE. Café Grid március 24. Szeberényi Imre 3/25/ EGI-InSPIRE RI

Linux alapú hálózati infrastruktúra Open Enterprise Server 2. Hargitai Zsolt kereskedelemtámogatási vezető, Novell Kft.

Bevezetés a párhuzamos programozási koncepciókba

Párhuzamos és Grid rendszerek

MMK-Informatikai projekt ellenőr képzés 4

Virtualizáció. egy hardveren több virtuális rendszer működik egyszerre, virtuális gépekben futó önálló vendég (guest) operációs rendszerek formájában

Párhuzamos és Grid rendszerek

Példa: LHC, CERN, Genf Enabling Grids for E-sciencE

Párhuzamos és Grid rendszerek. Hol tartunk? Elosztott rendszerek reneszánsza. Megismerkedtünk az alapfogalmakkal,

Hol tartunk? Párhuzamos és Grid rendszerek. Grid koncepció. Elosztott rendszerek reneszánsza. Grid hasonlat. Klaszter

Data Integrátorok a gyakorlatban Oracle DI vs. Pentaho DI Fekszi Csaba Ügyvezető Vinnai Péter Adattárház fejlesztő február 20.

Utolsó módosítás:

SUSE Linux Enterprise High Availability. Kovács Lajos Vezető konzultáns

NetWare 6 technikai áttekintés 2. rész

Virtualizációs Technológiák Bevezetés Kovács Ákos Forrás, BME-VIK Virtualizációs technológiák

Ellenőrzőpont támogatás PVM alkalmazások számára a magyar ClusterGriden

A ClusterGrid bróker rendszere. Stefán Péter Szalai Ferenc Vitéz Gábor

2011. November 8. Boscolo New York Palace Budapest. Extrém teljesítmény Oracle Exadata és Oracle Exalogic rendszerekkel

PVM programok áthelyezése GRID környezetbe

Enabling Grids for E-sciencE. Grid bevezető INFSO-RI

NIIF Intézet szolgáltatásai 2. (alapszolgáltatások, szuperszámítástechnika) Marlok Tamás Sebők Tamás

Miért jó nekünk kutatóknak a felhő? Kacsuk Péter MTA SZTAKI

Csoportos üzenetszórás optimalizálása klaszter rendszerekben

Az informatika alapjai. 10. elıadás. Operációs rendszer

6.2. TMS320C64x és TMS320C67xx DSP használata

Párhuzamos és Grid rendszerek

Exadata, a világ leggyorsabb adatbázisgépe

Párhuzamos programozási platformok

A JGrid rendszer biztonsági architektúrája. Magyaródi Márk Juhász Zoltán Veszprémi Egyetem

Párhuzamos és Grid rendszerek

Virtualizációs Technológiák Operációs rendszer szintű virtualizáció Konténerek Forrás, BME-VIK Virtualizációs technológiák

Párhuzamos programozási platformok

(kernel3d vizualizáció: kernel245_graph.mpg)

The Power To Develop. i Develop

MTA Cloud a tudományos alkalmazások támogatására. Kacsuk Péter MTA SZTAKI

Operációs rendszerek III.

Operációs rendszerek Folyamatok 1.1

Tarantella Secure Global Desktop Enterprise Edition

P-GRADE fejlesztőkörnyezet és Jini alapú GRID integrálása PVM programok végrehajtásához. Rendszerterv. Sipos Gergely

Worldwide LHC Computing Grid

Ami az Intel szerint is konvergens architektúra

LabView Academy. 4. óra párhuzamos programozás

GENERÁCIÓS ADATBÁZISOK A BIG DATA KÜLÖNBÖZŐ TERÜLETEIN

Ezeket a kiemelkedı sebességő számítógépeket nevezzük szuperszámítógépeknek.

Adatbányászat és Perszonalizáció architektúra

BIG DATA ÉS GÉPI TANULÁS KÖRNYEZET AZ MTA CLOUD-ON KACSUK PÉTER, NAGY ENIKŐ, PINTYE ISTVÁN, HAJNAL ÁKOS, LOVAS RÓBERT

univerzum Standard,Vanilla,PVM,MPI,Globus és Java. condor_shadow

Könyvtári szervervirtualizáció Oracle Virtual Machine platformon

Felhő rendszerek és felhő föderációk. Kacsuk Péter MTA SZTAKI

A 21. század adatközpontja Oracle Solaris alapon

Digitális rendszerek. Digitális logika szintje

Nyíregyházi Egyetem Matematika és Informatika Intézete. Fájl rendszer

Feladatok (task) kezelése multiprogramozott operációs rendszerekben

A futtatás elıtt az alábbi két dolgot kell tenni:

Adatintenzív alkalmazások grid-es környezetben

Operációs rendszerek

Diskless klaszter a meglévő gépeinkre

Építsünk szuperszámítógépet szabad szoftverb l!

Autóipari beágyazott rendszerek. Komponens és rendszer integráció

webalkalmazások fejlesztése elosztott alapon

VMware. technológiával. ADATMENTÉS VMware környezetben IBM Tivoli eszközökkel

OpenCL - The open standard for parallel programming of heterogeneous systems

SAM-Insights ADVANCED CENTRAL DATA COLLECTOR (ACDC) Szkenneléssel nem mérhető licencelési adatok. Egyedülálló funkcionalitású, új ACDC modul

Felhő alapú hálózatok Konténerek orkesztrálása Simon Csaba. Budapesti Műszaki és Gazdaságtudományi Egyetem

Átírás:

Párhuzamos és Grid rendszerek (3. ea) cluster rendszerek, hosszútávú ütemezők Szeberényi Imre BME IIT <szebi@iit.bme.hu> M Ű E G Y E T E M 1 7 8 2 Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 1 -

Hol tartunk? Megismerkedtünk az alapfogalmakkal, architektúrákkal. Egyszerű absztrakciós modellt alkottunk a párhuzamos gépek leírására. Megismertük a párhuzamos programok tervezésének egy módszerét (PCAM). Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 2 -

Klaszter Párhuzamos rendszerek fejlődésének egyik fontos állomása, amit ma több gyártó ismét elővett. közös állományrendszer laza szoros csatolás batch feldolgozás hosszútávú ütemezés Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 3 -

Klaszterek története Kezdetek: szg. hálózatok megjelenése 60- as évek vége 70-es évek eleje. Igazi fejlődés a 70-es évek vége, 80-as évek eleje. (DEC, VAXcluster) elosztott, párhuzamos számítás megosztott fájlrendszer megosztott perifériák Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 4 -

Klaszterek ma Nagy rendelkezésre állást biztosító klaszter Terheléskiegyenlítő klaszter Számítási klaszter házi: beowulf gyártóktól: TOP500 Grid klaszter grid site-ok Elosztott + redundáns adattárolás, big data Hadoop Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 5 -

TOP 500 2012 november Csak 5. az első európai A 8. pedig kínai Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 6 -

Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 7 -

Architektúra alakulása Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 8 -

Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 9 -

Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 10 -

TOP 500 2012 november 84.4% legalább 6 magos, 46% pedig legalább 8 magos 100. helyen 243.9 Tflop/s az 500. helyen 76.5 Tflop/s 75.8% INTEL 12% AMD Opteron 10% IBM Power IBM 193 HP: 146 Cray: 31 Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 11 -

TOP 500 2012 november 45% InfiniBand (2x nagyobb telj. adnak) 37% Gigabit Ethernet Power eff.: 2450Mflops/watt- 90Mflops/watt Kínában 72 rendszer, Japánban 31 Angliában, Franciaországban, Németországban közel azonos: 24, 21, 19 Linux: 469, UNIX: 20, Windows: 3 Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 12 -

Összeköttetések Myrinet 10G, réz v. üveg Gigabit Ethertnet 1G, réz v. üveg Infiniband 10-300 Gbit/s, réz NUMAlink 7.5G, réz Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 13 -

Fájlrendszerek NFS (NFS 1,2,3,4) (1985, Sun) V4-et kivéve állapotmentes AFS (CMU) Kerberos, nagy cache, nagy cellaszám jól skálázható SFS (Lustre, Sun) objektum orientált jól skálázható Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 14 -

Ütemezők Condor (Uni. of Wisconsin) DQS (Florida State Uni) LoadLeveler (IBM) Maui, Moab (Cluster Resources) LSF (Platform) PBS, OpenPBS (Alatair) Sun Grid Engne (SUN) Torque (Cluster Resources) Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 15 -

A Condor rendszer jellemzői Speciális ütemező (batch) rendszer Elosztott, heterogén rendszerben működik. Alapvetően a szabad CPU ciklusok kihasználására tervezték. Képes egy működő feladatot áthelyezni az egyik gépről a másikra (migráció). Az ún. ClassAds mechanizmussal képes a rendszerben levő változó erőforrásokat az igényeknek megfelelően elosztani. Opportunista környezet. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 16 -

Condor pool Központi ütemező Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 17 -

ClassAds lényege A rendszerben levő erőforrások különböző jellemzőkkel (teljesítmény, architektúra, op. rendszer, stb.) rendelkeznek. A job összeállításánál ezekre a jellemzőkre igényeket lehet előírni, amit a Condor rendszer megpróbál kielégíteni. (Párosítja az igényt az erőforrással) A job összeállításánál lehetőség van preferenciák megadására, ami alapján a Condor rangsorolni fog és kiválasztja az igénynek leginkább megfelelő gépet. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 18 -

ClassAds lényege (2) Így nincs szükség a batch rendszerekben megszokott sorokra. (Úgyis a rosszat választanánk) Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 19 -

Követelmény és rangsor Követelmény: Requirements = Arch=="SUN4u Pontosan kell illeszkednie. Rangsor: Rank = Memory + Mips Ha választhat, akkor a nagyobbat fogja választani Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 20 -

A dolgok két oldala (1) A kifejezések a két hirdetés adatterében értékelőd- nek ki (ada, adb). Felhasználó (igénylő) oldala: Requirements = Arch == "INTEL" && OpSys == "LINUX" Rank = TARGET.Memory * 10 + TARGET.Disk + Mips Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 21 -

A dolgok két oldala (2) Erőforrás oldal: Friend = Owner == "haver" Trusted = Owner!= "judas" Mygroup = Owner == "zoli" Owner == "jani" Requirements = Trusted && (Mygroup LoadAvg < 0.5 && KeyboardIdle > 10*60) Rank = Friend + MyGroup*10 Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 22 -

Feladatkörök Central Manager Execute Machine Submit Machine Checkpoint Server Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 23 -

Condor Pool = Process Spawned Cluster Node Central Manager (Frieda s) = ClassAd Communication master Pathway master startd startd negotiator schedd collector Cluster Node master startd Desktop master startd schedd Desktop master startd schedd Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 24 -

Job indítás Schedd Startd Starter Shadow Customer Job Submit Condor Syscall Lib Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 25 -

Condor flock Condor job-ok personal your workstation Condor Condor Pool "Barát" Condor Pool Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 26 -

Milyen feladatok lehetnek? Elsősorban hosszú futási idejű, számításigényes feladatok. Különböző univerzumok léteznek Standard Vanilla MPI Grid Java Scheduler Local Parallel VM Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 27 -

Standard univerzum checkpointing, automatikus migráció meglevő programot újra kell fordítani, esetleg csak linkelni az alkalmazás nem használhat bizonyos rendszerhívásokat: pl. fork, socket, alarm, mmap ( elkapja a file műveleteket) Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 28 -

Vanilla univerzum nincs checkpointing, nincs migráció meglevő futtatható kódot nem kell vátoztatni nincs korlátozás a rendszerhívásokkal szemben. NFS, vagy AFS kell!!!! Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 29 -

PVM univerzum MW jellegű PVM programok környezete Binárisan kompatibilis PVM 3.4.2 + taszk kezeléshez kieg. Dinamikus VM kialakítás. Heterogén környezet támogatása Egy user csak egy példányban futathat deamont Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 30 -

Condor felépíti a virtuális gépet Master pmvd PVM alkalmazás M Slave pmvd S S S S S C #1 #2 #3 #4 #5 #6 Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 31 -

MPI univerzum MPICH változtatás nélkül. Bináris kompatibilitás Csak ch_p4 device Dinamikusan nem változhat Nem állhat meg. NFS vagy AFS kell. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 32 -

Futtatás lépései A job összeállítása Job bejelentése a Condor-nak Job-ot a Condor futtatja az általa kiválasztott gép(eken), szükség esetén átmozgatja egy másik gépre. Job befejeződik, a Condor e-mail-t küld a felhasználónak. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 33 -

Egy egyszerű jobleíró universe = vanilla executable = mathematica input = in$(process).dat output = out$(process).dat queue 50 Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 34 -

Egy másik jobleíró universe = vanilla executable = /bin/hostname output = hostname.out.$(process) error = hostname.err.$(process) log = hostname.log queue 3 Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 35 -

Sun Grid Engine (SGE) A Condor-hoz hasonló ütemező. Queue-kat definiál. Hangsúlyos a terhelés kiegyensúlyozása. Backup master ütemező. Check-point. Migrálási lehetőség. Négy szerepkör: master, submit, exec, admin, Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 36 -

SGE komponensei Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 37 -