Párhuzamos és Grid rendszerek. Hol tartunk? Klaszter. Megismerkedtünk az alapfogalmakkal,



Hasonló dokumentumok
Párhuzamos és Grid rendszerek

Hol tartunk? Párhuzamos és Grid rendszerek. Klaszterek története. Klaszter. TOP november. Klaszterek ma. Megismerkedtünk az alapfogalmakkal,

Condor rendszer röviden. IKTA NI-2000/0008 munkaszkasz zárókonferencia

Hol tartunk? Párhuzamos és Grid rendszerek (3. ea) cluster rendszerek, hosszútávú ütemezők. Klaszterek története. Klaszter.

ClusterGrid infrastruktúra: Hogyan? Stefán Péter, Szalai Ferenc, Vitéz Gábor,

Az informatika alapjai. 10. elıadás. Operációs rendszer

Az NIIF új szuperszámítógép infrastruktúrája Új lehetőségek a kutatói hálózatban

P-GRADE fejlesztőkörnyezet és Jini alapú GRID integrálása PVM programok végrehajtásához. Rendszerterv. Sipos Gergely

Üzleti kritikus alkalmazások Novell Open Enterprise Serveren

Számítógépes alapismeretek

Az NIIF új szuperszámítógép infrastruktúrája Új lehet!ségek a kutatói hálózatban Debreceni Egyetem

Új tehetséggondozó programok és kutatások

Az MTA Cloud a tudományos alkalmazások támogatására. Kacsuk Péter MTA SZTAKI

NetWare 6 technikai áttekintés 2. rész

DB2 Connect Personal Edition telepítése és beállítása

Ami az Intel szerint is konvergens architektúra

Párhuzamos és Grid rendszerek

Párhuzamos és Grid rendszerek. Elosztott fájlrendszerek. AFS (Andrew File System) Nagyméretű klaszterekhez. Elosztott fájlrendszerek

Építsünk szuperszámítógépet szabad szoftverből!

Hozzáférés a HPC-hez, kezdő lépések (előadás és demó)

Adatintenzív alkalmazások grid-es környezetben

Elosztott fájlrendszerek. Párhuzamos és Grid rendszerek. AFS (Andrew File System) AFS történelem Carnegie Mellon Egyetemen 1984-ben.

Computer Setup. Felhasználói útmutató

Privát felhő megoldások és tapasztalatok

Digitális bemenetek: 2 darab 0-5V jelszintű digitális bemenet Pl. nyitásérzékelők, risztóközpontok, mozgásérzékelők, átjelzők, stb.

NIIFI HPC Szolgáltatás

Párhuzamos és Grid rendszerek

Párhuzamos és Grid rendszerek. Összefogalás. Jellemző szupersz.gép típusok. Párhuzamos architektúrák. Párh. prog. fejlesztési módszerek

Összefogalás. Párhuzamos és Grid rendszerek. Párhuzamos gépek osztályai. Jellemző szupersz.gép típusok. Flynn-féle architektúra modell

Tarantella Secure Global Desktop Enterprise Edition

Java felhasználói felület

Programozás alapjai C nyelv 5. gyakorlat. Írjunk ki fordítva! Írjunk ki fordítva! (3)

Osztott alkalmazások fejlesztési technológiái Áttekintés

Oracle Database Appliance

Digitális Technika I. (VEMIVI1112D)

Ezeket a kiemelkedı sebességő számítógépeket nevezzük szuperszámítógépeknek.

eseményvezérelt megoldások Vizuális programozás 5. előadás

VLIW processzorok (Működési elvük, jellemzőik, előnyeik, hátrányaik, kereskedelmi rendszerek)

SAM-Insights ADVANCED CENTRAL DATA COLLECTOR (ACDC) Szkenneléssel nem mérhető licencelési adatok. Egyedülálló funkcionalitású, új ACDC modul

Processzusok (Processes), Szálak (Threads), Kommunikáció (IPC, Inter-Process Communication)

2011. November 8. Boscolo New York Palace Budapest. Extrém teljesítmény Oracle Exadata és Oracle Exalogic rendszerekkel

IBM Tivoli Endpoint Manager

TANÚSÍTVÁNY KARBANTARTÁS Jegyzıkönyv

SAP vállalatirányítási rendszer alapjai

IBM Power 550 Express szerver

Synology DiskStation DS216play 2-lemezes NAS (2 1,5 GHz CPU, 1 GB

Bevitel-Kivitel. Eddig a számítógép agyáról volt szó. Szükség van eszközökre. Processzusok, memória, stb

Linux alapú hálózati infrastruktúra Open Enterprise Server 2. Hargitai Zsolt kereskedelemtámogatási vezető, Novell Kft.

Digitális Technika I. (VEMIVI1112D)

NetIQ imanager Telepítési útmutató január

TANÚSÍTVÁNY. tanúsítja, hogy a Polysys Kft. által kifejlesztett és forgalmazott

III. "JÖVŐ INTERNET" TECHNOLÓGIÁK: ELOSZTOTT ÉS FELHŐ SZOLGÁLTATÁSOK, TÁRGYAK INTERNETE DR. SIMON GYULA

GRID AZ OKTATÁSBAN. Kápolnai Richárd, Németh Dénes, Dr. Szeberényi Imre,

<Insert Picture Here> Cloud, Oracle tervezett célrendszerek, Exadata Database Machine adatbázisgép Fekete Zoltán, Principal sales consultant

VMware. technológiával. ADATMENTÉS VMware környezetben IBM Tivoli eszközökkel

Operációs rendszerek. 3. előadás Ütemezés

Tartalom. Történeti áttekintés. Történeti áttekintés Architektúra DCOM vs CORBA. Szoftvertechnológia

Építsünk szuperszámítógépet szabad szoftverb l!

Informatikai Rendszerek Intézete Gábor Dénes Foiskola. Operációs rendszerek oldal LINUX

ALKALMAZÁS MONITOROZÁS A MERCURY MONITORRAL A CLUSTERGRID INFRASTRUKTÚRÁN. Gombás Gábor, gombasg@sztaki.hu MTA SZTAKI

Ismétlés: Moore törvény. Tranzisztorok mérőszáma: n*százmillió, n*milliárd.

Diskless klaszter a meglévő gépeinkre

Processzusok (Processes), Szálak (Threads), Kommunikáció (IPC, Inter-Process Communication)

MTA Cloud a tudományos alkalmazások támogatására. Kacsuk Péter MTA SZTAKI

Exadata, a világ leggyorsabb adatbázisgépe

Intelligens Érzékelők

NIIF Központi Elosztott Szolgáltatói Platform

Fájl rendszer. Fájl koncepció Elérési módok Könyvtár szerkezet Védelem Konzisztencia szemantika

Párhuzamos és Elosztott Rendszerek

SZÁMÍTÓGÉPES ARCHITEKTÚRÁK A STRUKTURÁLT SZÁMÍTÓGÉP-FELÉPÍTÉS. Misák Sándor. 2. előadás DE TTK

Fejlesztői szemmel at K

Models are not right or wrong; they are more or less useful.

OPERÁCIÓS RENDSZEREK. Célkitűzések, tárgyfelépítés. Módszerek. OS fogalom, struktúrák. 2005/2006. tanév II. félév Dr. Vadász Dénes

Tájékoztató. Használható segédeszköz: -

TI TMDSEVM6472 rövid bemutatása

.NET Microsoft.Net Framework

A mai program OPERÁCIÓS RENDSZEREK. A probléma. Fogalmak. Mit várunk el? Tágítjuk a problémát: ütemezési szintek

NIIF Intézet szolgáltatásai 2. (alapszolgáltatások, szuperszámítástechnika) Marlok Tamás Sebők Tamás

Az Ön kézikönyve HP COMPAQ DC5700 MICROTOWER PC

Szeged Megyei Jogú Város Smart City Jövőképe

A Számítógépek hardver elemei

Intel Celeron G550 Intel HD Graphics kártyával (2,6 GHz, 2 MB gyorsítótár, 2 mag)

PVM programok áthelyezése GRID környezetbe

BME-Ipar. Win-Win. Intelligens környezetek és e-technológiák. Dr. Charaf Hassan Fókuszban a Műegyetem és az ipar kapcsolata

Non-stop hozzáférés az üzleti információkhoz bárhol, bármikor és bármilyen eszközzel

SQL Server High Availability. Bevezetés az SQL Server magas rendelkezésre állási megoldásaiba

Informatikai biztonság, IT infrastruktúra

Big Data tömeges adatelemzés gyorsan

Magic xpi 4.0 vadonatúj Architektúrája Gigaspaces alapokon

Erőforráskezelő (resource manager)

UNIX / Linux rendszeradminisztráció

Virtualizációs Technológiák Bevezetés Kovács Ákos Forrás, BME-VIK Virtualizációs technológiák

Közbeszerzési Értesítő száma: 2015/133

1.1. Általános áttekintés

Az Energia Biztonsága. Sirius series. UPS kva egy / egy és három / egy fázis kva és kva három / három fázis.

Operációs rendszerek. A Windows NT felépítése

BWA Broadband Wireless Access - szélessávú vezetéknélküli hozzáférés

Campus6 projekt megbeszélés Mohácsi János

Költségcsökkentés a Production Imaging and Capture alkalmazással

Informatika 11. el adás: Hardver

Átírás:

Párhuzamos és Grid rendszerek (3. ea) cluster rendszerek, hosszútávú ütemezők Szeberényi Imre BME IIT <szebi@iit.bme.hu> M Ű E G Y E T E M 1 7 8 2 Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 1 - Hol tartunk? Megismerkedtünk az alapfogalmakkal, architektúrákkal. Egyszerű absztrakciós modellt alkottunk a párhuzamos gépek leírására. Megismertük a párhuzamos programok tervezésének egy módszerét (PCAM). Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 2 - Klaszter Párhuzamos rendszerek fejlődésének egyik fontos állomása, amit ma több gyártó ismét elővett. közös állományrendszer laza szoros csatolás batch feldolgozás hosszútávú ütemezés Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 3 -

Klaszterek története Kezdetek: szg. hálózatok megjelenése 60- as évek vége 70-es évek eleje. Igazi fejlődés a 70-es évek vége, 80-as évek eleje. (DEC, VAXcluster) elosztott, párhuzamos számítás megosztott fájlrendszer megosztott perifériák Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 4 - Klaszterek ma Nagy rendelkezésre állást biztosító klaszter Terheléskiegyenlítő klaszter Számítási klaszter házi: beowulf gyártóktól: TOP500 Grid klaszter grid site-ok Elosztott + redundáns adattárolás, big data Hadoop Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 5 - TOP 500 2012 november Csak 5. az első európai A 8. pedig kínai Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 6 -

Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. -7- Architektúra alakulása Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. -8- Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. -9-

Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 10 - TOP 500 2012 november 84.4% legalább 6 magos, 46% pedig legalább 8 magos 100. helyen 243.9 Tflop/s az 500. helyen 76.5 Tflop/s 75.8% INTEL 12% AMD Opteron 10% IBM Power IBM 193 HP: 146 Cray: 31 Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 11 - TOP 500 2012 november 45% InfiniBand (2x nagyobb telj. adnak) 37% Gigabit Ethernet Power eff.: 2450Mflops/watt- 90Mflops/watt Kínában 72 rendszer, Japánban 31 Angliában, Franciaországban, Németországban közel azonos: 24, 21, 19 Linux: 469, UNIX: 20, Windows: 3 Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 12 -

Myrinet 10G, réz v. üveg Gigabit Ethertnet 1G, réz v. üveg Infiniband 10-300 Gbit/s, réz NUMAlink 7.5G, réz Összeköttetések Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 13 - Fájlrendszerek NFS (NFS 1,2,3,4) (1985, Sun) V4-et kivéve állapotmentes AFS (CMU) Kerberos, nagy cache, nagy cellaszám jól skálázható SFS (Lustre, Sun) objektum orientált jól skálázható Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 14 - Ütemezők Condor (Uni. of Wisconsin) DQS (Florida State Uni) LoadLeveler (IBM) Maui, Moab (Cluster Resources) LSF (Platform) PBS, OpenPBS (Alatair) Sun Grid Engne (SUN) Torque (Cluster Resources) Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 15 -

A Condor rendszer jellemzői Speciális ütemező (batch) rendszer Elosztott, heterogén rendszerben működik. Alapvetően a szabad CPU ciklusok kihasználására tervezték. Képes egy működő feladatot áthelyezni az egyik gépről a másikra (migráció). Az ún. ClassAds mechanizmussal képes a rendszerben levő változó erőforrásokat az igényeknek megfelelően elosztani. Opportunista környezet. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 16 - Condor pool Központi ütemező Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 17 - ClassAds lényege A rendszerben levő erőforrások különböző jellemzőkkel (teljesítmény, architektúra, op. rendszer, stb.) rendelkeznek. A job összeállításánál ezekre a jellemzőkre igényeket lehet előírni, amit a Condor rendszer megpróbál kielégíteni. (Párosítja az igényt az erőforrással) A job összeállításánál lehetőség van preferenciák megadására, ami alapján a Condor rangsorolni fog és kiválasztja az igénynek leginkább megfelelő gépet. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 18 -

ClassAds lényege (2) Így nincs szükség a batch rendszerekben megszokott sorokra. (Úgyis a rosszat választanánk) Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 19 - Követelmény: Követelmény és rangsor Requirements = Arch=="SUN4u Pontosan kell illeszkednie. Rangsor: Rank = Memory + Mips Ha választhat, akkor a nagyobbat fogja választani Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 20 - A dolgok két oldala (1) A kifejezések a két hirdetés adatterében értékelőd- nek ki (ada, adb). Felhasználó (igénylő) oldala: Requirements = Arch == "INTEL" && OpSys == "LINUX" Rank = TARGET.Memory * 10 + TARGET.Disk + Mips Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 21 -

A dolgok két oldala (2) Erőforrás oldal: Friend = Owner == "haver" Trusted = Owner!= "judas" Mygroup = Owner == "zoli" Owner == "jani" Requirements = Trusted && (Mygroup LoadAvg < 0.5 && KeyboardIdle > 10*60) Rank = Friend + MyGroup*10 Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 22 - Central Manager Execute Machine Submit Machine Checkpoint Server Feladatkörök Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 23 - Condor Pool = Process Spawned Cluster Node Central Manager (Frieda s) = ClassAd Communication master Pathway master startd startd negotiator schedd collector Cluster Node master startd Desktop master startd schedd Desktop master startd schedd Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 24 -

Job indítás Schedd Startd Starter Submit Shadow Customer Job Condor Syscall Lib Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 25 - Condor job-ok Condor flock your workstation Condor personal Condor Pool "Barát" Condor Pool Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 26 - Milyen feladatok lehetnek? Elsősorban hosszú futási idejű, számításigényes feladatok. Különböző univerzumok léteznek Standard Vanilla MPI Grid Java Scheduler Local Parallel VM Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 27 -

Standard univerzum checkpointing, automatikus migráció meglevő programot újra kell fordítani, esetleg csak linkelni az alkalmazás nem használhat bizonyos rendszerhívásokat: pl. fork, socket, alarm, mmap ( elkapja a file műveleteket) Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 28 - Vanilla univerzum nincs checkpointing, nincs migráció meglevő futtatható kódot nem kell vátoztatni nincs korlátozás a rendszerhívásokkal szemben. NFS, vagy AFS kell!!!! Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 29 - PVM univerzum MW jellegű PVM programok környezete Binárisan kompatibilis PVM 3.4.2 + taszk kezeléshez kieg. Dinamikus VM kialakítás. Heterogén környezet támogatása Egy user csak egy példányban futathat deamont Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 30 -

Condor felépíti a virtuális gépet Master pmvd PVM alkalmazás M Slave pmvd S S S S S C #1 #2 #3 #4 #5 #6 Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 31 - MPI univerzum MPICH változtatás nélkül. Bináris kompatibilitás Csak ch_p4 device Dinamikusan nem változhat Nem állhat meg. NFS vagy AFS kell. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 32 - Futtatás lépései A job összeállítása Job bejelentése a Condor-nak Job-ot a Condor futtatja az általa kiválasztott gép(eken), szükség esetén átmozgatja egy másik gépre. Job befejeződik, a Condor e-mail-t küld a felhasználónak. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 33 -

Egy egyszerű jobleíró universe = vanilla executable = mathematica input = in$(process).dat output = out$(process).dat queue 50 Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 34 - Egy másik jobleíró universe = vanilla executable = /bin/hostname output = hostname.out.$(process) error = hostname.err.$(process) log = hostname.log queue 3 Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 35 - Sun Grid Engine (SGE) A Condor-hoz hasonló ütemező. Queue-kat definiál. Hangsúlyos a terhelés kiegyensúlyozása. Backup master ütemező. Check-point. Migrálási lehetőség. Négy szerepkör: master, submit, exec, admin, Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 36 -

SGE komponensei Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.02.25. - 37 -