univerzum Standard,Vanilla,PVM,MPI,Globus és Java. condor_shadow

Hasonló dokumentumok
A PVM és az MPI új elemeinek vizsgálata Farkas Gergely

A számítási grideket alkotó gépek erısen heterogén környezetében megvalósíthatatlan hogy minden gép ugyanazt a fájlrendszert lássa.

API tervezése mobil környezetbe. gyakorlat

Operációs rendszerek. Az X Window rendszer

Párhuzamos és Grid rendszerek. Hol tartunk? Elosztott rendszerek reneszánsza. Megismerkedtünk az alapfogalmakkal,

Hol tartunk? Párhuzamos és Grid rendszerek. Grid koncepció. Elosztott rendszerek reneszánsza. Grid hasonlat. Klaszter

Párhuzamos és Grid rendszerek

alkalmazásfejlesztő környezete

Mobil Peer-to-peer rendszerek

Elosztott rendszerek. Az elıadás. Az elosztott rendszer definíciója. Köztesrétegként felépülı elosztott rendszer

A futtatás elıtt az alábbi két dolgot kell tenni:

Kérdés Kép Válasz HIBAS Válasz HELYES Válasz HIBAS Válasz HIBAS Kérdés Kép Válasz HIBAS Válasz HELYES Válasz HIBAS Válasz HIBAS Kérdés Kép Válasz

P-GRADE fejlesztőkörnyezet és Jini alapú GRID integrálása PVM programok végrehajtásához. Rendszerterv. Sipos Gergely

JNDI - alapok. Java Naming and Directory Interface

Non-stop hozzáférés az üzleti információkhoz bárhol, bármikor és bármilyen eszközzel

A perzisztens adatkezelő rendszer tesztelése és demonstrálása a GRID környezetben

Kommunikáció. 3. előadás

Ezeket a kiemelkedı sebességő számítógépeket nevezzük szuperszámítógépeknek.

Rőczei Gábor Szeged, Networkshop

Riverbed Sávszélesség optimalizálás

Verzió: 1.7 Dátum: Elektronikus archiválási útmutató

Elosztott könyvtári rendszerek megvalósítása a Z39.50 és az OAI protokoll használatával

Gyakorlati tudnivalók

Az MTA Cloud a tudományos alkalmazások támogatására. Kacsuk Péter MTA SZTAKI

SZÓBELI ÉRETTSÉGI TÉMAKÖRÖK

GUSE BEMUTATÓ. Az MTA CLOUD felhasználói számára készült guse bemutató v2.0. MTA Cloud csapat

Tartalomjegyzék. I. rész: Az ügyfél Alapismeretek 3. Előszó

Elosztott rendszerek

Irányítástechnika Elıadás. PLC rendszerek konfigurálása

Tisztán kivehetı tendencia: kommunikációs hálózatok egyre bonyolultabbakká válnak Hálózat bonyolultsága

WebEC kliens számítógép telepítése és szükséges feltételek beállítása, az alábbi ellenőrző lista alapján történik.

Condor rendszer röviden. IKTA NI-2000/0008 munkaszkasz zárókonferencia

Folyamatok. 6. előadás

A JGrid rendszer biztonsági architektúrája. Magyaródi Márk Juhász Zoltán Veszprémi Egyetem

Számítógépes Hálózatok Felhasználói réteg DNS, , http, P2P

Felhasználói réteg. Számítógépes Hálózatok Domain Name System (DNS) DNS. Domain Name System

Számítógépes munkakörnyezet II. Szoftver

Utolsó módosítás:

Testreszabott alkalmazások fejlesztése Notes és Quickr környezetben

HunGrid Grid technológiák hozzáférési lehetőségei az intézetben

Szolgáltatási szint és performancia menedzsment a PerformanceVisor alkalmazással. HOUG konferencia, 2007 április 19.

április 24. INFO Savaria április 24. INFO Savaria április 24. INFO Savaria

Flash és PHP kommunikáció. Web Konferencia 2007 Ferencz Tamás Jasmin Media Group Kft

LINUX LDAP címtár. Mi a címtár?

1. F A F F A N F E N R

Multimédiás adatbázisok

Titkosítás NetWare környezetben

Operációs rendszerek

Segesdi Dániel. OpenNebula. Virtualizációs technológiák és alkalmazásaik BMEVIMIAV ősz

INTERNET. internetwork röviden Internet /hálózatok hálózata/ 2010/2011. őszi félév

Példa: LHC, CERN, Genf Enabling Grids for E-sciencE

Tarantella Secure Global Desktop Enterprise Edition

Szalai Ferenc

Ficsor Lajos Általános Informatikai Tanszék Miskolci Egyetem

Hálózati operációs rendszerek II.

A számítástechnika gyakorlata WIN 2000 I. Szerver, ügyfél Protokoll NT domain, Peer to Peer Internet o WWW oftp opop3, SMTP. Webmail (levelező)

PVM programok áthelyezése GRID környezetbe

Biztonság a glite-ban

JAVA webes alkalmazások

GRID AZ OKTATÁSBAN. Kápolnai Richárd, Németh Dénes, Dr. Szeberényi Imre,

SSL VPN KAPCSOLAT TELEPÍTÉSI ÚTMUTATÓ

1. Paraméterelemző feladatok a gyakorlatban

Java I. A Java programozási nyelv

Új generációs hálózatok. Bakonyi Péter c.docens

WebService tesztelés. SOAPui Pro, GreenPepper és Confluence használatával. Verhás & Verhás Szoftver Manufaktúra KNOW-HOW

Az internet az egész világot behálózó számítógép-hálózat.

S04-2 Elosztott alkalmazások készítése

A ClusterGrid bróker rendszere. Stefán Péter Szalai Ferenc Vitéz Gábor

Enabling Grids for E-sciencE. Grid bevezető INFSO-RI

Windows rendszeradminisztráció és Microsoft szerveralkalmazások támogatása. 5. óra. Kocsis Gergely, Supák Zoltán

S, mint secure. Nagy Attila Gábor Wildom Kft.

Vezetői információs rendszerek

ÜGYFÉL OLDALI BEÁLLÍTÁSOK KÉZIKÖNYVE

Könyvtári címkéző munkahely

Párhuzamos és Elosztott Rendszerek

5.1 Környezet Hálózati topológia

Melyek a Windows Server 2008 R2 tiszta telepítésének (Clean Install) legfontosabb lépései?


Tanúsítványkérelem készítése, tanúsítvány telepítése Microsoft Internet Information szerveren

A Wireshark program használata Capture Analyze Capture Analyze Capture Options Interface

Párhuzamos és Grid rendszerek

NetWare 6 technikai áttekintés 2. rész

A GeoEasy telepítése. Tartalomjegyzék. Hardver, szoftver igények. GeoEasy telepítése. GeoEasy V2.05+ Geodéziai Feldolgozó Program

Operációs rendszerek. Windows NT. A Windows NT

Utolsó módosítás:

BioAdmin 4.1 könnyű telepítés csak Kliens használatra

A FileZilla program beállítása az első belépés alkalmával

Komponens modellek. 3. Előadás (első fele)

Hibabehatárolási útmutató [ß]

OZW V7.0 firmware frissítés, Remote Tool Access részletes ismertető

Hálózati architektúrák és Protokollok GI - 9. Kocsis Gergely

Adobe Reader program beállítása elektronikus aláírás és idıbélyeg ellenırzésére

A Java EE 5 plattform

TECHNOLÓGIAI JÖVİKÉP. Felhınézetben. Tázló József mőszaki igazgató Cisco Systems Magyarország Cisco Systems, Inc. All rights reserved.

Image Processor BarCode Service. Felhasználói és üzemeltetői kézikönyv

Elnevezési rendszerek. 7. előadás

Perzisztens adatkezelés megvalósítása a SZTAKI saját klaszterén

The Power To Develop. i Develop

Objektumorientált programozás Pál László. Sapientia EMTE, Csíkszereda, 2014/2015

Irányítástechnika Elıadás. PLC-k programozása

Átírás:

A Condor jellegzetessége az univerzum fogalom. a rendszerben különbözı futtatási környezeteket takar: Standard,Vanilla,PVM,MPI,Globus és Java. A Standard univerzumban végrehajtott programok hibatőrık, mert a Condor rendszer állapotmentéseket (checkpoint) végez futás közben. Ha a program futása hardverhiba vagy a futtató gép tulajdonosának közremőködése miatt megszakad, akkor a lementett állapot segítségével a program futása egy azonos architektúrájú gépen folytatható tovább. 2 A standard univerzum másik tulajdonsága: a rendszerhívásokat, a feladatot benyújtó távoli gépre viszi át (remote system calls) egy árnyékfolyamat, a condor_shadow segítségével. Ha a futtató gépen egy rendszerhíváshoz (például fájlmővelethez) ér a program, akkor azt a távoli gépen futó árnyékfolyamat hajtja végre (a távoli gépen lévı fájlon). A standard univerzum használata: a meglévı programokat újra kell fordítani, hogy képesek legyenek a fenti lehetıség kihasználására. Ilyenkor a program tárgykódjához a Condor a saját Condor könyvtárát szerkeszti hozzá. 3 4 1

A standard univerzum használata azonban megszorítással is jár: A legfontosabbak: Nem futtathatunk több folyamatból álló programokat, nem használhatunk néhány rendszerhívást (fork, exec, system) és nem használhatjuk a Unix változatok biztosította folyamatok közötti kommunikációs lehetıségeket (szemaforok, unix csıvezetékek). 5 A Vanilla univerzum olyan programok futtatására használható, amelyeknél nincs lehetıség újrafordításra. Itt nincs lehetıség állapotmentésre és a rendszermőveletek átvitelére sem. Ez utóbbi miatt a program által használt fájloknak jelen kell lennie a futtató gépen is. Az elosztott fájlrendszerek használatával ez nem jelent problémát. A másik megoldás, hogy a feladatleíró fájlban megkérjük a Condort a fájl átvitelére. 6 A PVM és az MPI univerzumok elosztott programok futtatására valók. A globus univerzum a Globus Toolkit nyújtotta lehetıségekre épít. A Java univerzum Java programok futtatására használható. A Condor gondoskodik a Java futtatókörnyezet elindításáról és a CLASSPATH paraméter beállításáról. A Condor funkcionalitásai közül kiemelendı a DAGMan, melynek neve az irányított körmentes gráfból (Directed Acyclic Graph, DAG) származik. Irányított körmentes gráffal jól leírható a feladatok egymásutánisága, függısége, azaz, hogy melyiket melyik után kell indítani. A DAGMan ezt biztosítja. Megadható neki, hogy mely feladatot mely másik vagy másikak lefutása után indítsa. Különösen fontos együttmőködı feladatok esetén, mint például a GRID computing-nál. 7 8 2

Példa DAG Egy olyan adatstruktúra, amely a függıségeket ábrázolja. Minden feladat egy csomópont a gráfban, Bármely csomópontnak lehet akárhány szülı és akárhány gyermekcsomópontja, amíg a gráf körmentes marad. A DAG-ot egy.dag fájl definiálja, amely felsorolja az összes csomópontot és a függéseit. 9 10 A Globus Toolkit egy nyílt forráskódú, nyitott architektúrájú köztesréteg szoftver számítási Gridek felépítésére. Argonne National Laboratory munkatársai kezdték fejleszteni, a jelenleg elérhetı legújabb változat a 3.2 verziószámot viseli. A 3.0 verziótól az egész Globus infrastruktúra megújult. A szolgáltatások kibıvített Web szolgáltatások (Web Service), úgynevezett grid szolgáltatások(grid Services) formájában vannak jelen, amelyeket a Global Grid Forum által kiadott OGSI szabvány ír le. 11 12 3

A Globus rendszer alapjául szolgáló komponensek három csoportba sorolhatók: 1. az erıforrásokat kezelı komponensek, 2. az adatokat kezelı komponensek, 3. az információs szolgáltatások. 13 Az elsı pillér a grid erıforrások kezelését, lefoglalását valósítja meg. Ehhez a pillérhez tartoznak a GRAM (Grid Resource Allocation Manager) és DUROC (Dynamically Updated Request Online Co-allocator) komponensek. A második pillér az elosztott információs szolgáltatás, amely a kliensek számára szolgáltat információt a grid elérhetı erıforrásairól. Ehhez a pillérhez tartoznak az MDS-t (Meta-Directory Service) alkotó GRIS (Grid Resource Information Service) és GIIS (Grid Index Information Service) komponensek. 14 A harmadik pillér feladata az adatok elérése és kezelése grides környezetben. Ide tartoznak a GASS (Global Access to Secondary Storage) és GridFTP komponensek. A Globus Toolkit-ot réteges felépítés jellemzi Mindhárom pillér alapjául szolgál a GSI (Grid Security Infrastructure) protokoll, amely a biztonságot hivatott biztosítani. 15 16 4

A legalsó rétegekben helyezkednek az úgynevezett helyi szolgáltatások. Pl. TCP, MPI, stb. majd erre a rétegre épülnek a Globus magjának szolgáltatásai, azaz maga a Globus. Végül a harmadik, legfelsı rétegben pedig magasszintő szolgáltatások és eszközök kapnak helyet. A Globus lehetıvé teszi, hogy a rendszert más, már létezı rendszerekkel használjuk. Ilyen például a Condor-G. 17 18 A számítási gridek nagy kiterjedéső, heterogén rendszerek, amelyek több adminisztrációs tartományt foglalnak magukba. A felhasználók és az erıforrások gyakran különbözı adminisztrációs tartományokba esnek, ezért a biztonság kérdése alapvetıen fontos. A Globus Toolkit biztonsági mechanizmusát a GSI (Grid Security Infrastructure) protokoll adja 19 Létrehozásakor az elsıdleges célok a következık voltak: Biztonságos kommunikáció biztosítása a számítási grid elemei között. Biztonság megvalósítása szervezeti határok mentén úgy, hogy elkerülhetı legyen egy központi elem bevezetése. A grid felhasználói számára egyszeri bejelentkezés és delegáció megvalósítása, az erıforrások használatakor. 20 5

A megvalósításához a GSI publikus kulcsú titkosítást alkalmaz az SSL protokoll feletti biztonságos kommunikációt és az X.509 tanúsítványokat használja fel. Mielıtt a felhasználó a grid bármely erıforrását használhatná, igényelnie kell egy X.509 tanúsítványt (certificate) a rendszertıl. A tanúsítvány tartalmazza a felhasználó nevét, valamint a szervezetet, amelyhez tartozik. Az igényelt tanúsítványt ezután digitálisan alá kell íratni egy arra hivatott szolgáltatással, a hitelesítési szervezettel (Cerificate Authority). 21 Az aláírt tanúsítványok hosszú lejáratúak általában 5 évig érvényesek, lejárat után meghosszabbíthatóak. Az aláírt tanúsítvány megléte azonban még nem elég a grid használatához a felhasználónak be kell jelentkeznie a gridbe. A bejelentkezéskor egy rövid ideig tipikusan fél napig érvényes átmeneti tanúsítvány generálódik, amelyet grid-proxy-nak neveznek. A Globus rendszerben levı programokhoz futtatáskor hozzárendelıdik ez a grid-proxy, s azok ennek segítségével igazolni tudják magukat az erıforrások használatakor. Ezt a folyamatot nevezik delegációnak. 22 A Globus GRAM és DUROC komponense lehetıséget biztosít arra, hogy programokat futtassunk távoli erıforrásokon. Az erıforrások kezelését két egymásra épülı réteg valósítja meg: A felsı réteg tartalmazza a magas szintő globális erıforrás kezelı szolgáltatásokat, az alsó a lokális erıforrásokat lefoglaló szolgáltatásokat. A lokális erıforráskezelı rétegben egy GRAM Gatekeeper nevő komponens várja az erıforrás foglalási igényeket. 23 24 6

A klienseknek egy erre kifejlesztett nyelven, az RSL (Resource Specification Language) nyelven kell az igényeiket leírni, s ezt kell átadni a GRAM Gatekeeper szolgáltatásnak, ami továbbadja a helyi jobkezelı rendszerrel együttmőködni képes GRAM jobkezelı komponensnek a kérést. A GRAM jobkezelı feldolgozza az RSL kérést, majd a megfelelı paraméterekkel meghívja a helyi folyamatkezelıt (pl. a Condor feladatkezelıt), ami létrehozza a folyamatokat. Globus lokális erıforrás kezelı rétege 25 26 A kliensek tehát egy speciális, erıforrás specifikáló nyelv segítségével, az RSL-el tudnak erıforrásokat igényelni. Az RSL leírás egy egyszerő (attribútum=érték) párokból álló fájl. Legfontosabb attribútumai a következık: executable: a futtatandó program neve és helye, amely lehet fájlnév vagy URL directory: a futtatás könyvtára arguments: a program argumentumai stdin: a futtatandó program standard bemenetét adó fájl vagy URL stdout: a standard kimenetet az itt megadott fájlba menti le (lehet URL is) stderr: a standard hibakimenetet ebbe a fájlba menti le (lehet URL is) count: az itt megadott példányszámban indítja el a programot jobtype: itt a feladat típusát határozhatjuk meg URL megadása esetén a Globus képes HTTP vagy FTP szerverrıl letölteni, illetve oda feltölteni a hivatkozott fájlt, de használhatjuk a Globus adatszolgáltató részéhez tartozó, ezen célra kifejlesztett GASS komponenst is. A kliensek képesek a GRAM jobkezelın keresztül a létrehozott folyamatokkal kapcsolatot tartani. Pl.: lekérdezhetik a folyamatok állapotát és megszakíthatják a folyamatok végrehajtását is. 27 28 7

A legegyszerőbb GRAM kliensek a globusrun és a globus-job-run programok, amelyek a Globus Toolkit részét képezik. Az elsıvel egy RSL leírás alapján hajthatjuk végre a feladatot, A másodiknál RSL leírás nélkül, parancssori paraméterek segítségével adhatjuk meg a végrehajtandó feladatot. Bonyolultabb GRAM kliensek írásához a Globus programozói interfészt (API-t) biztosít. A grid rendszerek alapvetı célja azonban összetett: több számítógépet használó alkalmazások futtatása. Ha egy kliens a számítási grid több gépén szeretné egyszerre futtatni programjait, akkor ezeket az erıforrásokat egyszerre kell lefoglalnia. Ennek a problémának a megoldásában nyújt segítséget a Globus globális erıforrás-kezelı rétege. 29 30 A fı szerepet itt a Globus DUROC komponense játssza, amely összetett RSL leírásokat képes több egyszerő RSL leírássá alakítani, majd az egyszerő leírások alapján az erıforrásokat egyszerre lefoglalni. A Globus globális erıforrás-kezelı rétege Párhuzamos programok, nevezetesen MPI programok számítási gridekben történı futtatásához elengedhetetlen az erıforrások szimultán lefoglalása. 31 32 8

A grid rendszerek használatakor a következı alapvetı kérdések merülnek fel. Hogyan döntheti el az alkalmazás, hogy milyen erıforrások elérhetıek el? Hol vannak ezek az erıforrások? Mi ezeknek az erıforrásoknak az aktuális állapota? Ezeknek a kérdéseknek a megválaszolásához egy általános információs rendszerre van szükség, amelyet a Globus Toolkitben az MDS (Meta-Directory Service) szolgáltatás képvisel. A Globus elsı változataiban az MDS szerepét adminisztrációs tartományonként egy-egy központi LDAP szerver látta el. Mint minden központosított szolgáltatásnak, rossz hatása volt a rendszer teljesítményére, így szükségessé vált egy új változat tervezése. Az MDS második változatával egy elosztott, skálázható információs rendszert sikerült létrehozni. Az MDS-2 két szereplıbıl áll. 33 34 1. GRIS (Grid Resource Information Service), amely közvetlen az erıforrás mellett található, és magáról az erıforrásról ad információkat a klienseknek. 2. GIIS (Grid Index Information Service), amely több erıforrásról tárol információt, temporális jelleggel (cache). A GRIS szolgáltatások saját információjuk terjesztéséhez: a GRRP (Grid Resource Registration Protocol) protokoll segítségével bejegyezhetik magukat egy vagy több GIIS szolgáltatásánál. Az információra szoruló kliensek a GRIP (Grid Resource Inquiry Protocol) protokoll segítségével feltehetik kérdéseiket a GIIS szervereknek, amelyek a tárolt információ alapján megadják a lehetséges erıforrások halmazát. 35 36 9

Ha a kliens ismeri az erıforrás elérhetıségét, akkor közvetlenül annak GRIS szolgáltatásától kérdezheti le az állapotot ugyancsak a GRIP protokoll segítségével. Nagyon hasonló a Webes keresırendszerekhez: ahol a beírt kifejezésre vonatkozó keresést a honlapok keresırendszer által tárolt változatain végzik el, majd a találatokat amelyek lehetnek elavultak is visszaadják a keresést kezdeményezınek, aki ellenırizheti azokat. Az MDS mőködése 37 38 A GIIS szolgáltatások hierarchikus felépítésével a kliensek a DNS rendszerhez hasonló módon kérdezhetik le az információkat a névszolgáltatástól. Hierarchikus erıforrás-keresı rendszer Ha a kliens ismeri a gyökér GIIS szerver címét, akkor az összes bejegyzett szolgáltatást megtalálhatja. 39 40 10

41 11