Párhuzamos és Grid rendszerek. Elosztott fájlrendszerek. AFS (Andrew File System) Nagyméretű klaszterekhez. Elosztott fájlrendszerek

Hasonló dokumentumok
Elosztott fájlrendszerek. Párhuzamos és Grid rendszerek. AFS (Andrew File System) AFS történelem Carnegie Mellon Egyetemen 1984-ben.

Párhuzamos és Grid rendszerek

Operációs rendszerek. UNIX/Linux fájlrendszerek

Operációs Rendszerek II. Első verzió: 2009/2010. I. szemeszter Ez a verzió: 2009/2010. II. szemeszter

Operációs rendszerek. UNIX fájlrendszer

NIIF Központi Elosztott Szolgáltatói Platform

UNIX: fájlrendszerek

Üzleti kritikus alkalmazások Novell Open Enterprise Serveren

Párhuzamos és Grid rendszerek. Hol tartunk? Klaszter. Megismerkedtünk az alapfogalmakkal,

Legfontosabb tulajdonságai. UNIX rendszer felhasználói és fejlesztői felülete (1-4. ea.) Unix hagymahéj struktúrája. Legfontosabb tulajdonságai

UNIX fájlrendszerek alapismeretei

Kutatási fázis eredményei. Turi Péter

webalkalmazások fejlesztése elosztott alapon

Operációs rendszerek III.

Párhuzamos és Grid rendszerek

ZFS - Zettabyte File System

Nyíregyházi Egyetem Matematika és Informatika Intézete. Fájl rendszer

Debreceni Egyetem Matematikai és Informatikai Intézet. 13. Védelem

Párhuzamos és Grid rendszerek

Összefogalás. Párhuzamos és Grid rendszerek. Párhuzamos gépek osztályai. Jellemző szupersz.gép típusok. Flynn-féle architektúra modell

Párhuzamos és Grid rendszerek. Összefogalás. Jellemző szupersz.gép típusok. Párhuzamos architektúrák. Párh. prog. fejlesztési módszerek

Operációs rendszerek. Elvárások az NTFS-sel szemben

ADATBÁZIS-KEZELÉS - BEVEZETŐ - Tarcsi Ádám, ade@inf.elte.hu

GENERÁCIÓS ADATBÁZISOK A BIG DATA KÜLÖNBÖZŐ TERÜLETEIN

2011. November 8. Boscolo New York Palace Budapest. Extrém teljesítmény Oracle Exadata és Oracle Exalogic rendszerekkel

30. óra Fájlrendszerek

MMK-Informatikai projekt ellenőr képzés 4

Veeam Agent for Windows and Linux

StoreWay FDA 1500/2500/2900 középkategóriás moduláris tárolórendszer

LINUX LDAP címtár. Mi a címtár?

Non-stop hozzáférés az üzleti információkhoz bárhol, bármikor és bármilyen eszközzel

Enabling Grids for E-sciencE. EGEE köztesréteg. Adat szolgáltatások a glite-ban. INFSO-RI

Szalai Ferenc

SUSE Linux Enterprise High Availability. Kovács Lajos Vezető konzultáns

UNIX / Linux rendszeradminisztráció

Fájl rendszer. Fájl koncepció Elérési módok Könyvtár szerkezet Védelem Konzisztencia szemantika

NIS + NFS+Automount. Összeállította: Sallai András

Everything Over Ethernet

Informatikai Rendszerek Intézete Gábor Dénes Foiskola. Operációs rendszerek oldal LINUX

Operációs Rendszerek II. Első verzió: 2009/2010. I. szemeszter Ez a verzió: 2009/2010. II. szemeszter

Live free() or die() Az openmosix cluster szoftver

Linux alapok és használatuk

Könyvtári szervervirtualizáció Oracle Virtual Machine platformon

Felhő alapú hálózatok (VITMMA02) OpenStack Neutron Networking

Operációs rendszerek. Az X Window rendszer

Utolsó módosítás:

Synology NAS integrálása inels IMM szerverhez

Tartalom. Történeti áttekintés. Történeti áttekintés Architektúra DCOM vs CORBA. Szoftvertechnológia

EMC AVAMAR. YOU WILL NEVER BACK UP THE SAME DATA TWICE. Diriczi Norbert

Cloud computing. Cloud computing. Dr. Bakonyi Péter.

VMware. technológiával. ADATMENTÉS VMware környezetben IBM Tivoli eszközökkel

Magic xpi 4.0 vadonatúj Architektúrája Gigaspaces alapokon

1_Linux_bevezeto_bash

Riak. Pronounced REE-ahk. Elosztott adattároló eszköz. Molnár Péter

Az Oracle rendszer komponensei

The Power To Develop. i Develop

A JGrid rendszer biztonsági architektúrája. Magyaródi Márk Juhász Zoltán Veszprémi Egyetem

Adatbázis és alkalmazás konszolidáció Oracle SPARC T4/5 alapon

Exadata, a világ leggyorsabb adatbázisgépe

Hálózati operációs rendszerek II. Novell Netware 5.1 Netware fájlrendszer

Az internet ökoszisztémája és evolúciója. Gyakorlat 1

A hibrid DB cloud biztonsági eszköztára. Kóródi Ferenc Budapest,

Operációs rendszerek. Az Executive és a kernel Policy és mechanizmusok szeparálása Executive: policy - objektum kezelés Kernel: mechanizmusok:

Fájlrendszerek. A Windows operációs rendszerek fájlrendszere

Hol tartunk? Párhuzamos és Grid rendszerek. Klaszterek története. Klaszter. TOP november. Klaszterek ma. Megismerkedtünk az alapfogalmakkal,

A VMware View teljes potenciáljának kihasználása NetApp adattárolóval

Cloud computing Dr. Bakonyi Péter.

Hálózati ismeretek. Az együttműködés szükségessége:

NetWare 6 technikai áttekintés 2. rész

Mobil eszközökön tárolt adatok biztonsága

Szolgáltatás és Minőségfejlesztés a Corvinus Egyetemen Kiss György János Mogyorósi János


Hálózati operációs rendszerek II. OES biztonsági rendszere

Az Oracle Fusion szakértői szemmel

OPERÁCIÓS RENDSZEREK I. HÁTTÉRTÁRAK

Nyíregyházi Egyetem Matematika és Informatika Intézete. Fájl rendszer

Linux fájlrendszerek. Papp Zsolt. Rendszermérnök, Novell PSH.

Osztott alkalmazások fejlesztési technológiái Áttekintés

A Ceph, mint adattároló klaszter megoldás

Szalai Ferenc

Utolsó módosítás:

Párhuzamos és Grid rendszerek

Windows rendszeradminisztráció és Microsoft szerveralkalmazások támogatása. 7. óra. Kocsis Gergely, Kelenföldi Szilárd

Novell és Oracle: a csúcsteljesítményű, költséghatékony adatközpont megoldás. Sárecz Lajos Értékesítési konzultáns

A Java EE 5 plattform

Másolatképzési technikák és azok felhasználási lehetőségei

Elosztott rendszer architektúrák

Operációs rendszerek. A Windows NT file-rendszere (NTFS) NTFS: Windows NT File System

Ficsor Lajos Általános Informatikai Tanszék Miskolci Egyetem

Operációs rendszerek. A Windows NT felépítése

Vodafone ODI ETL eszközzel töltött adattárház Disaster Recovery megoldása. Rákosi Péter és Lányi Árpád

Windows rendszeradminisztráció és Microsoft szerveralkalmazások támogatása. 5. óra. Kocsis Gergely, Supák Zoltán

Tarantella Secure Global Desktop Enterprise Edition

IBM On Demand megoldások és eserver Akadémia 2005 Adat életciklus menedzsment. Elek Norbert Tivoli technikai kereskedelmi képviselő

GNU/Linux alapok és alkalmazásuk

BME-Ipar. Win-Win. Intelligens környezetek és e-technológiák. Dr. Charaf Hassan Fókuszban a Műegyetem és az ipar kapcsolata

Költséghatékony high-end adattároló megoldások Vitéz Gábor, Avaxio Kft.

Az NIIF új szuperszámítógép infrastruktúrája Új lehetőségek a kutatói hálózatban

SQL Server High Availability

Windows hálózati adminisztráció

Átírás:

Párhuzamos és Grid rendszerek (4. ea) Elosztott fájlrendszerek Szeberényi Imre BME IIT <szebi@iit.bme.hu> M Ű E G Y E T E M 1 7 8 2 Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 1 - Elosztott fájlrendszerek Nagyméretű klaszterekhez Földrajzilag is elosztott rendszerekhez NFS AFS, CODA, InterMezzo Lustre, SFS GFS GlusterFS OCFS Hadoop http://en.wikipedia.org/wiki/list_of_file_systems Gfarm file system Google file system GPFS Parallel Virtual FS QFS CernVMFS Nimbus, S3 Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 2 - AFS (Andrew File System) Elosztott fájlrendszer, ami fájlok megosztására alkalmas lokális és távolsági hálózaton. Transzparens fájlhozzáférést biztosít. Az NFS-hez hasonló, annak alternatívájaként jött létre. Ma az OpenAFS számos UNIX, LINUX, WinX platformon elérhető. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 3 -

AFS történelem Carnegie Mellon Egyetemen 1984-ben fejlesztették ki UNIX környezetben. Ma azonban nem csak UNIX változat létezik. A fő cél az volt, hogy az egyetemi korlátozott sávszélességű hálózaton hatékony fájlelérést tegyenek lehetővé. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 4 - AFS processzek Workstations User Venus program UNIX kernel Servers Vice UNIX kernel Venus User program UNIX kernel Network Vice Venus User program UNIX kernel UNIX kernel Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 5 - Cellák Kötetek Tokenek AFS alapfogalmai Cache menedzser Fájl védelem Fájl névtér Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 6 -

AFS cella Egy AFS cella alá azok a szerverek tartoznak, melyek adminisztrációja közös, és az AFS felé egyetlen közös fájlrendszert alkotnak. Tipikusan az egy domain név alá tartozó gépek egy AFS cellát alkotnak. Általában a domain név valamilyen változata a cellanév. A munkaállomások a felhasználókról a cella szervertől kérnek információkat. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 7 - Kötetek A diszkterületet az AFS további részekre, osztja ezek az AFS kötetek. Az AFS kötet egy tárolóegység ami a fájlok és katalógusok adatait tárolja. Az AFS kötettek fájlok formájában jelennek meg a befogadó operációs rendszerben, így azok könnyen átmozgathatók, akár másik gépre is. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 8 - Tokenek Az AFS nem használja a UNIX felhasználói azonosítóját (UID). Ha ezt tenné, akkor minden UNIX gépen azonos UID kiosztásnak kellene lennie, mint az NFS-nél. Az azonosításhoz AFS tokent alkalmaznak, ami egy egyedi azonosítást tesz lehetővé. Egy token adott ideig (24 óra) érvényes. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 9 -

Cache menedzser A korlátozott sávszélesség miatt a működés központi eleme a cache, ahova az éppen használt fájlok letöltődnek. A cache menedzser feladata a cache-ben tárolt információk frissítése, karbantartása. Amennyiben a cache-ben tárolt fájlrészlet változik, úgy azt vissza kel tölteni a szervere. Ha a szerveren változik meg a fájl, akkor arról CallBack technikával értesít minden cache-t. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 10 - Védelem A védelmi mechanizmus némileg eltér az alap UNIX védelmi rendszertől. A UNIX 3x3-as védelmétől pontosabban szabályozható ACL (Access Control List) segítségével. Lookup (l) Insert (i) Delete (d) Administer (a) Read (r) Write (w) Lock (k) Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 11 - Névtér Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 12 -

Névtér /2 UNIX-hoz hasonló hierarchikus struktúra Az AFS gyökér névtér rendszerint a /afs. Az alatta levő szinteket a cellák képviselik. adminisztratív domain AFS szerverek halmaza egy cégnél, egyetemen, laborban stb. Lokális cella alapértelmezett cella, amihez az adott munkaállomás csatlakozik. idegen cella más cella az AFS névtérben Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 13 - Venus Venus és Vice AFS kliens által futtatott processz. Vice AFS szerver által futtatott processz. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 14 - Fájl műveletek A kliens munkaállomás a szerverrel csak az open/close műveletek kiszolgálásakor kommunikál. A fájl megnyitásakor a Venus a teljes fájlt a cachebe tölti, és a fájl lezárásakor írja azt vissza. Az adatok olvasását/írását a lokális másolaton a kernel végzi. A Venus a katalógusokat és a szimbólikus linkeket is a lokális gyorsítótárban tárolja. A fenti gyorsítótárazási mechanizmus alól a katalógusok módosítása a kivétel, aminek a végrehajtásáért a közvetlenül szerver a felelős. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 15 -

Fájl megosztás Lokális fájlokhoz hasonlóan. nincs külön mount nem kell belépni a mási gépre csak jogosultság kell A /afs katalógus alatt tetszőleges cella fájljai elérhetők. Természetesen megfelelő jogosultsággal. Csak a megfelelő útnevet kell hozzá tudni. A fájlmegosztást nem korlátozza a földrajzi távolság, vagy az adott operációrendszer típusa. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 16 - Login és authentikáció 1. Bejelentkezéssel együtt token is generálódik 2. Külön kell tokent generálni. klog, Tokens held by the Cache Manager: --End of list-- szebi:$ /usr/afs/bin/klog Password: szebi:$ /usr/afs/bin/tokens Tokens held by the Cache Manager: User's tokens for afs@bme.hu [Expires Apr 7 00:47] --End of list... User's tokens for afs@cern.ch [Expires Apr 7 00:53] User's tokens for afs@bme.hu [Expires Apr 7 00:47] Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 17 - Megvalósítás A kliens oldali programok a szokásos módon, rendszerhívással kezelik az állományokat. A távoli fájlok megnyitásakor Venus processzhez jut a kérés, amit az lebont az útnév alapján. Az alacsonyszintű I/O kezelését a befogadó operációs rendszer végzi. A gyorsítótár a lokális gép diszkjén jön létre. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 18 -

Rendszerhívás szint Workstation User program UNIX file system calls Non-local file operations Venus UNIX kernel UNIX file system Local disk Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 19 - AFS parancsok Az AFS parancsok 3 csoportba oszthatók: Fájlszerver parancsok (fs) AFS szerver információk listázása Védelmi parancsok(pts) ACL listák létrehozása Authentikációs parancsok klog, unlog, kpasswd, tokens Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 20 - AFS előnyei Gyorsítótárazásból fakadó előnyök: Lényegesen csökkenti a hálózati forgalmat. Alacsonyabb sávszélességnél is jól használható. Helyfüggetlenség: Az AFS a földrajzi helyet a szerver oldalon rendeli fájlnévhez. Így a névtér helyfüggetlen. Skálázhatóság: A rendszer tervezési fázisában igen nagyra (~10000 kliens) tervezték. A kliens/szerver arányt pedig 200:1-re. Mindkét értéket túlteljesíti. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 21 -

AFS előnyei /2 Single systems image (SSI): Egy fájlszerver kialakítása lényegesen egyszerűbb, mint NFS-sel. Fokozott biztonság: Kerberos használata ACL használata Fájlok egyszerű megosztása Egyszerű rendszer menedzsment Robosztus Replika lehetőség. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 22 - AFS hátrányai Minden munkaállomásra installálni kell. Háttérszerver komplexitása. Tokenek érvényességének lejártából fakadó gondok. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 23 - CODA AFS-2 leszármazott disconnected replica Kerberos-like 87 óta fejlesztik. 2009 óta csend. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 24 -

Lustre Objektum-orientált elosztott fájlrendszer. Jól skálázható. Nagyméretű klaszterekhez, és nagy fájlokhoz tervezték. Lustre 2007-től GPL. SUN ZFs 15 a top 30 szupergépből Lustre-t hazsnál Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 25 - Lustre történelem 1999 by Carnegie Mellon University Lustre 1.0 2003-ban (Cluster File Systems) 2007-ben SUN felvásárolta a CFS-t. Open source software (RedHat, SUSE, ) 2010-ben Oracle felvásárolta az SUN-t 2011-ben 1.8 supportot megszüntette (számos szervezet folytatta) Whamcloud, OpenSFS, EOFS, 2012-ben Whamloud-ot megvette az INTEL Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 26 - Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 27 -

Lustre architektúra Három fő funkcionális egysége van: Metadata szerver (MDS), ami a fájl neveket, katalógusokat, védelmi kódokat és egyéb metaadatot tárol. Object storage szerverek (OSS), melyek az adatokat tárolják. Kliens ami az adatokat felhasználja, létrehozza. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 28 - Lustre architektúra /2 Az adatok logikai kötetmenedzsmenttel ellátott RAID tárolókban tárolódnak, amit az OSS és az MDS dedikált módon használ. Jelenleg egy módosított ext4 fájlrendszer a logikai tároló. ZFS support (béta) Amikor egy kliens fájlt akar elérni, először az MDS-ben meg kell keresnie. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 29 - Lustre architektúra /2 A fájl egyes darabjai több OSS-en tárolódhatnak, ami a kliens és az OSS között szűk keresztmetszet kialakulását gátolja. A kliensek nem módosítják közvetlenül az OSS-ben tárolt adatokat, hanem ezt a OSS- re bízzák, szemben a GFS megoldásával. Ez a módszer növeli a megbízhatóságot és a hibatűrést. Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 30 -

Skálázhatóság teljesítmény TOP 500-as lista tetején (Titan is) Skálázhatóság, nagy rendelkezésre állás Üzleti szupport (Oaracle-n kívül mindenki) S. Saini, J. Rappleye, J. Chang, D. Barker, P. Mehrotra, R. Biswas: I/O Performance Characterization of Lustre and NASA Applications on Pleiades Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 31 - ZFS Sun: 2001-2004, 2005-től Solaris része Zettabyte File System 128 Bit - extra nagy kapacitás Pool elvű tárolók elosztott sávszélesség és kapacitás Tranzakció kezelés Copy on Write Snapshots (ro) és klónozás Adat integritás ellenőrző összeg (külön) Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 32 - ZFS kapacitások 1 ZB = 10 21 1 ZiB (zebi B) = 2 70 2 64 shnapshot 2 48 fájl / dir 2 64 byte / fájl 2 78 byte / pool 2 64 device / pool 2 64 pool / system Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 33 -

Hogyan kapunk diszk címet Hagyományos FS esetén: FS(1): filename object (inode) FS(2): object volume LBA VM: volume LBA array LBA RAID: array LBA disk LBA Sok réteg, szigorú szeparáció, eltérő gyártók Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 34 - Hogyan kapunk diszk címet (2) ZFS esetén: ZPL: filename object DMU: object DVA SPA: DVA LBA ZPL: ZFS POSIX layer (standard syscall) DMU: Data Management Unit (transactional object store) DVA: Data Virtual Address (vdev + offset) SPA: Storage Pool Allocator (blokk alloc, data transform) Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 35 - Architektúra Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 36 -

ZFS VM hasonlóság Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 37 - Kötet és Pool Hagyományos kötet kezelés Pool: Automatikus méretezés osztott sávszélesség Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 38 - ZFS - Copy on Write (COW) Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 39 -

ZFS ellenőrző összeg Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 40 - ZFS elérhetősége OpenSolaris, OpenIndiana BSD, OSX Linux: CCDL és a GPL üti egymást Linux FUSE Native ZFS (Gentoo, Ubuntu) http://en.wikipedia.org/wiki/zfs Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 41 - GlusterFS Célkitűzés FUSE alapokon megvalósítani elosztott fájlrendszert. A céget 2011-ben megvette a RedHat. Azóta a közösség láthatóan halódik Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 42 -

HTTP http cache CernVMFS alapvetően SL, de kliens több Linux változatra Párhuzamos és Grid rendszerek BME-IIT Sz.I. 2013.03.04. - 43 -