Elosztott fájlrendszerek. Párhuzamos és Grid rendszerek. AFS (Andrew File System) AFS történelem Carnegie Mellon Egyetemen 1984-ben.

Hasonló dokumentumok
Párhuzamos és Grid rendszerek

Párhuzamos és Grid rendszerek. Elosztott fájlrendszerek. AFS (Andrew File System) Nagyméretű klaszterekhez. Elosztott fájlrendszerek

Operációs rendszerek. UNIX/Linux fájlrendszerek

Operációs Rendszerek II. Első verzió: 2009/2010. I. szemeszter Ez a verzió: 2009/2010. II. szemeszter

Operációs rendszerek. UNIX fájlrendszer

NIIF Központi Elosztott Szolgáltatói Platform

UNIX: fájlrendszerek

Üzleti kritikus alkalmazások Novell Open Enterprise Serveren

Párhuzamos és Grid rendszerek. Hol tartunk? Klaszter. Megismerkedtünk az alapfogalmakkal,

UNIX fájlrendszerek alapismeretei

Legfontosabb tulajdonságai. UNIX rendszer felhasználói és fejlesztői felülete (1-4. ea.) Unix hagymahéj struktúrája. Legfontosabb tulajdonságai

Kutatási fázis eredményei. Turi Péter

webalkalmazások fejlesztése elosztott alapon

Operációs rendszerek III.

Nyíregyházi Egyetem Matematika és Informatika Intézete. Fájl rendszer

ZFS - Zettabyte File System

Debreceni Egyetem Matematikai és Informatikai Intézet. 13. Védelem

Operációs rendszerek. Elvárások az NTFS-sel szemben

Párhuzamos és Grid rendszerek

ADATBÁZIS-KEZELÉS - BEVEZETŐ - Tarcsi Ádám, ade@inf.elte.hu

Párhuzamos és Grid rendszerek

Összefogalás. Párhuzamos és Grid rendszerek. Párhuzamos gépek osztályai. Jellemző szupersz.gép típusok. Flynn-féle architektúra modell

Párhuzamos és Grid rendszerek. Összefogalás. Jellemző szupersz.gép típusok. Párhuzamos architektúrák. Párh. prog. fejlesztési módszerek

GENERÁCIÓS ADATBÁZISOK A BIG DATA KÜLÖNBÖZŐ TERÜLETEIN

2011. November 8. Boscolo New York Palace Budapest. Extrém teljesítmény Oracle Exadata és Oracle Exalogic rendszerekkel

30. óra Fájlrendszerek

MMK-Informatikai projekt ellenőr képzés 4

Veeam Agent for Windows and Linux

StoreWay FDA 1500/2500/2900 középkategóriás moduláris tárolórendszer

LINUX LDAP címtár. Mi a címtár?

Non-stop hozzáférés az üzleti információkhoz bárhol, bármikor és bármilyen eszközzel

Enabling Grids for E-sciencE. EGEE köztesréteg. Adat szolgáltatások a glite-ban. INFSO-RI

Szalai Ferenc

SUSE Linux Enterprise High Availability. Kovács Lajos Vezető konzultáns

UNIX / Linux rendszeradminisztráció

Fájl rendszer. Fájl koncepció Elérési módok Könyvtár szerkezet Védelem Konzisztencia szemantika

Everything Over Ethernet

Operációs Rendszerek II. Első verzió: 2009/2010. I. szemeszter Ez a verzió: 2009/2010. II. szemeszter

Linux alapok és használatuk

NIS + NFS+Automount. Összeállította: Sallai András

Informatikai Rendszerek Intézete Gábor Dénes Foiskola. Operációs rendszerek oldal LINUX

Live free() or die() Az openmosix cluster szoftver

Könyvtári szervervirtualizáció Oracle Virtual Machine platformon

EMC AVAMAR. YOU WILL NEVER BACK UP THE SAME DATA TWICE. Diriczi Norbert

Felhő alapú hálózatok (VITMMA02) OpenStack Neutron Networking

VMware. technológiával. ADATMENTÉS VMware környezetben IBM Tivoli eszközökkel

Cloud computing. Cloud computing. Dr. Bakonyi Péter.

Tartalom. Történeti áttekintés. Történeti áttekintés Architektúra DCOM vs CORBA. Szoftvertechnológia

Synology NAS integrálása inels IMM szerverhez

Utolsó módosítás:

Riak. Pronounced REE-ahk. Elosztott adattároló eszköz. Molnár Péter

Magic xpi 4.0 vadonatúj Architektúrája Gigaspaces alapokon

1_Linux_bevezeto_bash

Az Oracle rendszer komponensei

The Power To Develop. i Develop

Operációs rendszerek. Az X Window rendszer

Hálózati operációs rendszerek II. Novell Netware 5.1 Netware fájlrendszer

A JGrid rendszer biztonsági architektúrája. Magyaródi Márk Juhász Zoltán Veszprémi Egyetem

Az internet ökoszisztémája és evolúciója. Gyakorlat 1

Exadata, a világ leggyorsabb adatbázisgépe

Adatbázis és alkalmazás konszolidáció Oracle SPARC T4/5 alapon

A VMware View teljes potenciáljának kihasználása NetApp adattárolóval

Fájlrendszerek. A Windows operációs rendszerek fájlrendszere

A hibrid DB cloud biztonsági eszköztára. Kóródi Ferenc Budapest,

NetWare 6 technikai áttekintés 2. rész

Mobil eszközökön tárolt adatok biztonsága

Hálózati ismeretek. Az együttműködés szükségessége:


Cloud computing Dr. Bakonyi Péter.

Szolgáltatás és Minőségfejlesztés a Corvinus Egyetemen Kiss György János Mogyorósi János

Operációs rendszerek. Az Executive és a kernel Policy és mechanizmusok szeparálása Executive: policy - objektum kezelés Kernel: mechanizmusok:

Hálózati operációs rendszerek II. OES biztonsági rendszere

OPERÁCIÓS RENDSZEREK I. HÁTTÉRTÁRAK

Az Oracle Fusion szakértői szemmel

Nyíregyházi Egyetem Matematika és Informatika Intézete. Fájl rendszer

Linux fájlrendszerek. Papp Zsolt. Rendszermérnök, Novell PSH.

A Ceph, mint adattároló klaszter megoldás

Osztott alkalmazások fejlesztési technológiái Áttekintés

Szalai Ferenc

Hol tartunk? Párhuzamos és Grid rendszerek. Klaszterek története. Klaszter. TOP november. Klaszterek ma. Megismerkedtünk az alapfogalmakkal,

Windows rendszeradminisztráció és Microsoft szerveralkalmazások támogatása. 7. óra. Kocsis Gergely, Kelenföldi Szilárd

A Java EE 5 plattform

Operációs rendszerek. A Windows NT file-rendszere (NTFS) NTFS: Windows NT File System

Másolatképzési technikák és azok felhasználási lehetőségei

Utolsó módosítás:

Ficsor Lajos Általános Informatikai Tanszék Miskolci Egyetem

Vodafone ODI ETL eszközzel töltött adattárház Disaster Recovery megoldása. Rákosi Péter és Lányi Árpád

Novell és Oracle: a csúcsteljesítményű, költséghatékony adatközpont megoldás. Sárecz Lajos Értékesítési konzultáns

Windows rendszeradminisztráció és Microsoft szerveralkalmazások támogatása. 5. óra. Kocsis Gergely, Supák Zoltán

Elosztott rendszer architektúrák

IBM On Demand megoldások és eserver Akadémia 2005 Adat életciklus menedzsment. Elek Norbert Tivoli technikai kereskedelmi képviselő

GNU/Linux alapok és alkalmazásuk

Tarantella Secure Global Desktop Enterprise Edition

Operációs rendszerek. A Windows NT felépítése

Költséghatékony high-end adattároló megoldások Vitéz Gábor, Avaxio Kft.

Párhuzamos és Grid rendszerek

SQL Server High Availability

Windows hálózati adminisztráció

Előadás_#13. Egy lemez írási művelet kiszolgálása

Az NIIF új szuperszámítógép infrastruktúrája Új lehetőségek a kutatói hálózatban

Átírás:

Elosztott fájlrendszerek Párhuzamos és Grid rendszerek (4. ea) Elosztott fájlrendszerek Szeberényi Imre BME IIT <szebi@iit.bme.hu> M Ű E G Y E T E M 1 7 8 2-1 - AFS (Andrew File System) Elosztott fájlrendszer, ami fájlok megosztására alkalmas lokális és távolsági hálózaton. Transzparens fájlhozzáférést biztosít. Az NFS-hez hasonló, annak alternatívájaként jött létre. Ma az OpenAFS számos UNIX, LINUX, WinX platformon elérhető. Nagyméretű klaszterekhez Földrajzilag is elosztott rendszerekhez NFS AFS, CODA, InterMezzo Lustre, SFS GFS GlusterFS OCFS Hadoop http://en.wikipedia.org/wiki/list_of_file_systems Gfarm file system Google file system GPFS Parallel Virtual FS QFS CernVMFS Nimbus, S3-2 - AFS történelem Carnegie Mellon Egyetemen 1984-ben fejlesztették ki UNIX környezetben. Ma azonban nem csak UNIX változat létezik. A fő cél az volt, hogy az egyetemi korlátozott sávszélességű hálózaton hatékony fájlelérést tegyenek lehetővé. - 3 - - 4 - AFS processzek AFS alapfogalmai Workstations User Venus program Venus User program Network Servers Vice Vice Cellák Kötetek Tokenek Cache menedzser Fájl védelem Fájl névtér Venus User program - 5 - - 6 -

AFS cella Egy AFS cella alá azok a szerverek tartoznak, melyek adminisztrációja közös, és az AFS felé egyetlen közös fájlrendszert alkotnak. Tipikusan az egy domain név alá tartozó gépek egy AFS cellát alkotnak. Általában a domain név valamilyen változata a cellanév. A munkaállomások a felhasználókról a cella szervertől kérnek információkat. Kötetek A diszkterületet az AFS további részekre, osztja ezek az AFS kötetek. Az AFS kötet egy tárolóegység ami a fájlok és katalógusok adatait tárolja. Az AFS kötettek fájlok formájában jelennek meg a befogadó operációs rendszerben, így azok könnyen átmozgathatók, akár másik gépre is. - 7 - - 8 - Tokenek Az AFS nem használja a UNIX felhasználói azonosítóját (UID). Ha ezt tenné, akkor minden UNIX gépen azonos UID kiosztásnak kellene lennie, mint az NFS-nél. Az azonosításhoz AFS tokent alkalmaznak, ami egy egyedi azonosítást tesz lehetővé. Egy token adott ideig (24 óra) érvényes. Cache menedzser A korlátozott sávszélesség miatt a működés központi eleme a cache, ahova az éppen használt fájlok letöltődnek. A cache menedzser feladata a cache-ben tárolt információk frissítése, karbantartása. Amennyiben a cache-ben tárolt fájlrészlet változik, úgy azt vissza kel tölteni a szervere. Ha a szerveren változik meg a fájl, akkor arról CallBack technikával értesít minden cache-t. - 9 - - 10 - Védelem Névtér A védelmi mechanizmus némileg eltér az alap UNIX védelmi rendszertől. A UNIX 3x3-as védelmétől pontosabban szabályozható ACL (Access Control List) segítségével. Lookup (l) Insert (i) Delete (d) Administer (a) Read (r) Write (w) Lock (k) - 11 - - 12 -

Névtér /2 UNIX-hoz hasonló hierarchikus struktúra Az AFS gyökér névtér rendszerint a /afs. Az alatta levő szinteket a cellák képviselik. adminisztratív domain AFS szerverek halmaza egy cégnél, egyetemen, laborban stb. Lokális cella alapértelmezett cella, amihez az adott munkaállomás csatlakozik. idegen cella más cella az AFS névtérben Venus Venus és Vice AFS kliens által futtatott processz. Vice AFS szerver által futtatott processz. - 13 - - 14 - Fájl műveletek A kliens munkaállomás a szerverrel csak az open/close műveletek kiszolgálásakor kommunikál. A fájl megnyitásakor a Venus a teljes fájlt a cachebe tölti, és a fájl lezárásakor írja azt vissza. Az adatok olvasását/írását a lokális másolaton a kernel végzi. A Venus a katalógusokat és a szimbólikus linkeket is a lokális gyorsítótárban tárolja. A fenti gyorsítótárazási mechanizmus alól a katalógusok módosítása a kivétel, aminek a végrehajtásáért a közvetlenül szerver a felelős. Fájl megosztás Lokális fájlokhoz hasonlóan. nincs külön mount nem kell belépni a mási gépre csak jogosultság kell A /afs katalógus alatt tetszőleges cella fájljai elérhetők. Természetesen megfelelő jogosultsággal. Csak a megfelelő útnevet kell hozzá tudni. A fájlmegosztást nem korlátozza a földrajzi távolság, vagy az adott operációrendszer típusa. - 15 - - 16 - Login és authentikáció 1. Bejelentkezéssel együtt token is generálódik 2. Külön kell tokent generálni. klog, Tokens held by the Cache Manager: --End of list-- szebi:$ /usr/afs/bin/klog Password: szebi:$ /usr/afs/bin/tokens Tokens held by the Cache Manager: User's tokens for afs@bme.hu [Expires Apr 7 00:47] --End of list... User's tokens for afs@cern.ch [Expires Apr 7 00:53] User's tokens for afs@bme.hu [Expires Apr 7 00:47] - 17 - Megvalósítás A kliens oldali programok a szokásos módon, rendszerhívással kezelik az állományokat. A távoli fájlok megnyitásakor Venus processzhez jut a kérés, amit az lebont az útnév alapján. Az alacsonyszintű I/O kezelését a befogadó operációs rendszer végzi. A gyorsítótár a lokális gép diszkjén jön létre. - 18 -

Rendszerhívás szint AFS parancsok User program UNIX file system calls Workstation Non-local file operations Venus Az AFS parancsok 3 csoportba oszthatók: Fájlszerver parancsok (fs) AFS szerver információk listázása Védelmi parancsok(pts) ACL listák létrehozása Authentikációs parancsok klog, unlog, kpasswd, tokens UNIX file system Local disk - 19 - - 20 - AFS előnyei Gyorsítótárazásból fakadó előnyök: Lényegesen csökkenti a hálózati forgalmat. Alacsonyabb sávszélességnél is jól használható. Helyfüggetlenség: Az AFS a földrajzi helyet a szerver oldalon rendeli fájlnévhez. Így a névtér helyfüggetlen. Skálázhatóság: A rendszer tervezési fázisában igen nagyra (~10000 kliens) tervezték. A kliens/szerver arányt pedig 200:1-re. Mindkét értéket túlteljesíti. AFS előnyei /2 Single systems image (SSI): Egy fájlszerver kialakítása lényegesen egyszerűbb, mint NFS-sel. Fokozott biztonság: Kerberos használata ACL használata Fájlok egyszerű megosztása Egyszerű rendszer menedzsment Robosztus Replika lehetőség. - 21 - - 22 - AFS hátrányai Minden munkaállomásra installálni kell. Háttérszerver komplexitása. Tokenek érvényességének lejártából fakadó gondok. CODA AFS-2 leszármazott disconnected replica Kerberos-like 87 óta fejlesztik. 2009 óta csend. - 23 - - 24 -

Lustre Objektum-orientált elosztott fájlrendszer. Jól skálázható. Nagyméretű klaszterekhez, és nagy fájlokhoz tervezték. Lustre 2007-től GPL. SUN ZFs 15 a top 30 szupergépből Lustre-t hazsnál Lustre történelem 1999 by Carnegie Mellon University Lustre 1.0 2003-ban (Cluster File Systems) 2007-ben SUN felvásárolta a CFS-t. Open source software (RedHat, SUSE, ) 2010-ben Oracle felvásárolta az SUN-t 2011-ben 1.8 supportot megszüntette (számos szervezet folytatta) Whamcloud, OpenSFS, EOFS, 2012-ben Whamloud-ot megvette az INTEL - 25 - - 26 - Lustre architektúra Három fő funkcionális egysége van: Metadata szerver (MDS), ami a fájl neveket, katalógusokat, védelmi kódokat és egyéb metaadatot tárol. Object storage szerverek (OSS), melyek az adatokat tárolják. Kliens ami az adatokat felhasználja, létrehozza. - 27 - - 28 - Lustre architektúra /2 Az adatok logikai kötetmenedzsmenttel ellátott RAID tárolókban tárolódnak, amit az OSS és az MDS dedikált módon használ. Jelenleg egy módosított ext4 fájlrendszer a logikai tároló. ZFS support (béta) Amikor egy kliens fájlt akar elérni, először az MDS-ben meg kell keresnie. Lustre architektúra /2 A fájl egyes darabjai több OSS-en tárolódhatnak, ami a kliens és az OSS között szűk keresztmetszet kialakulását gátolja. A kliensek nem módosítják közvetlenül az OSS-ben tárolt adatokat, hanem ezt a OSS- re bízzák, szemben a GFS megoldásával. Ez a módszer növeli a megbízhatóságot és a hibatűrést. - 29 - - 30 -

Skálázhatóság teljesítmény TOP 500-as lista tetején (Titan is) Skálázhatóság, nagy rendelkezésre állás Üzleti szupport (Oaracle-n kívül mindenki) S. Saini, J. Rappleye, J. Chang, D. Barker, P. Mehrotra, R. Biswas: I/O Performance Characterization of Lustre and NASA Applications on Pleiades ZFS Sun: 2001-2004, 2005-től Solaris része Zettabyte File System 128 Bit - extra nagy kapacitás Pool elvű tárolók elosztott sávszélesség és kapacitás Tranzakció kezelés Copy on Write Snapshots (ro) és klónozás Adat integritás ellenőrző összeg (külön) - 31 - - 32 - ZFS kapacitások 1 ZB = 10 21 1 ZiB (zebi B) = 2 70 2 64 shnapshot 2 48 fájl / dir 2 64 byte / fájl 2 78 byte / pool 2 64 device / pool 2 64 pool / system Hogyan kapunk diszk címet Hagyományos FS esetén: FS(1): filename object (inode) FS(2): object volume LBA VM: volume LBA array LBA RAID: array LBA disk LBA Sok réteg, szigorú szeparáció, eltérő gyártók - 33 - - 34 - Hogyan kapunk diszk címet (2) Architektúra ZFS esetén: ZPL: filename object DMU: object DVA SPA: DVA LBA ZPL: ZFS POSIX layer (standard syscall) DMU: Data Management Unit (transactional object store) DVA: Data Virtual Address (vdev + offset) SPA: Storage Pool Allocator (blokk alloc, data transform) - 35 - - 36 -

ZFS VM hasonlóság Kötet és Pool Hagyományos kötet kezelés Pool: Automatikus méretezés osztott sávszélesség - 37 - ZFS - Copy on Write (COW) - 38 - ZFS ellenőrző összeg - 39 - ZFS elérhetősége - 40 - GlusterFS OpenSolaris, OpenIndiana BSD, OSX Linux: CCDL és a GPL üti egymást Linux FUSE Native ZFS (Gentoo, Ubuntu) Célkitűzés FUSE alapokon megvalósítani elosztott fájlrendszert. A céget 2011-ben megvette a RedHat. Azóta a közösség láthatóan halódik http://en.wikipedia.org/wiki/zfs - 41 - - 42 -

CernVMFS HTTP http cache alapvetően SL, de kliens több Linux változatra - 43 -