Költséghatékony adattárolás grid alapokon. Nagy Zsombor Stefán Péter Szalai Ferenc Vitéz Gábor NIIF/HUNGARNET

Hasonló dokumentumok
Elosztott adattárolási technikák web szolgáltatás alapú grid rendszerekben

Linux adatkezelési képességei avagy RAID, LVM és állományrendszerek

Nyíregyházi Egyetem Matematika és Informatika Intézete. Fájl rendszer

Az állományok kezelésére használt fontosabb parancsok

Enabling Grids for E-sciencE. EGEE köztesréteg. Adat szolgáltatások a glite-ban. INFSO-RI

ClusterGrid for Windows

Költséghatékony high-end adattároló megoldások Vitéz Gábor, Avaxio Kft.

TELJESÍTÉNYMÉRÉS FELHŐ ALAPÚ KÖRNYEZETBEN AZURE CLOUD ANALÍZIS

Adja meg, hogy ebben az esetben mely handshake üzenetek kerülnek átvitelre, és vázlatosan adja meg azok tartalmát! (8p)

Nyílt forráskódú irodai programkomponensek vállalati környezetbe való integrációjának vizsgálata és implementációja

Üzleti kritikus alkalmazások Novell Open Enterprise Serveren


A HBONE évi fejlesztési eredményei

Non-stop hozzáférés az üzleti információkhoz bárhol, bármikor és bármilyen eszközzel

Storage optimalizálás egyetemi hálózatokban

Magic xpi 4.0 vadonatúj Architektúrája Gigaspaces alapokon

Operációs rendszerek 1.

NIIF szolgáltatások a múzeumok számára

Dedikált szerverhoszting katalógus november

Optimalizáció ESX-től View-ig. Pintér Kornél ügyfélszolgála3 mérnök

Az NIIF program fejlesztési tervei

LINUX Backup megoldások. Források: Adatmentési (backup) megoldások Linux alatt (pdf) Linux szerverek üzemeltetése (bme.hu)

WEB2GRID: Desktop Grid a Web 2.0 szolgálatában

A ClusterGrid bróker rendszere. Stefán Péter Szalai Ferenc Vitéz Gábor

Számítógépes munkakörnyezet II. Szoftver

Izsó Krisztián Péti Zoltán. Cisco Identity Services Engine

Operációs rendszerek. Az X Window rendszer

A HBONE+ projekt áttekintés

Grafikus keretrendszer komponensalapú webalkalmazások fejlesztéséhez

Programozás alapjai óra. Morvai Flórián, 2010 Dr. Dévényi Károly előadásvázlata alapján

Az NIIF új szuperszámítógép infrastruktúrája Új lehet!ségek a kutatói hálózatban Debreceni Egyetem

UNIX: fájlrendszerek

Elosztott rendszer architektúrák

NIIF Központi Elosztott Szolgáltatói Platform

Campus IPv6 projekt eredményei

SQL Server High Availability

Vertikális Piac. Hotelek & Kaszinók. Oktatás. Szállítás. Kiskereskedelem. Off-site ellenőrzés. Ingatlan - lakossági. Kormány. Property kereskedelmi

Fájl rendszer. Fájl koncepció Elérési módok Könyvtár szerkezet Védelem Konzisztencia szemantika

SQL Server High Availability. Bevezetés az SQL Server magas rendelkezésre állási megoldásaiba

Nyilvántartási Rendszer

Alkalmazások architektúrája

A HBONE+ projekt kapcsán megjelent új hálózati lehetıségek

A PET-adatgy informatikai háttereh. Nagy Ferenc Elektronikai osztály, ATOMKI

Sulinet + projekt. Mohácsi János Hálózati igh. NIIF Intézet október 21. Sulinet + projekt mérföldkő Budapest

Új generációs informatikai és kommunikációs megoldások ANMS. távközlési hálózatok informatikai hálózatok kutatás és fejlesztés gazdaságos üzemeltetés

Szalai Ferenc

Szalai Ferenc

Szolgáltatási szint megállapodás

Digitális Felsőoktatási, Kutatási és Közgyűjteményi Infrastruktúra-fejlesztési Stratégia

Sulinet + " áttekintés

IV.4. FELHŐ ALAPÚ BIZTONSÁGOS ADATTÁROLÁSI MÓDSZER ÉS TESZTKÖRNYEZET KIDOLGOZÁSA

Termeléshatékonyság mérés Ipar 4.0 megoldásokkal a nyomdaiparban

Az NIIF új szuperszámítógép infrastruktúrája Új lehetőségek a kutatói hálózatban

RH/CentOS felügyelet SUSE Manager segítségével. Kovács Lajos Vezető konzultáns

A GN2 PROJEKT ÉS KUTATÁSI EGYÜTTMŰKÖDÉS

Software Defined technológiák használata Oracle adatbázis konszolidációhoz

HBONE tábor 2005 november Mohácsi János

A HBONE+ projekt áttekintés eredmények és aktuális fejlesztések

Budapest Sysadmin Meetup Failover Cluster 1x1. Gál Tamás. Cloud Infrastructure TSP Microsoft Magyarország

Operációs rendszerek gyakorlat

"sulinet+" - Végponti kapcsolatok és központi szolgáltatás-fejlesztés a közoktatási hálózatban

A HBONE+ projekt áttekintés

Exadata, a világ leggyorsabb adatbázisgépe

Üzemeltetési kihívások 2015

Hiperkonvergens infrastruktúra. Brenner Zoltán rendszermérnök

Egy országos IP hálózat telepítésének tapasztalatai Szolgáltató születik

IMOLA. Integrált MOKKA2, ODR2 és OLA. Vándorgyűlés Szombathely, 2008 július 25. Monguz MTA SZTAKI konzorcium

Worldwide LHC Computing Grid

Tájékoztató az 1.10-es labor használatához

LINUX PMB LINUXOS PARANCSOK ÉS HASZNÁLATUK - GRUB

Kérdés Kép Válasz HIBAS Válasz HELYES Válasz HIBAS Válasz HIBAS Kérdés Kép Válasz HIBAS Válasz HELYES Válasz HIBAS Válasz HIBAS Kérdés Kép Válasz

WIN-TAX programrendszer hálózatban

hardver-szoftver integrált rendszer, amely Xwindow alapú terminálokat szervez egy hálózatba

SCHNETv6 IPv6 a Schönherzben. 5/7/12 Tóth Ferenc - IPv6 a Schönherzben 1

Virtuális Obszervatórium. Gombos Gergő

NIIF és a Sulinet + fejlesztések

Információs szupersztráda Informatika. Hálózatok. Információ- és tudásipar Globalizáció

A HBONE+ projekt áttekintés

Felhőszámítástechnika (Cloud Computing) helye és szerepe az on-line világ folyamataiban. Dr. Élő Gábor Széchenyi István Egyetem ITOK 2013

Jogosultság igénylési folyamatok egységesítése a Magyar Telekom csoportnál. Magyar Telekom IAM rendszer Pálfy Zsolt Levente , 1.

Operációs rendszerek. 2. gyakorlat. Munka állományokkal UNIVERSITAS SCIENTIARUM SZEGEDIENSIS UNIVERSITY OF SZEGED

Elektronikus Információs és Nyilvántartási Rendszer a Doktori Iskolák fiatal kutatói részére

Xpandrive virtuális storage rendszer

Tipikus időbeli internetezői profilok nagyméretű webes naplóállományok alapján

Enterprise szintű szerver- virtualizáció bevezetése felsőoktatási környezetben.

Informatika szintmérő-érettségi tételek február

Operációs rendszerek III.

A Grid Underground (GUG) projekt - azaz web szolgáltatás alapú grid rendszerek ClusterGridtől desktopokig Szalai Ferenc,

Smart Strategic Planner

Állásidő minimalizálása: BTRFS, kgraft

A HBONE+ projekt Július 2. Projekt nyitórendezvény, Budapest. Mohácsi János NIIF Intézet

Debreceni Egyetem Matematikai és Informatikai Intézet. 13. Védelem

Operációs rendszerek. UNIX fájlrendszer

IKT trendek és tapasztalatok a BME szemszögéből

2023 ban visszakeresné 2002 es leveleit? l Barracuda Message Archiver. Tóth Imre Kereskedelmi Igazgató Avisys Kft Barracuda Certified Diamond Partner

Operációs rendszerek I. IIII. gyakorlat

ClusterGrid infrastruktúra: Hogyan? Stefán Péter, Szalai Ferenc, Vitéz Gábor,

Operációs Rendszerek II. Első verzió: 2009/2010. I. szemeszter Ez a verzió: 2009/2010. II. szemeszter

Eduroam változások - fejlesztések, fejlődések. Mohácsi János NIIF Intézet HBONE Workshop 2015

Oktatási cloud használata

Átírás:

Költséghatékony adattárolás grid alapokon Nagy Zsombor Stefán Péter Szalai Ferenc Vitéz Gábor NIIF/HUNGARNET

Vázlat A storage + grid technológiákról általában A kétrétegű modell Ami alul van - storage node kialakítása Speciális technológia: AoE Ami fölül van - GUG storage management Továbbfejlesztési elképzelések Összefoglalás

Grid + Storage A grid = elosztott számítási és adattárolási infrastruktúra. Milyen adatok vannak? számítási folyamatok inputja, átmeneti állományok, számítások eredményeképp előállt nagyméretű adathalmaz (mammográfiai képek + feldolgozásuk). Óriási az adatigény: jelenleg 1 Pbyte csak CERN adattárolásra.

Storage felépítés Alapvetően kétfajta aspektusból foglalkozunk storage felépítéssel: nagy méretű hely áll rendelkezésre csatolva egy (vagy több) file szerveren (storage node telepítése), azok a szolgáltatások, amelyeken keresztül a felhasználók e lemezterületet akár grid-ből, akár közvetlenül elérhetik (grid storage management). E két réteg bár harmónikus egészet ad, független egymástól, és célszerű is külön-külön tárgyalni.

Storage csomópontok Olyan csomópontok, amelyek nagy adatkötetet kezelnek. Sokféleképp építhető fel: optikai (pl. FC) vs. réz (pl. Ethernet) alapon, HA vs. nem HA megoldások, fürtözött, vagy nem fürtözött megoldások. Ilyen csomópontoknak kell nagy sávszélessséggel, és kis késleltetéssel csatlakozni a gerinchálózathoz.

Storage csomópontok

ATA over Ethernet Egy lehetséges megoldás: (S)ATA over Ethernet. Olcsó megoldás: 250 eft/tbyte fajlagos költség. Teljesítményben: 50 Mbit/s ATA, 500 Mbit/s SATA. Volume managementtel bővíthető e teljesítmény.

NIIF grid storage csomópont # ls -l/dev/etherd/e4.* brw-rw----1 root disk 152, 40 Nov 4 11:29 /dev/etherd/e4.0 brw-rw----1 root disk 152, 41 Nov 4 11:29 /dev/etherd/e4.1 brw-rw----1 root disk 152, 42 Nov 4 11:29 /dev/etherd/e4.2 # cat /proc/mdstat Personalities :[raid5] [raid6] md2 :active raid6 etherd/e7.2[6] etherd/e6.2[5] etherd/e5.2[4] etherd/e4.2[3] etherd/e3.2[2] etherd/e2.2[1] etherd/e1.2[0] 1953556480 blocks level 6,64k chunk, algorithm 2 [7/7] [UUUUUUU] [========>...] resync = 43.6 % (170377004/390711296) finish=1098.8min speed=3341k/sec

NIIF grid storage csomópont 7 x 10 x 400 Gbyte összkapacitás. AoE polcok, tartalék hardver elemekkel. 2 db 64-bites kiszolgálógép (jelenleg csak egy működik). RAID6 + LVM + XFS konfiguráció. HW failover a két kiszolgáló szerver között. Kb. 50 Mbyte/sec RW IO (Parallel ATA).

NIIF grid storage csomópont Jelenleg az NIIF Névtár szolgáltatásból autentikáljuk a felhasználókat. A szerver jól definiált szolgáltatásokon keresztül érhető el: SCP-only, rsync, unison - grid témaszámmal, FTPS - NIIF által kiadott X509 tanúsítvánnyal, grid rendszerben (bővebben kesőbb). Tervezzük még: GridFTP elérés.

NIIF grid storage csomópont Mire érdemes használni? Szerver backup. Nagy mennyiségű adat átmeneti tárolására (pl: molekula-dinamikai számítások outputja, később feldolgozandó adatok, logok). Általános személyes adattárolásra (kivéve jogsertő tartalmak :). Mire NEM érdemes használni (egyenlőre)? Állomány megosztásra több ember között.

Grid elérés Bár a storage csomópont elérhető grid-en kívül használt protokollok segítségével is, elsődleges feladata a grid jobok adatainak tárolása. Egy lépés a teljesen integrált infrastruktúra irányába. Elérhetőnek kell lennie a grid számára: hálózati elérés (GRID VPN része), grid kliens interfész része. Grid Underground (GUG) - a következő generációs ClusterGrid középréteg.

GUG architektúra

Storage szolgáltatás Storage szolgáltatás: olyan webszolgáltatások halmaza, amelyek segítenek a grid felhasználónak adatai automatikus menedzselésében. Független a storage node kialakításától, tetszőleges gép, amelyen van hely futtathatja a storage szolgáltatásokat. A storage szolgáltatás segít az adat elhelyezésében, menedzselésében, kezeli az elosztott környezetet, másolatokat készít az egyes adatállományokból (automatikus replika kezelés).

Storage szolgáltatás komponensei

Storage szolgálatás komponensei Hasonló architektúrát valósít meg, mint a Unix FS, csak teljesen elosztottan. Az elosztott csomópontok web szolgáltatás interfészen át kommunikálnak egymással. Felhasználói nézet a kliensen: egy nagy file rendszer a /grid alatt. Minden file rendelkezik egy globálisan egyedi GUIDval (olyan, mint az i-node). Minden GUID leképződik egy vagy több SURL-re (az állomány konkrét fizikai elérési helye)

Elosztott Hash Katalógus (DHC) Ő tárolja a filenév GUID, illetve a GUID Metaadat (pl: SURL) összerendeléseket. Redundáns gyűrű architektúra, nincs egyetlen sebezhető pontja. Kétféle bejegyzés lehet benne: Könyvtár bejegyzés: GUID + file név, Állomány bejegyzés: metaadat (méret, acl, SURL stb).

Elosztott Hash Katalógus (DHC) Példa: a /grid DHC bejegyzése. '0' <?xml version="1.0"?> <Directory> <Created>1129881054</Created> <Entry> <G UID>jufebez-945</GUID> <Na me>home.txt</name> </Entry> </Directory>

Elosztott Hash Katalógus (DHC) Példa: a /grid/home/ DHC bejegyzése. 'jufebez-945' <?xml version="1.0"?> <Directory> <Created>1131204750</Created> <Entry> <G UID>labozuc-707</GUID> <Na me>vitezg</name> </Entry> </Directory>

Elosztott Hash Katalógus (DHC) Példa: /grid/home/{vitezg/, tls.py} DHC bejegyzése. 'jufebez-945' <?xml version="1.0"?> <Directory> <Created>1131204750</Created> <Entry> <G UID>labozuc-707</GUID> <Na me>vitezg</name> </Entry> <Entry> <G UID>vovoluv-014</GUID> <Na me>tls.py</name> </Entry> </Directory>

Elosztott Hash Katalógus (DHC) Példa: állomány DHC bejegyzése. 'vovoluv-014' => <?xml version="1.0"?> <File> <Created>1131204956</Created> <Size>796</Size> <SURL>srm://samu.ki.if.hu:21111/StC? ekatacu221</surl> </File> TURL: http://samu.ki.iif.hu:21113/1be6779e-22f2-483b-98d8-8e825b676603.0 grid storage cp /grid/home/vitezg/tls.py.

Kliens felület $ grid storage {PO SIX parancs} $ grid storage Missing com mand. usage: grid storage com mand [args] com mands: get get a filefrom stroge (get<lfn> <localfilename>) mkdir create a directory on storage (mkdir <LFN>) mv renames a file ordirectory in storage (mv <from> <to>) ls list contents of a directory (ls <LFN>) put put a fileto storage (put <localfilename> <LFN>) rm remove file from storage (rm <LFN>) cp copy a fileto/from/in storage (cp <from> <to>) rmdirremoves an empty direcotry (rmdir <LFN>)

Összefoglalás Nagyon fontos, hogy nagy adatmennyiséget, egy arra alkalmas infrastruktúrán, robusztus módon tudjunk tárolni. Két dologról volt szó: Hogyan lehet nagy köteteket kezelő ún. storage csomópontokat kialakítani? Hogyan lehet ezeken az adatkezelést egységes rendszerbe foglalni? Fontos jövőbeli irányok: a felső kategória tesztelése (Topspin eszközök), a mostani rendszer mennyiségi és minőségi bővítése.

Köszönöm a figyelmet! http://www.clustergrid.niif.hu http://gug.grid.niif.hu