Adattároló rendszerek fogalmai. Merevlemez. Adattároló egységek. Diszk = szalag = Merevlemezek paraméterei 2012.02.28. ADAT MEMÓRIA DISZK RANDOM IO



Hasonló dokumentumok
Alapprobléma RAID. Alapfogalmak. RAID - redundancia. RAID gyorsabb adatelérés

Redundáns rendszert akarunk Gyors rendszert akarunk Nagy kapacitást akarunk több diszket összekapcsolni

TUDOMÁNYOS ADATBÁZISOK. Dobos László ELTE Komplex Rendszerek Fizikája Tanszék

Software Defined technológiák használata Oracle adatbázis konszolidációhoz

Dedikált szerverhoszting katalógus november

Operációs Rendszerek MSc

TUDOMÁNYOS ADATBÁZISOK TERVEZÉSE ÉS ÉPÍTÉSE

2. Számítógépek működési elve. Bevezetés az informatikába. Vezérlés elve. Külső programvezérlés... Memória. Belső programvezérlés

A számítógép egységei

Mágneses háttértárak

elektronikus adattárolást memóriacím

Az Invitel adatközponti virtualizációja IBM alapokon

I. Mérés SZÉCHENYI ISTVÁN EGYETEM GYŐR TÁVKÖZLÉSI TANSZÉK

TUDOMÁNYOS ADATBÁZISOK TERVEZÉSE ÉS ÉPÍTÉSE

Storage optimalizálás egyetemi hálózatokban

Számítógép felépítése

Virtualizációs Technológiák SAN/NAS/DAS RAID szintek Storage virtualizáció Kovács Ákos

12. tétel. Lemezkezelés

Mi van a számítógépben? Hardver

Költséghatékony high-end adattároló megoldások Vitéz Gábor, Avaxio Kft.

Fábián Zoltán Hálózatok elmélet

Operációs Rendszerek II. Első verzió: 2009/2010. I. szemeszter Ez a verzió: 2009/2010. II. szemeszter

Supermicro Cluster-In-a-Box

Számítógép felépítése

A háttértárak a program- és adattárolás eszközei.

6. óra Mi van a számítógépházban? A számítógép: elektronikus berendezés. Tárolja az adatokat, feldolgozza és az adatok ki és bevitelére is képes.

TELJESÍTÉNYMÉRÉS FELHŐ ALAPÚ KÖRNYEZETBEN AZURE CLOUD ANALÍZIS

A számítógépek felépítése. A számítógép felépítése

BMD Rendszerkövetelmények

12. Másodlagos tár szerkezet

R320 Szerver. Műszaki adatok

Bevitel-Kivitel. Eddig a számítógép agyáról volt szó. Szükség van eszközökre. Processzusok, memória, stb

2011. November 8. Boscolo New York Palace Budapest. Extrém teljesítmény Oracle Exadata és Oracle Exalogic rendszerekkel

A processzor hajtja végre a műveleteket. összeadás, szorzás, logikai műveletek (és, vagy, nem)

Riverbed Sávszélesség optimalizálás

Számítógépes hálózatok

Informatikai technológiák laboratórium I február 17.

RAID. Felhasználói útmutató

Könyvtári szervervirtualizáció Oracle Virtual Machine platformon

Informatikai füzetek

Kovács Gábor. rendszermérnök ICON Számítástechnikai Rt.

Operációs rendszerek

Tájékoztató. Használható segédeszköz: -

Főbb jellemzők INTELLIO VIDEO SYSTEM 2 ADATLAP

S.M.A.R.T. Forrás:

Szerverek, kliensek Akár 60 kamera megjelenítése egyszerre Akár 80 kamera képrögzítése Szerveroldali képelemzés Asztali vagy rackbe szerelhető kivitel

Hálózati ismeretek. Az együttműködés szükségessége:

Számítógépek felépítése

Tervezte és készítette Géczy László

Előadás_#13. Egy lemez írási művelet kiszolgálása

Tervezte és készítette Géczy LászlL. szló

SZÁMÍTÓGÉPES ALAPISMERETEK

1 Veszprém Megyei Csolnoky Ferenc Kórház Nonprofit Zrt.

MS Windows XP Professional SP2 telepítés virtuális gépre.

Nyíregyházi Egyetem Matematika és Informatika Intézete. Input/Output

1. MODUL - ÁLTALÁNOS FOGALMAK

Web harvesztelés. Automatikus módszerekkel

TUDOMÁNYOS ADATBÁZISOK MA ÉS A JÖVŐBEN. X64 ALAPÚ KISZOLGÁLÓ RENDSZEREK Tudomány Adatbázisok, 1. előadás, (c) 2010

Szerverkonszolidáció az SZTE Egyetemi Számítóközpontban

IT infrastruktúra egy modern egyetemi könyvtárban

T430 Szerver. Műszaki adatok

Bepillantás a gépházba

Digitális rendszerek. Digitális logika szintje

Operációs rendszerek III.

Hitachi Flash Újdonságok. Szokol Zsolt Senior Solution Consultant 2016 március

A merevlemez állapota hibátlan. Nem található hibás vagy gyenge szektor, nincsenek felpörgési és adatátviteli hibák sem.

NetWare 6 technikai áttekintés 2. rész

Merevlemezek tegnap, ma, holnap

ADATHORDOZÓ LEMEZ. Különböző ADATHORDOZÓK. MO lemez. hajlékonylemez CDROM, DVDROM. lemez. merevlemez CDRAM, DVDRAM. lemez

Operációs rendszerek MINB240. Bevitel-Kivitel. 6. előadás Input és Output. Perifériák csoportosításá, használat szerint

Operációs rendszerek. Elvárások az NTFS-sel szemben

Feladatlap: Számítógép összetevők keresése

2016/06/23 07:47 1/13 Kérdések

NIIF Központi Elosztott Szolgáltatói Platform

IT - Alapismeretek. Feladatgyűjtemény

Dell Inspiron 560s: Részletes muszaki adatok

Számítógép egységei. Szoftver (a fizikai eszközöket működtető programok összessége)

Informatika érettségi vizsga

RAID rendszerek. hibatűrés (az egyes diszkek meghibásodásával szembeni tolerancia)

Szerver-üzemeltetés - Tudásközpont, Pécs

1. Használatba vétel. 1.1 Biztonsági előírások. 1.2 Rendszerkövetelmények. 1.3 A csomag tartalma

Technikai tájékoztató - kérdések és válaszok TSD-QA (2012/05)

Linux adatkezelési képességei avagy RAID, LVM és állományrendszerek

Gyakorlati vizsgatevékenység. Graf Iskola

SAP Business One. Áttekintés, gyakorlati ismertetı. Mosaic Business System Kft.; Support:

Hardver összetevők ellenőrzése Linux alatt. Hardverguruk előnyben...

BEÁGYAZOTT RENDSZEREK TERVEZÉSE UDP csomag küldése és fogadása beágyazott rendszerrel példa

Tájékoztató. Használható segédeszköz: -

Hálózati operációs rendszerek II. Kötetek kezelése

Grayteq. Grayteq DLP Teljesítmény Benchmark. Grayteq DLP Benchmark. Sealar Corporate Proprietary Commercial-in-confidence

Az NIIF új szuperszámítógép infrastruktúrája Új lehetőségek a kutatói hálózatban

T320 Szerver. Műszaki adatok

ihardware Szerverkatalógus június Használt szerverek Kiemelt akciós ajánlatunk:

Ismerkedjünk tovább a számítógéppel. Alaplap és a processzeor

Lemezkezelés, állományrendszerek

PMU Kezdı lépések. 6-0 Csatlakozás LG GLOFA-GM és SAMSUNG PLC-hez. 6-1 Kommunikáció LG PMU és LG GLOFA-GM7 / GM6 / GM4 között

Optimalizáció ESX-től View-ig. Pintér Kornél ügyfélszolgála3 mérnök

ÁLTALÁNOS SZERZŐDÉSI FELTÉTELEK

Számítógépes Hálózatok. 7. gyakorlat

Számítógép-hálózat fogalma (Network)

Átírás:

1 2 Adattároló rendszerek fogalmai On-line: bármikor elérhető Off-line: humán beavatkozás igényel (pl. szalag) Szekvenciális: bájtfolytonosan írható/olvasható Random elérésű: bárhonnan írhatunk/olvashatunk DAS: directly attached storage Közvetlenül a rendszerbuszra kapcsolva Gyors, kis távolságra vihető el, drága NAS: network attached storage Hálózaton érhető el (lassú) Nagy távolságra vihető el, drága 3 4 Adattároló egységek Merevlemez Merevlemez Tömeggyártás, olcsó Gyors szekvenciális adatelérés Random adatelérés, de az lassú Érzékeny mechanika Nagy fogyasztás Félvezető tárolók (SSD) Ma még drága Nagyon gyors random Írási problémák Alacsonyabb fogyasztás Memória: Drága, de már TB elérhető Nagyon gyors, random Szalagos egységek Jó ár/kapacitás arány A meghajtók ma már nagyon drágák Soros adatelérés Archiválásra, biztonsági mentésre, adattovábbításra Optikai tárolók Kis kapacitás, reménytelen Adatrögzítés módja: Az információt ferromágneses réteg tárolja Kiolvasás a GMR elv szerint Felépítése: Egy vagy több lemez közös tengelyen Motor Olvasófejek közös tengelyen Elektronika Forrás: Wikipedia 5 6 Merevlemezek paraméterei = szalag = Fizikai méret: Szerverekben 2.5, 3.5 Lemezek száma tipikusan 1-2-3 Kapacitás: 500 GB 2000 GB Limitáló tényező: bitsűrűség A mai technológia 30 TB-ig kiterjeszthető Sebesség 60-150 MB/s szekvenciális olvasás (a lemez szélén) 4.5-15 ms random elérési idő Limitáló tényező: fordulatszám: max. 5400 15000 rpm Interfész SATA II 3 Gb/s rövid kábel, gépen belül SAS 6 Gb/s közepes távolság, szekrényen belül FibreChannel gigabit, optikai, drága, nagy távolság Cache méret: 16-32 MB Raid Edition: speciálisan szervergépekbe szánt változat Jobb mechanikai kialakítás Nagyobb cache Speciális firmware Memória: gyors, drága : olcsó, de lassú 100-150 MB/s ADAT MEMÓRIA DISZK RANDOM IO SZEKVENCIÁLIS IO 1 TB-os diszk beolvasása: szekvenciális olvasáskor: 4,5 óra random olvasáskor: 15-150 nap SSD? 1

7 8 Merevlemezek meghibásodása SSD-k paraméterei Vezérlő áramkör Teljes lemezt elérhetetlen Áramkör cserével a meghajtó még talán olvashatóvá tehető (egyszerűbb) Lemez fizikai meghibásodása Általában ponthibák A vezérlő logika legtöbbször automatikusan képes javítani, ha a hiba lokális A javítás időbe telik (másodpercek át kell másolni mindent egy hibátlan helyre) Bit rotting Ellenőrzőösszeg (checksum) Mechanikai meghibás Motor, csapágy, fejmozgató mechanika Az adatok mechanikai javítás után még olvashatóvá tehetők (bonyolult) S.M.A.R.T. Self-Monitoring, Analysis, and Reporting Technology Információt nyújt a meghajtó fizikai állapotáról Működési statisztika, hőmérséklet, hibás szektor arány stb. Az előre várható hibákból eredő adatvesztések elkerülését segíti Flash memória Félvezetőből kialakított háttértároló, nincsen mozgó alkatrész Alacsony fogyasztás Nagy sebesség Tipikusan 150-200 MB/s, de nem konzisztens 0 ms random elérési idő Egyelőre nem túl nagy méret: 250 GB / egység Problémák az írással: A flash memória íráskor öregszik Egyszerre csak komplett blokkok írhatók Nagyon drága Strapabírásuk nem igazán ismert 9 10 Interfészek, protokollok SATA: serial advanced technology attachement Asztali és laptop gépekhez fejlesztve 1.5-6 Gb/s soros adatátvitel 1 m hosszú kábel diszkenként egy kábel SCSI: Small Computer System Interface Munkaállomásokhoz és szerverekhez 1.2-5 Gb/s párhuzamos adatátvitel 12 m hosszú kábel több eszköz sorban felfűzve drága Fiber Channel Optikai link, főleg NAS (network attached storage) megoldásokhoz, drága iscsi SCSI protokoll hálózaton keresztül NAS SAS: Serial Attached SCSI SATA hardver + SCSI protokoll 3-6 Gb/s soros adatátvitel 10 m hosszú kábelek Multiplexer, backplane támogatás SATA lemezekkel kompatibilis (olcsó) 11 12 Alapprobléma Különálló diszkek esetében olvasás/írás szekvenciálisan sem túl gyors p(hiba) nagy 2TB egyben nem feltétlenül elég Redundáns rendszert akarunk Gyors rendszert akarunk Nagy kapacitást akarunk több diszket összekapcsolni Hardveres megoldás: RAID Szoftveres megoldás: redundáns fájlrendszerek Alapfogalmak Fizikai lemez RAID JBOD Virtuális lemez Kötet (volume) Kötet menedzser Partíció Fájlrendszer Blokk méret Paritás bit Hot-swap Hot-spare SATA SAS SCSI 2

13 14 RAID RAID: redundant array of identical drives Több lemezegység logikai összekapcsolása kötetekbe (volume) Cél: Gyorsabb adatelérés Redundancia: egy vagy két lemez meghibásodása nem okoz adatvesztést (de teljesítmény csökkenést általában igen) Nagyobb kapacitás Szoftveres: a szükséges számolást a CPU végzi olcsó megoldás munkaállomásokba, kis szerverekbe Az operációs rendszer különálló lemezeket lát Hardveres RAID vezérlő kártya (alaplapi vagy bővítő, PCI-e x8, x16) A számolást a RAID kártya processzora végzi Általában nagy cache Back-up akkumulátort igényel Az operációs rendszer felé egybefüggő, nagy kapacitású lemez látszik RAID Redundant Array of Identical Drives Több (azonos) lemezegység összekapcsolása Az OS számára virtuális lemezként látszik Célok: Gyorsabb adatelérés Redundancia: egy lemez meghibásodása ne okozzon adatvesztést Nagyobb kapacitás 15 16 RAID gyorsabb adatelérés RAID - redundancia Sebességet korlátozza Lemez fordulatszáma Bitsűrűség Több lemez párhuzamos olvasása/írása: Szekvenciálisan olvasandó adat nem egy lemezen folytonosan, hanem csíkokra (stripe) vágva, lemezek között elosztva A sebesség a lemezek számával (arányosan) nő Korlátozó tényezők: diszkvezérlő sávszélessége tipikus SAS vezérlő: 2GB/s csatlakoztatható diszkek száma Egy (vagy több) lemez kiesése ne okozzon adatvesztést Az adatokat többször kell tárolni Teljes tükrözés (mirror), vagy Paritás bitek tárolása Minél nagyobb redundanciát akarunk, annál kisebb lesz a hasznos tároló kapacitás A maximális méretet a legkisebb lemez mérete határozza meg 17 18 RAID konfigurációk: RAID 0 RAID konfigurációk: RAID 1 stripe = csíkozás mirror = tükrözés Az adatokat úgy osztja el két vagy több lemez között, hogy a lemezekről párhuzamosan olvasva nagyobb sebességet lehessen elérni Teljes kapacitás: C total = n disk C disk Nem redundáns, sőt: p failure = n disk p failure,disk Forrás: Wikipedia Az adatokat tükrözi két lemezen úgy, hogy ha az egyik elromlik, akkor a másikról az adatok még elérhetőek Teljes kapacitás: C total = n disk C disk / 2 Redundáns: p failure = (házi feladat) Forrás: Wikipedia 3

19 20 Paritásbitek 1. diszk: 10011101 2. diszk: 11001001 XOR: 01010100 A 3. diszken tárolva Hiba esetén helyreállítás: Általánosítás n diszkre: n bitből páros vagy páratlan számú 1-es bit van? Egy diszk kiesésekor még visszaállítható az adat RAID konfigurációk: RAID 5/6 RAID-5: Minimum három lemez Paritás bitek a lemezeken elosztva Egy lemez kiesését viseli el RAID-6: Minimum négy lemez Paritás bitek két lemezen Két lemez egyidejű kiesését viseli el 1. diszk: 10011101 3. diszk: 01010100 XOR: 11001001 Pont ez volt a 2. diszken! Azt, hogy melyik diszk hibás, máshonnan tudjuk, ez a paritásbitekből nem található ki Általánosítható úgy, hogy több diszk kiesését elviselje. Forrás: Wikipedia 21 22 RAID konfigurációk: RAID n+0 RAID írása, késleltetés (latency) A csíkozás és tükrözés összekapcsolása Csíkozás két RAID kötet fölött Minimum négy lemez (1+0) Csak olvasáskor gyorsabb, íráskor mindkét kötetet párhuzamosan írni kell Teljes kapacitás: C total = C RAIDn / 2 Redundáns: p failure = (házi feladat) Egyszerre több diszket kell írni Meg kell várni, míg a lemez a megfelelő blokkhoz fordul ehhez átlagosan ennyi fordulat kell: <r> = 1 2 n Γ = fordulatszám <l> = átlagos késleltetés: <l> = <r> / Γ Tipikus értékek: Γ = 7200 RPM, <l> = 4.2 ms Több lemez esetén, mire az összes lemez a megfelelő blokkhoz fordul: <r> = 1 2 n ek száma SSD: Átlagos késleltetés (fordulat) 1 0.500 2 0.750 3 0.875 4 0.938 5 0.969 6 0.984 7 0.992 8 0.996 0 latency nagy lehetőségek a jövőben! 23 24 A paritásbitek felírása drága A1 egy része megválzott (a memóriában van az új adat) A1-et írni akarjuk A p -t újra kell számolni Szükség van: A1 régi értékére és A p -re Műveletsor: Olvasd be A1-et (régi érték) Olvasd be A p -t Számold ki az új A p -t Írd ki A1-et (új érték) Írd ki A p -t RAID írásának gyorsítása Cache használata A két olvasási művelet megspórolható, ha az adat a cache-ben van Write back cache használata Az adat csak a cache-be íródik Csak később kerül ki a diszkre Csökkenthető a késleltetés 4

25 26 RAID írási lyuk Write hole Több lemezt írása nem atomi művelet! Mi van, ha írás közben hiba történik? Megsérül a lemez Áramkimaradás történik Sérült lemez át kell írni a blokkot máshova Áramkimaradás Szünetmentes tápegység Battery Back-up Unit (BBU) használata Frissíti a RAID cache-t, míg az áram visszajön RAID rendszerek adatbázisoknál Tudományos adattárak Olvasás jóval gyakoribb, mint az írás Hosszú szekvenciális műveletek RAID 5 a nagy tárterületért Adatbetöltéskor write through cache használata Tranzakció-kezelő rendszerek Sok apró írás RAID 1+0 a nagy sebességért Write back cache használata 27 28 RAID mőveletek RAID megvalósítása Kötet újraépítése Időzített járőrözés Szoftver RAID Hardver RAID volume rebuild Ha megsérül egy lemez a köteten belül, akkor a hardver egység cseréje után a logikai kötetet újra kell építeni Az újraépítés jelentős időbe kerül, o(10 óra), a lemez méretétől függően A RAID vezérlők támogatják az ún. meleg tartalék (hot-spare) lemez kijelölését, amik rögtön a kiesett lemez helyébe lépnek, és elindul az újraépítés patrol read, scrubbing Az, hogy egy lemez meghibásodott, sokszor csak akkor derül ki, amikor az adatokat olvasni akarjuk Bit rotting Hogy ez időben kiderüljön, rendszeresen végig kell olvasni a lemezeket Szükséges számolást a CPU-n Olcsó megoldás: munkaállomásokba, kis szerverekbe RAID 5,6 stb. nagyon lassú Nincsen dedikált cache Nincsen BBU Az OS különálló lemezeket lát Volume manager fűzi össze Dedikált RAID vezérlő kártya Számolás IOP végzi Gyakran drága Gyors RAID 5,6 Hardver szintű optimalizálási lehetőség pl. latency csökkentése Nagy cache (256-512 MB) Gyors írás, adaptív előreolvasás BBU lehetőség Az OS egybefüggő nagy lemezt lát 29 30 Tipikus RAID problémák RAID hardver elemei Hamis biztonságérzetet ad Kompatibilis diszk hiánya Régi RAID kötetekhez nem lehet új diszket kapni, Lassú kötet újraépítés ilyenkor célszerű a teljes rendszert lecserélni Ha az újraépítési idő alatt még egy lemez tönkre megy, akkor az teljes adatvesztést okoz Sok lemez esetén okoz nagy gondot Cache szünetmentes tápjának (BBU) hiánya Write-back algoritmussal dolgozó cache esetén a RAID 6 jó megoldás RAID vezérlő az írási műveletet készre jelenti, ahogy az adat beíródott a cache-be. Ekkor még nem íródott ki a változás a diszkre, de az Korrelált meghibásodások operációs rendszer mégis úgy tudja. A diszkek általában azonos gyártási sorozatokból Áramkimaradás esetén a cache tartalma elvész, az valók adatok inkonzisztens állapotba kerülnek. A meghibásodások egyszerre több diszken jelentkeznek Sok diszk A második diszk újraépítés közben hibásodik meg Nem elég nagy a számítógépház Nem elég nagy a tápegység teljesítménye RAID vezérlő kártya hibája (ritka) Külső RAID házak használata Teljes adatvesztést okozhat Túl sok a kábel A kártya nem mindig cserélhető (régi típus) Multiplexeres backplane használata A lemezen használt formátum gyártó specifikus, Gyakori diszk csere, a gépet nem lehet leállítani az elveszett adatokat csak speciális szoftver tudja Hot-swap visszaolvasni SAS alapon SBB: storage bridge bay nyílt szabvány: SAS vezérlő (akár RAID-del) 4 SAS linkek Multiplexeres backplane RAID dobozok Szerver PCIe RAID vezérlő 4 SAS 4 SAS Backplane + Multiplexer 5

31 32 RAID rendszer belsı diszkekkel RAID rendszer külsı diszkekkel Belső RAID vezérlő PCIe SATA / SAS Szerver ház Alaplap Külső RAID vezérlő PCIe 4 SAS Alaplap Szerver ház Enclosure Manageme nt Module (EMM) RAID ház Backplane 33 34 Szoftver rétegek Adatbázis szerver Fájlszerver Webszerver Fájl API FS FS Fájlrendszer (file system = FS) Partíció Partíció Kötet Fizikai vagy virtuális (HW RAID) diszk Fizikai vagy virtuális (HW RAID) diszk Fizikai vagy virtuális (HW RAID) diszk 35 36 Fogalmak Redundáns kötetek Partíció: egy fizikai vagy virtuális diszk több partícióra osztható pl.: rendszer, adat Logikai kötet: Szoftveres megoldás több lemez összekapcsolására Szoftver RAID vagy redundáns kötet Fájlrendszer Könyvtárak és fájlok logikai megvalósítása a partíciók vagy kötetek fölött Blokkméret: minimum írás/olvasás mérete Fájlok blokkokból épülnek fel FAT32, ext2, ext3, NTFS stb. Fájl API A különböző fájlrendszereket logikai szempontból egyesítő könyvtárak Hardver RAID Drága, nem elég flexibilis Szoftver RAID Hardver RAID olcsó imitációja, lassú JBOD: just a bunch of disks az OS csak önálló lemezeket lát, nincsen RAID vezérlő Szoftveres megoldás a RAID kiváltására? zvol: 2005 (Sun, ma Oracle) Storage Spaces: 2012 (Microsoft) Kapcsolódó modern fájlrendszerek ZFS - Solaris BTRFS - Linux ReFS Windows 8 Server Fa alapú Nem adatbázisokhoz Slab: alapvető logikai egység hasonló a RAID blokkhoz tipikus méret 256-512 MB tükrözés vagy paritásbitek Nagy méretek támogatása (zettabájt) FS provisioning a fájlrendszer csak annyi helyet foglal, amennyi adatot írunk rá elég később hozzáadni a szükséges lemezeket ek dinamikusan hozzáadhatók, elvehetők legkisebb diszk mérete nem korlátozó tényező Scrubbing bithibák detektálására a háttérben fut 6

37 38 Fájl API Bufferelt Az adatok először egy átmeneti memória bufferbe kerülnek A szükséges memóriaterület ezután átmásolódik a függvénynek megadott címre Tetszőleges számú bájt, tetszőleges fájlpozíciónál Nem bufferelt Az adat közvetlenül a megadott memóriacímre másolódik a diszkről Csak blokkméret többszöröse (512 B) Blokk kezdetéhez igazítva Sokkal gyorsabb, mint a bufferelt (Benchmarking) Szinkron / aszinkron A függvényhívás mikéntje Aszinkron hívásnál párhuzamosan sok olvasási kérést is indíthatunk Függő műveletek [outstanding I/O] Hány kérés lehet egy időben folyamatban RAID kártyák 8-16-ot hardveresen támogatnak a többi kérés sorba rendezését az API valósítja meg 39 40 I/O Teljesítménymérés Miért mérünk? Választani akarunk az egyes gyártók közül Meg akarjuk határozni az adott konfiguráció optimális beállításait Pontosan kell definiálni A rendszer próbaterhelésének mikéntjét A mérés módját Ehhez ismerni kell az adatbázis majdani felhasználását, de általánosságban igaz: Adattárháznál szekvenciális I/O-ra megyünk Mit akarunk optimalizálni? Lemezek száma, mérete, sebessége Több lemez több tengely gyorsabb A gyorsabb lemez (10k RPM 2.5 ) kisebb kapacitású RAID szint Mekkora redundanciára van szükség Mennyit fogjuk írni az adatbázist Több RAID konfigurációt is használható egy szerveren belül A RAID cache üzemmódja menet közben is változtatható Csíkok mérete, fájlrendszer típusa, blokkmérete stb. Ezt az adatbázis lapméretéhez kell állítani (ld. később) 64 kb 41 42 Mit tudunk mérni? Sebesség [MB/s] Késleltetési idő (latency) [s] I/O művelet [1/s] Processzor használat Függő műveletek száma Paraméterek: Olvasás / írás Szekvenciális / random Bufferelt / nem bufferelt Beolvasott/írt blokkok mérete Csíkméret Függő műveletek száma Mérések módja Mindent többször mérünk Felvesszük a mért értékek eloszlását Ha nem gaussi, akkor megnézzük miért Mivel korrelál egy adott mérési érték? Ha gaussi, akkor megadhatjuk a relatív hibát Egy adott terhelési mintázat lehet a fentiek valamilyen arányú kombinációja 7

43 44 Hálózatok alapjai Fizikai réteg Kábel típusa: réz, optikai Átviteli sebesség [bit/s] Átviteli távolság Topológia Csillag, gyűrű, nagy gráf Szoftver réteg Hálózati kártya meghajtó Protokoll TCP/IP, stb. OS hálózati réteg Hálózati API (programkönyvtár) 45 46 Lokális hálózat Ethernet 100 Mb/s, 1 Gb/s, 10 Gb/s UTP kábel néhányszor 10 méter Általában TCP/IP InfiniBand Maximum 96 Gbit/s elméleti sebesség (sok kábel) Maximum 15 méter távolság Speciális protokoll igény, de TCP/IP over IB támogatott Külvilági kapcsolat Internet Mindig túl lassú TCP/IP Folytonos adatátvitelre TCP vagy UDP alapú speciális protokoll Speciális adatátviteli protokollok BitTorrent (akár csak két pont között!) FDT (Cern) Java UDP alapú UDT: A TCP-nél gyorsabb adatátvitelre jó [Grossman et al. 2003] Dedikált kapcsolat Garantált állandó vagy garantált minimum sebesség Drága, és nehéz jól kihasználni Használható saját speciális protokoll 47 48 A TCP/IP problémái Kis sebességre és kevés adatra tervezték A sávszélesség nem feltétlenül jelent átviteli sebességet A késleltetés erősen le tudja csökkenteni az adatátvitelt (TCP/IP nagy problémája) Alapértelmezett értékek variálásával némileg javítható (frame mérete, buffer mérete) Hibaellenőrző kód nem elég erős: Véges valószínűséggel kerülhet hiba az átvitt adatba, ha az adatmennyiség nagy Az adatbázis szerver szoftverek nem támogatnak speciális protokollokat Klaszterek, felhık Számítógép klaszter (Beowulf): Azonos hardver sok processzorral Minimális háttértár az egyes gépekben Központi, hálózaton elérhető nagy háttértár Blade-server kialakítás optimális Garantált, nagy sebességű helyi hálózat Adatintenzív alkalmazásokhoz nem optimális Számítási felhő Szolgáltatók által nyújtott lehetőség (Amazon, Google, MS) Virtualizált platform + fejlesztőeszközök Központi, hálózaton elérhető nagy háttértár Adatintenzív alkalmazásokhoz nem optimális Graywulf Dedikált szerverfarm, dedikált hálózattal Minden elem egy önálló nagy teljesítményű adatbázis szerver Adatintenzív alkalmazásokra optimalizálva 8

49 50 Fogyasztás és környezetvédelem Adatbázis rendszerek az ELTÉ-n Fogyasztási adatok: Alaplap: 50-100 W Processzor: 80-150 W HDD: 15 W SSD: 1-2 W GPU: 50-150 W Könnyen összejön 1,5 2 kw szerverenként Hőként szabadul fel Szünetmentes tápban nagy akkumulátorok Léghűtés: zajos, hangszigetelés szükséges A szerverszoba hűtést igényel Légkondicionáló hatásfokát figyelembe véve a fogyasztás / számítási teljesítmény arány tovább romlik Megoldási lehetőségek: Vízhűtés Hűtővíz felhasználása fűtésre Energiatakarékos üzemmód 5 év után elavul az egész rendszer: veszélyes hulladék Regionális Egyetemi Tudásközpont adatbázis központja 3 db Dell PE 2950 szervergép 2 x 4 magos Intel Xeon 16 GB RAM 2 x Dell PERC 6/e RAID vezérlő 6 db Dell PV MD-1000 tároló egység Egyenként 15 db 750-1000 GB-os diszk Összesen kb. 1 TFLOP/s számítási kapacitás 50 TB redundáns tároló kapacitás 3500 MB/s szekvenciális olvasási sebesség Windows 2008 Server + SQL Server 51 52 Adatbázis rendszerek az ELTÉ-n Informatika doktori iskola 5 db Supermicro SBB két gép egy házban (összesen 10 gép) 2 x 6 magos Intel Xeon i7 (összesen 120 mag) 24 GB RAM LSI 2008 SAS vezérlő 100 TB diszk Debian Linux Különböző szintű szoftver RAID konfigurációk Miért nem érdemes sok merevlemezt egy tengelyen elhelyezni? Számítsd ki a RAID 1 és a RAID 1+0 konfigurációk meghibásodási valószínűségét, ha egyetlen lemez meghibásodási valószínűsége egy adott időintervallumban p disk, a lemezek száma pedig n. Egy hálózati protokoll úgy működik, hogy a továbbítandó pufferben tárolt adatot csomagokra bontja, majd ezeket egymás után továbbítja. A csomagok a fogadó állomáshoz tetszőleges sorrendben érkezhetnek a hálózati késleltetések miatt. A fogadó állomás a teljes puffer átvitele után a csomagokat sorba rendezi, majd a hibaellenőrző kód segítségével leellenőrzi, hogy sikeres volt-e az átvitel. Ezek után a küldő állomást tájékoztatja, hogy az átvitel sikeres volt, és jöhet a következő átviteli adag. Mi az optimális puffer méret, ha a hálózat sebessége és az átviteli csatorna késleltetése (az az idő, amíg egy kérésre válasz érkezik) adott. Hogyan változik az optimális puffer méret, ha az átviteli csomagok p valószínűséggel elvesznek a továbbítás során? 53 9