R-es domedá esete a sivatagban a R-eekkel el a kezekkel, R! kiszolgálókban mindennapos a R használata, gyakan azonban alkalmazói sincsenek egészen tisztában azzal, hogy pontosan mit, illetve miét használnak. cikkben összefoglalom mindazt, amit a R-ôl tudni édemes. Töténelem 1988-ban a S konfeencián avid. Patteson, ath. ibson és Randy. atz egy igen édekes anyagot publikált ase fo Redundant ays of nexpensive isks (R) címmel. [1] bben az anyagban jelent meg elôszö a R kifejezés, melynek köülbelüli fodítása olcsó edundáns diszktömbök. z a publikáció, illetve ennek a technikai megvalósítása foadalmasította a számítóközpontok adattáolási eljáásait. R szinte minden kiszolgálóban megtalálható valamilyen fomában. diszkek és a vezélôk áának esésével, illetve az otthon táolt anyagok mennyiségének és minôségének növekedésével egye több munkaállomásban is találkozhatunk valamilyen R megoldással. R technológia a diszkekôl áttejedt más adathodozóka is. a má léteznek különféle megoldások egyéb adattáoló eszközöke, amelyek R technológiát használnak. (pl.: szalagos eszközök,, V ) gyenge láncszem a diszk diszkek a számítógépek gyenge láncszemei. diszk lassú peiféia, az itt táolt adatok elééséhez számottevôen több idôe van szükség, mint a memóia esetében. diszk dága eszköz, mégis olcsóbb, mint a memóia. iszkekbôl jóval nagyobb kapacitású egységek készülnek, mint például memóiából, ezét is használják nagy tömegû adat táolásáa. miko csupán egyetlen diszkje volt egy számítógépnek, akko az adatok épsége a diszk épségén múlott. a elomlott a diszk ami gyakan elôfodulhatott, hiszen mozgó alkatészeket, villanymotot stb. tatalmazó, összetett, ézékeny beendezésôl van szó az adatok odalettek. lyenko kellett a mentésbôl ha volt visszaállítani az adatokat. nnek a módszenek számos hátánya is van: visszaállítás lassú folyamat visszaállítás idôtatama alatt a endsze nem eléhetô legutóbbi mentés és a hiba fellépése közötti idôszak adatai elvesznek Több diszk több pobléma miko több fizikai diszket teszünk egy gépbe, akko számos kellemetlen poblémába ütközünk: diszkek külön teületként láthatóak melyik adat hová keüljön? melyik adat hová keül automatikusan? ha van egy és egy méetû diszkem, akko sem tudok ajuk táolni egy (ahol > és > és <+) méetû állományt. a kézzel pogammal másolgatom az állományaimat a diszkek között és az adatdiszk elomlik, akko a másolataim eléhetôek? a az opeációs endsze diszk omlik el, akko nem indul el a gép automatikusan, hiába vannak a másolatok. 0+1, 53, 5, 0 és hasonló R elnevezések. it jelentenek? ie jó ez? tt az ideje, hogy endet akjunk! egoldás a R! ie is? Sok poblémáa megoldást jelent a R. ézzük át ezeket a megoldásokat! Sok kicsi soka megy Több fizikai diszket összefûzve egy nagyobb egybefüggô diszkteületet kapunk. Így kisebb diszkeken is táolhatunk nagy állományokat elosztva. z így összefûzött diszkek tanszpaensek, azaz egy nagy logikai diszkként láthatóak. sebesség mámoa gy diszknek adott a meglehetôsen lassú sebessége. a az adatokat több lemeze íjuk ki, és azokat egyszee olvassuk, akko adott idô alatt több adatot tudunk beolvasni. a ez a folyamat tanszpaens, azaz a több lassú diszk egyetlen logikai diszkként látszik, akko annak a sebessége gyosabb lesz, mint az azt alkotó fizikai diszkeké. incs veszve minden a egy adatot több diszke is felíunk, akko nincs nagy baj, ha egy közülük elomlik, hiszen az adat biztosan megvan egy másik diszken is. a ez a folyamat tanszpaens, akko a 1 0 0 % T Ó 0 % R T 2 0 0 5. 0 1. 29
megbízhatatlan diszkek egy jóval megbízhatóbb logikai diszkként láthatóak, melyen az adataink nagyobb biztonságban vannak. hibás egység kicseélése után a endsze eléhetô akko is, amiko a kicseélt diszke az adatok visszaállítása folyik. (egfeljebb a endsze teljesítménye csökkenhet eközben.) R elméleti módszeei Tüköm tüköm z adatvédelem egyik módszee, hogy a védeni kívánt adatokat több példányban is automatikusan táoljuk: tüközzük. ehet teljes diszktatalmakat tüközni, vagy csak egyes adatcsopotokat. z aktív tükönek mindkét példánya használható olvasása, így ez sebességnövekedést is eedményez olvasásko. passzív tükönek csak a mestepéldánya íható olvasható, a segédpéldány csak a mestepéldány meghibásodása után használható. tüközés hátánya, hogy minden adat kétsze van táolva. Így kétsze akkoa helyet is foglal el. Vaázsoljunk! avító és ellenôzô kódok tüközés helyigényének méséklésée különféle technikákat találtak ki. zek lényege, hogy a táolni kívánt adatból valamilyen eljáással egy kódot képeznek, ami kevesebb helyet foglal el, mint maga az adat. kód alkalmas lehet hiba detektálásáa, vagy hiba javításáa is. hibadetektáló kódok jelezni képesek, ha a megadott adat és a kód nem egyezik, míg a hibajavító kódok segítségével a séült, illetve hibás adatok bizonyos feltételek teljesülése esetén visszaállíthatóak. gységnyi sugaú diszk legtöbb R megoldásban azonos méetû (és ha lehet, típusú) diszkek használata támogatott és ajánlott. adve vs szoftve legtöbb R típus szoftvees és hadvees megoldással egyaánt megvalósítható. Szoftvees megvalósítás esetén az opeációs endsze a fizikai diszkeket látja, nem szükséges hozzá speciális hadve, a nomál diszkvezélôk használhatóak. logikai diszkek létehozását, menedzselését az opeációs endsze végzi.zek a megoldások általában lassabbak, mit a hadvees R megoldások, a endsze eôfoásait (PU, memóia) használják. hadvees R megoldások speciális hadveeszközt, R vezélô kátyát igényelnek. fizikai diszkek kezelését, a diszkmenedzsmentet a vezélôkátya végzi, saját eôfoásait (PU, memóia) használja. zek a megoldások ezét általában gyosabbak, mint a szoftvees megoldások. R vezélôk használatához speciális meghajtópogamok használatáa lehet szükség, ámbá léteznek teljesen tanszpaens vezélôkátyák, melyekhez nincs szükség speciális szoftvee. R vezélôkátyák á/teljesítmény/tudásszintje endkívül sokféle lehet, különféle feladatokhoz különféle kátyák találhatóak a piacon. elegen ajánlva hadvees megoldások másik nagy elônye a melegen cseélhetô (hot swap) funkció. z lehetôvé teszi, hogy az elomlott diszkeket menet közben, a gép kikapcsolása nélkül foón cseélhessük, így még nagyobb endelkezése állás éhetô el. elegtatalék hadvees és a szoftvees megoldások általában lehetôvé teszik az ún. melegtatalék diszkek használatát. z egy további diszk, amely üesen installálva van a R endszebe, majd valamelyik használatban levô diszk meghibásodása esetén automatikusan átveszi annak a helyét, a hibajavítás automatikusan megkezdôdhet a hiba detektálásako, így nem kell váni a meghibásodott diszk megjavításáa. átánya, hogy ez a diszk is be van kapcsolva, pöög, öegszik a többi lemezzel együtt, illetve,(fizikai és logikai) helyet foglal, valamint a hasznos kapacitást nem növeli. ézzük át a R típusokat! R típusok év ngol név agya név Redundancia inimum diszk szám asznos teület 1 ust a unch of isks összefogott diszk nincs 2 n*m 2 R 0 Stiped isk ay without ault Toleance síkozott diszk tömb nincs 2 n*m 3 R 1 ioed isk (uplexed disk) Tüközött (duplikált) diszk tömb van 2 n/2*m 4 R 2 o-oecting oding (amming code ) hibajavító kódolás van 4 5 R 3 it-nteleaved Paity (Richad. Pice Paity, it-paitásos paallel tansfe with paity) páhuzamos átvitel van 3 (n-p)*m 6 R 4 ndependent ata disks with shaed paity disk üggetlen diszkek (edicated Paity dive, lock-nteleaved Paity) dedikált paitásdiszkkel van 3 (n-p)*m 7 R 5 ndependent ata disks with distibuted paity üggetlen diszkek blocks (lock nteleaved istibuted Paity) elosztott paitásblokkokkal van 3 (n-1)*m 8 R 6 ndependent ata disks with ouble paity üggetlen diszkek dupla paitásblokkokkal van 4 (n-2)*m 9 R 7 ptimized synchony fo igh / Rates as well as igh ata Tansfe Rates van g (n-p)*m 10 R 10 Stipe of ios síkozott tükö tömbök van 4 n/2*m 11 R 0+1 io of Stipes Tüközött csíktömbök van 4 n/2*m 12 R 45 ombination of R 4 and R 5 R 4 és R 5 kombinációja van 4 (n-2)*m 13 R 50 Stipe of R 5 R 5 tömbökbôl álló csíktömb van 6 (n-2)*m 14 R 53 Stiped R3 (R 03) síkozott R3 tömb van 5 (n-3)*m n: diszk száma, p: paitásdiszk száma, m: diszk méete, g: megvalósítástól függ 30 1 0 0 % T Ó 0 % R T 2 0 0 5. 0 1.
(ust a unch of isks) Összefogott diszk. izikai diszk Tulajdonképpen ez nem is R megoldás. logikai kapcsolat okán keült mégis az elsô helye. belôle képzett logikai diszk méete a diszkek fizikai méetének összege. gyszeûen összefûzi a kisebb diszkeket, így egy nagy, összefüggô diszkteületet látunk. inimum két diszkbôl képezhetô. diszkek különbözô méetûek lehetnek Temészetesen edundanciát nem tatalmaz, azaz bámelyik diszk meghibásodása esetén a teljes logikai diszk tatalma elvész. Például egy 15 + 20 diszkbôl egy 35 logikai diszk képezhetô. R 0 (Stiped isk ay without ault Toleance) síkozott diszk tömb izikai diszk Tulajdonképpen ez sem R megoldás, met nem edundáns stuktúa. z adatokat blokkoka tödelik, a diszkeket azonos méetû blokkoka osztják fel. z egymást követô adatblokkokat külön diszkeke íják fel. inimum két diszkbôl képezhetô. lônyök: páhuzamos diszkmûveletek miatt a logikai diszk sebessége lényegesen nagyobb lehet, mint az azt alkotó fizikai diszkek teljesítménye. teljesítmény tovább növelhetô, ha a diszkeket külön vezélôke, illetve több csatonás vezélô esetén külön csatonáka kötjük. gyszeû megvalósíthatóság Redundanciát nem tatalmaz, azaz bámelyik diszk meghibásodása esetén a teljes logikai diszk tatalma elvész. lkalmazási teület: inden olyan átmeneti táolóteület, amelynek tatalma nem fontos, nem mentendô. deiglenes munkateület videó vágás, feldolgozás R 1 (ioed isk (uplexed disk)) Tüközött (duplikált) diszk tömb 1. t ü k ö p á 2. t ü k ö p á izikai diszk z adatok két példányban táolódnak, a példányokat külön diszkeken táolják. inimum két diszkbôl képezhetô. Páos számú diszkkel bôvíthetô. passzív R 1 megoldás esetén egyszeûen minden adatot az adatdiszke és a tüköpájáa ínak. z aktív R 1 megoldásokban egy tüköpáól egy idôben 2 olvasási mûvelet, vagy egy íási mûvelet hajtható vége, ami a logikai diszk sebességét növeli a fizikai diszkhez képest. lônyök: lvasási teljesítménye nagyobb, mit az építôelemként felhasznált diszkeké (aktív R 1 esetén). gyszeû megvalósíthatóság. eghibásodás esetén nincs jelentôs teljesítménycsökkenés (az íás tekintetében) gyszeûen, komoly eôfoásigény nélkül helyeállítható. gy diszk meghibásodása esetén az adatok 100 százaléka endelkezése áll, nincs adatvesztés, üzemidô kiesés. Speciális (szeencsés) esetben több diszk egyidejû meghibásodása esetén is üzemképes maad. (Több tüköpá esetén feltételezve azt, hogy minden pának legfeljebb csak az egyik tagja hibásodik meg.) R alendszeek közül a legmagasabb a diszk költség (100 százalék tatalék), illetve legmagasabb a kapacitás veszteség a logikai és a fizikai diszkteület között. (sak a fizikai diszkteület 50 százaléka használható fel.) lkalmazási teület: agas endelkezése állást igénylô alkalmazások. Üzleti alkalmazások R 2 [o-oecting oding (amming code )] ibajavító kódolás z adatokat adatdiszkeke íják. z adatokból hibajavító kódot [2] számol a vezélô az íási folyamat soán, ezt különálló diszkeke ögzíti. z olvasási folyamat soán az adatdiszkôl olvasott adatokból szintén elôállitja a vezélô az kódot, amit összehasonlít az diszkôl visszaolvasott kóddal. Röptében képes a helyes adatokat visszaállítani egy adatdiszk meghibásodása esetén. em tejedt el, nem használják széles köben. 1 0 0 % T Ó 0 % R T 2 0 0 5. 0 1. 31
lônyök: Röptében képes adatok visszaállításáa yos mûködés gyszeûbb vezélô felépítés mint a R 3, 5, 6 esetében. nduló költség magas agy adatátviteli sebessége van szükség az vezélô és az diszkek között. lkalmazási teület: em jellemzô üzleti célú felhasználása. R 3 [it-nteleaved Paity (Richad. Pice Paity, paallel tansfe with paity)] it-paitásos páhuzamos átvitel 0 0 0 0 0 1 1 1 1 1 izikai diszk 2 2 2 2 2 3 3 3 3 3 1. sík 2. sík 3. sík 4. sík sí ás k pzés p p p p p z is egy paitás alapú R technológia, a R 2 egyszeûsített változata. R 3 alapja egy csíkozott diszk tömb (R 0). z adatokat az adatdiszkeken blokkoka bontva, csikokban táolják. Íásko minden csíkhoz egy csikpaitás éték keül kiszámítása. z a külön dedikált paitásdiszken keül eltáolása. lvasásko a csíkokól beolvasott adatokból úja kiszámítása keül, majd a paitásdiszkôl beolvasott étékkel összevetve lehet az adat helyességét ellenôizni. inimum háom diszkbôl képezhetô. lônyök: csíktömb elônyét magában hodozza: a páhuzamos diszkmûveletek miatt az olvasási sebesség jelentôsen nô. gy diszk meghibásodása esetén az összes adat endelkezése áll. diszkhiba nem befolyásolja jelentôsen a tömb teljesítményét. hasznos táteület / fizikai táteület aány jó (viszonylag kevés teülete van szükség a paitás táolásáa). onyolult technikai kivitelezés (bonyolult vezélô, vagy bonyolult szoftvees megoldás). logikai diszk tanzakciósebessége a tömböt alkotó fizikai diszk tanzakciósebességét éheti el legjobb esetben. is blokkok, kis adatcsomagok esetén nem elég effektív. lkalmazási teület: agas endelkezése állást igénylô alkalmazások. lsôsoban szupeszámítógépekben használatos technológia. R 4 [ndependent ata disks with shaed paity disk (edicated Paity dive, lock-nteleaved Paity)] üggetlen diszkek dedikált paitásdiszkkel 0 0 0 0 0 z adatok blokkoka osztva az adatdiszkeke keülnek kiíása. paitásblokkok a R2 és R3-hoz hasonlóan keülnek számítása, itt az összetatozó blokkokból, majd a dedikált paitásdiszken keülnek táolása. lvasásko az adatokból számított paitásblokk keül összehasonlítása a paitásdiszkôl beolvasott blokkal. inimum háom diszkbôl képezhetô. lônyök: yos olvasási sebesség hasznos táteület / fizikai táteület aány jó. (Viszonylag kevés teülete van szükség a paitás táolásáa.) agas aggegált olvasási teljesítmény onyolult technikai kivitelezés (bonyolult vezélô, vagy bonyolult szoftvees megoldás) Rossz íási teljesítmény iszkhiba esetén bonyolult és eôfoás-igényes a tömb helyeállítása blokkolvasási teljesítmény a fizikai diszk teljesítménye Tanzakció alapú endszeekhez nem megfelelô a teljesítménye lkalmazási teület: em jellemzô üzleti célú felhasználása. R 5 [ndependent ata disks with distibuted paity blocks (lock nteleaved istibuted Paity)] üggetlen diszkek elosztott paitásblokkokkal 0 1 2 3 4p 1 1 1 1 1 0 1 2 3p 4 izikai diszk 2 2 2 2 2 izikai diszk 0 1 2p 3 4 3 3 3 3 3 1. lokk 2. lokk 3. lokk 4. lokk lokk Paitás képzés 0 1p 2 3 4 0p 1 2 3 4 p p p p p. lokk. lokk. lokk. lokk. lokk bben a megoldásban szintén paitásblokk alapú a edundancia. z adatok és a paitásinfomációk nem külön, hanem az adatokkal megosztva keülnek táolása. z adatok blokkoka osztva íódnak a diszkeke. paitásblokkok a R2 és R3-hoz hasonlóan keülnek számítása az összetato- 1 Paitás képzés 32 1 0 0 % T Ó 0 % R T 2 0 0 5. 0 1.
zó blokkokból, majd a diszkeken elosztva keülnek táolása. lvasásko az adatokból számított paitásblokk keül összehasonlítása a beolvasott paitásblokkal. inimum háom diszkbôl képezhetô. logikai diszk maximális méete a tömböt alkotó aktív diszkek száma 1. (eggyakabban 3, 5, 7, 11 diszkbôl álló tömböket használnak) lônyök: yos olvasási tanzakciós sebesség hasznos táteület/fizikai táteület aány jó. (Viszonylag kevés teülete van szükség a paitás táolásáa.) onyolult technikai kivitelezés (bonyolult vezélô, vagy bonyolult szoftvees megoldás) iszk hiba esetén omlik a teljesítmény (olvasásko számításigényes elôállítani a hiányzó adatokat) Íási mûveletek számításigényesek. iszkhiba esetén bonyolult és eôfoás-igényes a tömb helyeállítása (pl.: a R 1-hez képest.) lkalmazási teület: R1 mellett a leggyakabban használt R megoldás. datbáziskiszolgálók Állománykiszolgálók Webkiszolgálók R 6 (ndependent ata disks with ouble paity) üggetlen diszkek dupla paitásblokkokkal 0 1 2 3p p 0 1 2p p 2 izikai diszk 0 1p p 1 2 0p p 0 1 2. lokk. lokk. lokk. lokk R 5 elveie épülô technológia, a nagyobb biztonság eléésée két független paitásblokkot képez, ezét két egyidejû diszk meghibásodása esetén is üzemképes maad. inimum n+2 diszkbôl képezhetô. lônyök: yos olvasási tanzakciós sebesség onyolult technikai kivitelezés (bonyolult vezélô, vagy bonyolult szoftvees megoldás) agas számítási kapacitás igény. étsze akkoa a diszkteület veszteség, mint a R 5 esetén. (asznos teület:n-2) lkalmazási teület: datközpontokban, kitikus endszeekben még nagyobb endelkezése állást biztosíthat, mint a R 5 endsze. R 7 R 7 nem nyílt szabvány, hanem a Stoage ompute opoation fejlesztése, bejegyzett szabadalma. [3] bbôl adódóan csak egy gyátó gyát és támogat R 7 technoló- 1 Paitás képzés 1 1 Pait ás képzés 2 giát támogató vezélôket. sak hadvees megvalósítása ismet. ága a technológia. ibajavítása, beavatkozása meghibásodás esetén csak a gyátónak van lehetôsége. sokpúpú domedá, avagy speciális R megoldások zzel a R megoldások végée étünk volna, ám a különféle R technológiáknak egyes kombinációit is használják, lássuk melyek ezek. R 10 ( Stipe of ios) síkozott tükö tömbök. z a megoldás a R 0 és R 1 technológia egyik kombinációja. R 0-hoz hasonlóan az adatokat blokkoka tödelik, a diszkeket azonos méetû blokkoka osztják fel. z egymást követô adatblokkokat külön diszkeke íják fel. zek a diszkek azonban külön-külön tüközve vannak. inimum 4 diszkbôl képezhetô. lônyök: R 1 hibatûô képességével endelkezik. R 0 csíkozási technológia sebességnövekedése tapasztalható. ága megoldás. agyon ugalmatlanul bôvíthetô, skálázható. lkalmazási teület: lsôsoban olyan helyeken, ahol egyébként R 1-et használnának, ám gyosabb diszk alendszet is szeetnének ugyanabból a hadvebôl készíteni. datbáziskiszolgálók R 0+1 ( io of Stipes) Tüközött csíktömbök izikai diszk Tüközés Tüközés Tüközés síktömb Tüközés izikai diszk 1 0 0 % T Ó 0 % R T 2 0 0 5. 0 1. 33
z a megoldás a R 0 és R 1 technológia másik kombinációja. tt a megoldás fodított soendet alkalmaz, mint a R 10-esetében. R 0-hoz hasonlóan az adatokat blokkoka tödelik, a diszkeket azonos méetû blokkoka osztják fel. z egymást követô adatblokkokat külön diszkeke íják fel. zek a csíktömbök keülnek tüközése. inimum 4 diszkbôl képezhetô. lônyök: R 0 csíkozási technológia sebességnövekedése tapasztalható. legfontosabb hátánya a R 10-zel szemben, hogy aká egyetlen diszk meghibásodása esetén a tömb hibatûô képessége a R 0 tömb szintjée esik vissza. ága megoldás. agyon ugalmatlanul bôvíthetô, skálázható. lkalmazási teület: Általános állomány-kiszolgáló épalkotó endszeek R 45 R 4 és R 5 endszeek kombinációja upla invez paitásblokkot használ, amely mind a különálló paitásdiszken (hasonlóan a R 4-hez), mind az adatdiszkeken elosztva (a R 5-höz hasonlóan) találhatóak. z a megoldás a R 4 és R 5 elônyös tulajdonságait igyekszik ötvözni. ága megoldás, komplex, bonyolult vezélô szükséges hozzá, nagy a hasznos diszk teület veszteség. em túlságosan eltejedt. R 53 zt a technológiát valójában R 03-nak kellene nevezni, met tulajdonképpen egy olyan csíkozott diszktömb (R 0), melynek a diszkjei helyén R 3 tömbök találhatóak. inimum 4 diszkbôl képezhetô. lônyök: Ugyanolyan edundanciával endelkezik, mint a R 3-as endszeek kis adatcsomagok is jól feldolgozhatóak a csíkozási technológia használata miatt. onyolult technikai kivitelezés (bonyolult vezélô, vagy bonyolult szoftvees megoldás) ága megoldás, nagy a diszkteület vesztesége. lkalmazási teület: lyan helyeken alkalmazható, ahol egyébként R 3 endszeeket használnának, annak egyes hibáit, teljesítménymutatóit javíthatja jelentôs befektetés áán. R 50 R 5 tömbökbôl álló csíktömb. z egy olyan csíkozott diszktömb (R 0), melynek a diszkjei helyén R 5 tömbök találhatóak. inimum 6 diszkbôl képezhetô. lônyök: Ugyanolyan edundanciával endelkezik, mint a R 5-ös endszeek onyolult technikai kivitelezés (bonyolult vezélô) ága megoldás, nagy a diszkteület vesztesége. lkalmazási teület: lyan helyeken alkalmazható, ahol egyébként R 5 endszeeket használnának, annak egyes hibáit, teljesítménymutatóit javíthatja jelentôs befektetés áán. kaavánút következô állomása következô oázisban a vasat veszem gócsô alá, és bemutatom a különbözô hadvees és szoftvees R megoldások készítésének mûhelytitkait. egyesi anabás megyesi.banabás@meh.hu üzemeltetés vezetô S, T, P S cikkben szeeplô UR-ek: [1] http://potal.acm.og/citation.cfm?id=50202.50214&dl =U&dl=&type=seies&idx=50202&pat=Pocee dings&wanttype=poceedings&title=ntenational%20on feence%20on%20anagement%20of%20ata&= 21279055&T=58191807 [2] http://en.wikipedia.og/wiki/amming_code [3] http://www.stoage.com/metadot/index.pl 34 1 0 0 % T Ó 0 % R T 2 0 0 5. 0 1.