Katasztrófaelhárítás Gönczy László gonczy@mit.bme.hu Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék
COBIT, ITIL o IT folyamat keretrendszerek Követelmények o Incidens kezelés, válzotáskezelés, Basel II o EU pénzügyi szervezetek stabilitása o Előírások a folyamatokra, kockázatkezelésre Sarbanes Oxley o Cél: vállalati pénzügyi mutatók átláthatóvá tétele (USA) o (sikere kérdéses ) o Mindig hatályos dokumentumok álljanak rendelkezésre Nincs explicit követelmény katasztrófa-elhárításra, de megkerülhetetlen PSZÁF o Magyar pénzügyi szervezetek o IT felülvizsgálat is
Disaster Recovery Plan Milyen tervek léteznek? Business Continuity Plan Business Contingency Plan Nem teljesen egységes szakirodalom o Függ országtól, szakterülettől, stb. A tervek nagy része táblázat o Beszállítók o Tevékenységek listája (checklist)
Mi a katasztrófa? NEM csak valamilyen hirtelen bekövetkező természeti csapás Fennakadás a rendszer működésében, mely visszafordíthatatlan, elviselhetetlen károkat okoz Intézmény vagy cég érdekeinek sérelme Megfelelő szolgáltatás meghiúsulása
Terminológia (angol alapfogalmak) Charter, Plan, Recovery Procedures PPRT People, Process, Resources, Technology Classification: Type, Scope, Duration, Impact Declaration: Legal and Financial Implications Likelihood, Frequency, MTBF RTO: Recovery Time Objective Hot, Warm, and Cold Recovery On-Site versus Off-Site, (and Escrow) Failover versus Recovery
DRP részei Rendszer leírása o Hivatkozásokkal rendszertérképre, üzleti folyamatokra, erőforrás táblázatokra, alkalmazottak, beszállítók, partnerek elérhetőségére, o Elvárt rendelkezésre állás meghatározásával Katasztrófák leírása Megelőző intézkedések Katasztrófa idején elvégzendő tevékenységek Helyreállítás Javítási javaslatok Karbantartásra, tesztelésre vonatkozó előírások
Egy lehetséges metodika Üzleti folyamatokból indulunk ki Meghatározzuk a szükséges informatikai szolgáltatásokat Meghatározzuk az ezekhez szükséges informatikai erőforrásokat o Eddig top-down Felírjuk az esetleges katasztrófákat Meghatározzuk az erőforrásokra és ezen keresztül a szolgáltatásokra gyakorolt hatást Megnézzük, mi minősül kritikus eseménynek o Valóban katasztrófa o Idáig bottom-up
A folyamatok meghatározása 1. Milyen üzleti folyamatok vannak a cégnél? o Pl. számlázás, online rendelésfelvétel, könyvelés, ügyfelek regisztrációja, adóbevallás elkészítése, új szerződések elkészítése, 2. Mi a folyamatok kiesésének következménye? o Adott szempontból Felhasználók, ügyfelek, pénzügyi, jogi o Adott időtartamokra (1 nap -1 hét -1 hónap) o Adott súlyossággal (pl. skála 1-5) o Worst case elv (pl. adóbevallás esetén) 3. Melyek lesznek a kritikus folyamatok? o Hatás súlyossága meghalad egy értéket Üzleti elemzés o MKB: 270 üzleti folyamat
Az informatikai szolgáltatások meghatározása Milyen technológiai folyamatok vannak? o Levélküldés, fájlok elérése, archívum, szkennelt dokumentumok elérése, faxküldés, belső kommunikációs rendszer, vállalati portál, könyvelő rendszer, felhasználónyilvántartás, A komponensek rövid leírása o Mi a céljaa működésnek? Pl. a korábbi szerződések gyors elérése IT határozza meg
Üzleti szolgáltatások IT kapcsolat A kritikusüzleti folyamatok milyen informatikai erőforrásokat használnak? o Ezzel szűkítjük a kört, de a cél nem az abszolútbiztonság (ami nem érhető el), hanem az előírt biztonság Üzlet és IT részleg közösen Egy üzleti folyamat több informatikai szolgáltatást is használhat Ezek lesznek a kritikus IT szolgáltatások Maximum engedélyezett kiesés o Az üzleti folyamatok által tolerálható minimum o Pl. Számlázás használja (1 hét kiesés tolerálható) o Ügyfélregisztráció használja (1 hónap tolerálható)
Példa: üzlet IT kapcsolat Folyamat\ IT szolgáltatás Email Webportál Fax Számlázási rendszer Helpdesk X X X Bérszámfejtés X X X Számlázás X
IT erőforrások meghatározása Szolgáltatásokból kiindulva o Hardver Pl. XXX szerver o Szoftver o Egyéb Windows 2003 SR2 szerver Képfeldogozó alkalmazás Pl. Kábelek Melléktermék : elavult, felesleges erőforrások o Rendszer térképpel összevetve o Mire használjuk ezt a 10 éves Sun Solaris szervert?
Humán és egyéb erőforrások Szerepkörök megnevezése o Szükséges vizsgákkal Pl. CISCO Certified hálózati mérnök Aktuális alkalmazottak o Elérhetőséggel o Munkaidő adataival o Ld. Szerepkör alapú rendszermenedzsment o Pl. IBM Tivoli Identity Manager Elérhető külső support o Pl. XXX cég biztosít CISCO mérnököt
Hardver erőforrások Tartalék erőforrások o Pl. switch, szalagos egység, szervergép (Szerver) szoftver erőforrások o Pl. tartalék Windows 2003 szerver feltelepítve Alkalmazások hideg tartalékai o Pl. képfeldolgozó alkalmazás a Windows2003 szerveren Különbségek: o Hely: fizikailag elkülönítve (pl. szerverszoba) o Lehetséges, hogy nem lesz elég (pl. Windows 2003 szerver), kiderül az analízis során
Rendszertérkép felírása A rendszer komponensei függőségekkel Egy-egy komponens egy IT szolgáltatás Szerverek megnevezve
Példa
Interfészek felírása Az egyes komponensek hogyan kapcsolódnak egymáshoz Pl. tárolt eljárások, adatbázis táblák, konverter programok, batch programok, reportok, Webszolgáltatások Mire van szükségünk, hogy a külön-külön helyreállított komponensek együttesen is működjenek
IT erőforrásigény A kritikus üzleti folyamatokat kiszolgáló IT alkalmazások igényei Az előbb leírt erőforrásokra
Példa (erőforrások leírása) IT szolgáltatás\ erőforrás Switch Router Windows szerver Exchange szerver Email X X X X Számlázási rendszer X X
Komponensek hibája Hibafa elemzés o Egyszerűség kedvéért egy SRU kiesése VAGY kapuk ÉS kapuk
Példa
Eddig: rendszer leírása Katasztrófák felírása Innentől: környezetet is figyelembe vesszük Fajták szerint Természeti katasztrófák o Tűz, villám, stb. Műszaki katasztrófák o Áramkorlátozás, vírusok, épület klímája kikapcsol, stb. Humán katasztrófák o Szándékos rongálás, sztrájk, stb.
Katasztrófák hatása az erőforrásokra Adott katasztrófa milyen erőforrásokra hat Worst case elv o Minden leég az adott épületrészben Azonos hatású katasztrófákat a továbbiakban együttesen kezeljük o Pl. épület leégése = földrengés (hatás)
Azonnali reakciók Környezeti helyreállítás Funkcionális helyreállítás Áttelepülés Normalizáció Helyreállítás lépései
Riasztási lánc definiálása
Helyreállításhoz szükséges lépések Példa: Exchange szerver helyreállítása Előfeltétel: működőképes Windows szerver o Pl. tartalék a másik telephelyen Előfeltétel2: felhasználói adatok elérhetőek o Pl. tartalék Domain Controller Tartalék Exchange szerver beüzemelése Autentikáció a tartalék Domain Controllerrel Felhasználói accountok létrehozása Adatok visszatöltése
Az előbbi lépések kiegészítése Végrehajtási idő o Pl. várhatóan legalább 2 óra Végrehajtáshoz szükséges személyzet o Pl. 1 operátor, 1 MS### vizsgával rendelkező mérnök Egyéb szükséges adatok o Pl. szalagos mentés Helyreállítás korlátai o Pl. utolsó X nap levelei elveszhetnek
Megfelelünk-e a követelményeknek? Lehetséges-e o az adott rendszerkonfigurációban o az összes katasztrófa esetén o az összes (kritikus) erőforrás helyreállítása o a maximálisan tolerált kiesési idő alatt? Ha nem o Mit kell módosítani a rendszeren? Konfiguráción? Alkalmazásokon? o Mennyi idő/pénz kell ehhez? Milyen egyéb (szervezeti) változások kellenek? Ha igen:?
DRP-vel kapcsolatos teendők Betanítás o Mit kell tudnia a normál személyzetnek? o Humán tartalékok felkészítése Tesztelés o Végrehajthatóak-e a forgatókönyvek? Karbantartás o Rendszeres időközönként Pl. évente be kell újra adni o Adott események/változások hatására o A normál változás menedzsment része
Példa DRP (más metodika) Section 1 Introduction Section 2 Document Control Section 3 Recovery Phase 1 Vigilance, Identification, Categorization and Declaration Section 3 Recovery Phase 2 Initial Recovery Partial Capacity Section 3 Recovery Phase 3 Full Recovery Full or Required Capacity Section 3 Recovery Phase 4 Stand Down Return to Normal Operations, Deactivation of Recovery Section 3 Recovery Phase 5 After Action Review and Plan Revision Section 4 References and Resources Section 5 Directory of Appendices Section 5-1 Appendix 1 Staff Contact List and Kris-Cross Calling Tree Section 5-2 Appendix 2 Vendor Contacts Section 5-3 Appendix 3 Communication Plan Section 5-4 Appendix 4 Platform Specifications and Vendor Re-Order Forms Section 5-5a Appendix 5a Platform Description Install and Configuration Section 5-5b Appendix 5b 2K3 Server Install and Configuration Section 5-5c Appendix 5c DB Server Install and Configuration Section 5-5d Appendix 5d Web Server Install and Configuration Section 5-5e Appendix 5e Rpt Server Install and Configuration Section 5-5f Appendix 5f Application Install and Configuration Section 5-6 Appendix 6 Back Up and Restore Schema Section 5-7 Appendix 7 Network Schema
BCP feladata Üzletmenet folytonosságának garantálása Amivel több, mint DRP: üzleti szinten kínál alternatívát Pl. ne vigyük fel a rendeléseket a rendszerbe, gyűjtsük papíron o Előny: Kifele kevesebb kiesési idő Csökkentett módú működés biztosítható o Hátrány: Szinkronizáció szükséges a visszaállításkor Erőforrásigény
Milyen károkat próbál csökkenteni? Üzleti folyamat hibái Ellenőrizetlen folyamatok Ügyfélszolgálat leállása Cég jó hírnevének csorbulása Bevételkiesés Nem csak informatikai szempontok
Informatikai támogatás Kapcsolat rendszermenedzsment eszközökkel o Asset management: eszközök kezelése o IT systems management (monitoring): rendszerállapot o Business activity monitoring o Configuration database: konfiguráció leírás o Provisioning: feladatok és erőforrások összerendelése
Források Katasztrófa-elhárítás munkafolyamatokban. BME tanulmány. The Disaster Recovery Handbook: A Step-by-Step Plan to Ensure Business Continuity and Protect Vital Operations, Facilities, and Assets (Hardcover) by Michael Wallace, Lawrence Webber. ISBN: 0814472400 http://biztostu.hu/ Business ContinuityandDisaster Recovery. Pres. Of Mike Wade, Southern Polytechnic State University Az informatikai biztonság irányításának követelményrendszere. Információs Társadalom Koordinációs Tárcaközi Bizottság ajánlása, 2004.