HA és DR praktikák, maximális rendelkezésreállás

HA és DR praktikák, maximális rendelkezésreállás K&H Bank Zrt. 2017.03.29. Csanádi József, Simon Tamás 1

Tartalom Üzembiztonság és rendelkezésre állás DR helyzetek és végrehajtásuk Patchelési stratégia Data Guard, mint utánfutó - Snapshot standby Stretch cluster

Üzembiztonság és rendelkezésre állás RAC

Infrastruktúra

Infrastruktúra II. Oracle MAA (Maximum Availability Architecture) Két geosite Szerverek külön rack-ben Mindkét oldalon Cluster RAC (v12.1.0.2) Redundáns switchek 10g-s hálózat

Infrastruktúra III. Data Guard biztosítja a szinkronizációt maximum performance (sync mód helyett -> 12c fast sync) Jumbo frame opció Diszk szintű szeparáció külön frontend portok

DR kivitelezés és végrehajtás

Switchover és Switchback Kötelező DR tesztek Többféle átkapcsolási technika (srvctl, sqlplus, Data Guard Broker) Mit milyen felhasználóval? Automatizálás Kommunikáció

Switch ellenőrzések standby primary szinkron ellenőrzés interface-k külön bánásmóddal wallet állományok megléte srvctl getenv database db dbnév oracle_base és oracle_unqname 1-1 instance futhat csak az átkapcsolás előtt switchover_status

Switch folyamat primary alter database commit to switchover to physical standby with session shutdown; standby select switchover_status from v$database; alter database commit to switchover to primary with session shutdown; primary alter database recover managed standby database using current logfile disconnect from session; standby alter system set log_archive_dest_state_2=enable scope=both sid='*'; (DG listener)

Switch befejezés ACFS diszkek mountolása (asmcmd os) switch logfile srvctl status service -service szervíznév -db dbnév bejelentkezés tesztelése

Oracle patchek végrehajtása

Patch stratégia 4 PSU / év (tartalmazza a CPU-kat is) Először az ACT majd a PRO környezetek Rolling upgrade shu transactional felkészített alkalmazások Standby apply first Kivételkezelés IRM Security patch

Utánfutó DB Cascaded Standby Database

Miért Utánfutó DB? +1 egy biztonsági réteg Alkalmazás felül érkező hibák javítása Egy-egy szelet visszaállítása Gyorsabb visszaállítás Nincs nagy erőforrás igény

User Commit Data Guard 11g Primary Database Standby Database REDO BUFFER SGA S S LNS RFS R R APPLY L L Database datafile LGWR O R L O R L ARCH ARCH Database datafile Database datafile APPLY ARCH RFS ARCH ARCH Cascaded Standby Database S R L S R L

User Commit Data Guard 12c Primary Database Standby Database REDO BUFFER SGA S S LNS RFS R R APPLY L L Database datafile LGWR O R L O R L ARCH ARCH LNS Database datafile Database datafile APPLY RFS ARCH ARCH ARCH ARCH S R L S R L Cascaded Standby Database

Utánfutó paraméterek Alapparaméterek db_recovery_file_dest='+fra_dg' db_recovery_file_dest_size (Megfelelő méretezés) Primary DB Fast sync (sync, noaffirm) Standby DB Delay 60 (késleltetés) Cascaded Standby DB flashback on db_flashback_retention_target=1440;

Snapshot Standby DB MRP process megállítása a Cascaded Standby DB-n SQL> alter database recover managed standby database cancel; Adatbázis konvertálása SQL> alter database convert to snapshot standby; Visszaállítás Phisycal Standby-ra SQL> alter database convert to physical standby;

Oracle Stretched Cluster

Elvárások a jövőben Bankszektor: 5 másodpercen belüli utalás 99,97% rendelkezésre állás 2 óra 40 perc állásidő egy évben (Maintenance és incidens egyaránt)

Oracle RAC - Extended Cluster

Környezet és Paraméterek Dark fiber kapcsolat a két telephely között A két telephely storage rétege normál tükrözéssel van kialakítva diszkgroup szinten (egy telephely=1 failuregroup) Asm_preferred_read_failure_groups A saját failure group-ok olvasása. disk_repair_time-ot és a failgroup_repair_time-ot Telephely kiesése miatt fontos!

Kérdések - válaszok Köszönjük a figyelmet! jozsef.csanadi@kh.hu tamas.simon@kh.hu Felhasznált források: Setup Flashback Database on Data Guard Physical Standby Database Oracle RAC and Oracle RAC One Node on Extended Distance