Disaster Recovery: Kako sprečiti jahače IT apokalipse?
U ranim danima PC Press-a, katastrofa je nastajala kad spremačica usisivačem zakači mrežni koaksijalni kabl, pa svi računari u redakciji ostanu bez mreže (i Interneta). Iako nije uvek bilo lako naći gde je kabl pokidan, stvari su se od tada malo zakomplikovale.
Kada se pomene pojam disaster recovery, „civilni“ (neIT) korisnici obično pomisle na prirodne katastrofe. Varijacije su brojne, bilo da su meteorološke, u obliku tornada, uragana, mećava, poplava ili tektonske, tipa zemljotresa i cunamija izazvanih zemljotresom, pa sve do krajnje opskurnih scenarija koji podrazumevaju udare meteorita, kometa i vojna dejstva krajnje razornim oružjima.
Stavimo na trenutak na stranu to što je ugroženost takvim incidentima malo verovatna i konstatujmo da će, ako se ovakve stvari zaista dese, običnim korisnicima biti prilično malo stalo do toga da se sačuvaju njihovi „privatni podaci“, a pogotovo porodične fotografije ili filmići s letovanja. Postoje ipak podaci i servisi za koje se vredi boriti do poslednjeg daha. Ti mission critical podaci i zadaci obuhvataju osnovnu zaštitu zdravlja, snabdevanje vodom, strujom i osnovnim životnim potrepštinama, telekomunikacione servise i mnoge druge funkcije neophodne u situacijama koje ne ugrožavaju samo data centre, već i osnove funkcionisanja humanog društva.
Mnogo češće incidente prouzrokuje ljudska greška, neispravne konfiguracije i cyber-napadi koji mogu da izazovu pad servera i druge IT opreme. Ponekad se uzroci katastrofe mogu javiti u teško prepoznatljivim uzrocima kao što su neispravan serverski rack, bagovita aplikacija ili nekompatibilni (nedovoljno kompatibilni) protokoli komunikacije ili razmene podataka.
Važan je plan
Ključni korak u ovim slučajevima je kreiranje procene rizika koja detaljno opisuje verovatnoću nesreće i rizik koji bi ona predstavljala za vašu organizaciju. Ovo će vam pomoći da postavite prioritete. Iako se retko možete suočiti sa uraganom ili osetiti zemljotres, postoje dobre šanse da ćete doživeti pad servera ili cyber-napad koji je usmeren na vašu mrežu. Planove morate da uskladite s verovatnoćom nekog incidenta.
Drugi korak je da sakupite informacije potrebne za kreiranje plana za oporavak od katastrofe. To može uključivati inventar vaših servera i storage sistema, dijagram mreže, planove organizacije podataka, spisak ključnih osoba, telefonske brojeve hitnih kontakata, procedure za backup, restore i oporavak toka rada, kontakte pružalaca nezavisnih usluga, informacije o podršci i još mnogo toga, zavisno od vaših specifičnosti.
Ako niste angažovali konsultante za oporavak od katastrofe i koriste sopstvene resurse da dođete do plana za oporavak od katastrofe, možda će biti korisno da pretražite neke postojeće planove za oporavak od katastrofe od autoritativnih izvora. Čak i ako odstupite od obrazaca, upoznaćete se kako da metodički da pristupite rešavanju ovog problema.
Na kraju, kao i kod protivpožarnih vežbi, korisno je povremeno proveriti kako funkcioniše vaš disaster recovery plan. Kao što ne morate da potpalite vatru, tako ne morate ni nasilno obarati servere ili isključivati struju da biste proverili svoj plan za oporavak sistema. Dovoljna je simulacija u kojoj ćete proveriti da li će svi zaduženi biti na svom mestu i da li su upoznati s procedurama koje će sistem vratiti u funkcionalno stanje, a podatke u vremenske odrednice što bliže onima pre nastanka incidenta.
Bolje sprečiti…
Dobar plan mora da uključuje i niz tehničkih rešenja koja će sprečiti katastrofu. Među najpopularnije metode za sprečavanje katastrofe i brz oporavak sistema svakako spadaju redundansa IT resursa i podataka, redovan backup podataka i sistema, te mogućnost brzog vraćanja podataka i sistema u bilo koju izabranu vremensku kotu. Za podatke koji moraju da budu uvek dostupni i servise koji zaista moraju da rade uvek, nekada se primenjuju „drastične“ mere kao što su geografski udaljene kopije čitavih data centara koji brinu o mission critical zadacima.
Virtuelizacija: Jedna od prednosti virtuelizacije je to što može eliminisati potrebu za novim fizičkim serverom kada nešto pođe naopako. Postavljanje virtualnog servera na rezervne kapacitete ili u cloud su veoma realne i poželjne mogućnosti, a omogućavaju smanjenje vremena za obnavljanje organizacije (RTO – recovery time objective) u mnogim okolnostima. Svakako pregledajte virtuelizacione platforme (VMvare, Microsoft Hiper-V, Oracle VM, itd.), pogotovo one koje se koriste u vašem okruženju, zajedno s alatima za pravljenje rezervnih kopija i oporavak. To će vam značajno skratiti vreme oporavka.
Mrežno obezbeđenje – serveri nisu jedini deo ugrožene IT infrastrukture jer i mreže takođe mogu doživeti prevremenu smrt. To takođe može prouzrokovati neuspeh u poslovnim aplikacijama i uslugama koje zavise od pouzdane povezanosti. Plan mrežnog oporavka od nesreće često uključuje procedure za kontaktiranje odgovarajućeg IT osoblja, nabavku zamenske mrežne opreme od proizvođača i druge akcije potrebne za obnovu povezanosti. Povezanost sa svetom (i Internetom) rešava se redundantnim linkovima – najbolje s različitim pružaocima mrežnih i internet usluga.
Cloud rešenja – jedan od najboljih razloga za uključivanje oblaka u planiranje oporavka od katastrofe je mogućnost korišćenja data centra koji obezbeđuje cloud provajder jer obezbeđuje oporavak bez ulaganja u dodatne objekte, sisteme i osoblje. Takođe, korisnicima omogućava pristup najsavremenijim IT mogućnostima, što je posledica konkurentnog tržišta u oblaku u kojem se AWS, Microsoft Azure, Google Cloud i drugi bore za korisnike, rešavajući ove probleme sami, na nivou cloud-a, što istovremeno omogućava i najbrže moguće ažuriranje svih mogućnosti koje pružaju ovi servisi i aplikacije. Većina ovih cloud provajdera u okviru svojih usluga čak nudi gotova rešenja za oporavak od katastrofe (DRaaS – Disaster Recovery as a Service). Naravno, i ovakav plan morate da uskladite sa svojim potrebama jer postoje i jeftiniji planovi koji će vam biti dovoljni, ali i oni skupi koji uključuju mere i akcije koje vam možda nisu potrebne ili nisu primerene značaju servisa koji vi pružate. I raspoloživi budžet je svakako značajna stavka u planiranju.
Nije sve u IT-ju
Najzad, plan oporavka od katastrofe morate da proširite i daleko iznad IT sistema smeštenih u računarskoj sobi. To uključuje samu zgradu, pružaoce usluga, rezervne snage, fizičku sigurnost, sprečavanje požara vatre, HVAC (grejanje, ventilaciju i klimatizaciju), osoblje za podršku i još mnogo toga.
Priprema za mogući incident koji će prouzrokovati otkazivanje servisa ili ugrožavanje podataka podrazumevaju i mogućnost neposrednog oštećenja zgrade data centra, zlonamerne uljeze i mnoge druge rizike. Od suštinskog je značaja da procenite moguće gubitke u slučaju incidenta, da sprečavanje ili rešavanje takvih incidenata uračunate u cenu svojih usluga i da rešavanje ovih problema mudro rasporedite između sopstvenog tima i spoljnih timova koji rešavaju deo ovih problema i povremeno se uključuju u planiranje i rešavanje novih bezbednosnih rizika.
Naravno, mi vam želimo da usluge pružate redovno i da nikada ne doživite ozbiljnije bezbednosne rizike niti da saznate šta je to prava IT katastrofa.
Ovaj tekst je uvod u specijal časopisa PC Press, posvećen upravo Disaster Recovery temi. Kompletan specijal možete čitati potpuno besplatno na našem sajtu!