如何在災難恢復中作出快速反應? |
發布時間: 2012/8/4 19:24:08 |
中國IDC評述網08月05日報道:當你的系統面對災難的時候,你有能力“關閉大門”,阻止破壞的進一步繼續。下面的這些建議可能會對你有所幫助,幫助你在災難恢復中作出更快的反應。
2002年2月1日上午九點十三分,美國航空航天局飛行主管LeRoy Cain意識到哥倫比亞號航天飛機出現了問題,毀滅性的災難將不可避免。他迅速發出命令“關閉大門”。這項命令的發布意味著控制中心所有的工作人員都要開始制定適當的通訊協議,保證現有數據的安全,為日后的分析做準備。這樣一來就可以盡可能的捕捉最大量的信息,為日后的災難分析提供更多的細節數據,并盡可能的減少通訊錯誤,以免影響調查和恢復工作的進行。
當你的系統出現了問題的時候,你想要知道發生了什么事,為什么會發生這樣的事,想知道你自己的處境,想知道該做些什么事才能讓一切走上正軌。你的手頭可能已經有了災難應急指南,告訴你具體應該怎么做。但是,你同樣也有能力“關閉大門”,阻止破壞的進一步繼續。下面所提供的這些建議可能是你以前從未想到過的,有一些可能也只是小事情,但是,它們卻可以幫助你更快的采取行動,避免局面的混亂。
開通電話
當系統出現了問題的時候(特別是遇到了大的災難的時候),人們都想要迅速知道到底發生了什么事情。同樣,有些工作人員需要得到指導,要知道自己該怎么去做。
從這一點來看,你會遇到的最糟糕的問題可能就是一個瓶頸。為了讓用戶和管理人員知道發生了什么事情,知道災難恢復的進展情況,你需要保證公司范圍內信息的暢通無阻。你需要開通多種通訊渠道,確保信息能夠迅速傳達到用戶和管理人員那里。對于用戶來說,最糟糕的事情莫過于無法得到信息,被蒙在鼓里了。
開通各種通訊渠道,定期向用戶提供災難恢復的所有最新信息。在必要的情況下,可以指定專人負責。
你知道應用程序都在哪兒嗎?
所有的應用程序都不是平等創建的,這是一個無法回避的商業事實。有一件事你以前可能從未想到過,那就是你在編寫災難恢復程序的時候一般不會給各種不同的應用程序排定優先順序。而事實上對于公司業務的連貫性來說,有一些程序的重要性是其他一些程序所無法比擬的。有的程序是即時的,有的程序是相互影響的,還有的程序是同檔案有關的。所以要確保一點,那就是要把關鍵的應用程序擺在優先的恢復地位。
當災難發生的時候,要確定用戶和所有相關的IT工作人員已經開始著手對自己負責的應用程序進行恢復。這包括在線恢復數據,當然也包括恢復用戶系統的運行。但是,當災難發生的時候恢復軟數據、同步收集數據并在系統癱瘓時期通過過渡程序發布數據也是十分重要的。如果這些事情沒有小心做好的話,你所遇到的麻煩可能要遠遠超出這場系統災難本身。
聯系合作伙伴
如果系統是在ERP環境下運行,那么公司和商業合作伙伴之間就存在者相互影響的或是即時的網絡。要迅速將系統的中斷通知給這些合作伙伴!同公司內部的應用程序一樣,公司同合作伙伴共享的擴展程序也需要再次進行同步處理,公司當然也希望能夠盡量減少系統癱瘓期間可能的數據損失。由于迅速將數據發送到公司的系統(或是從公司的系統獲取數據)是合作伙伴的職責所在,所以公司通知的越及時,情況就會越好。
DOS系統
你的災難恢復過程是否包含DOS系統的恢復呢?如果是的話,那么就要作好充分的準備,來保持公司業務的連貫性。你可以在幾秒鐘之內就對DOS系統的關鍵程序進行變更。
你可以做的不止如此。你可以在控制住局面的情況下將用戶集中到DOS系統當中。正如上面曾經提到的,要安排好程序的優先順序,建立一種垂直的控制程序。
為什么要這樣做呢?原因是多方面的。首先也是最重要的一點,DOS系統平時是不太用于即時用途的,雖然在模擬的情況下可以突然同時讓一千五百名用戶轉換到這一系統,但是在現實情況下,這樣做可能會帶來又一次災難。不要急于求成,企圖一次就解決全部的問題,而應該分別采取幾個步驟,這樣就能夠對這種系統轉換進行很好的控制,及早發現問題,防患于未然。其次,如果在用戶轉換到DOS系統的過程中會出現什么問題的話,那么這些問題的出現也是會有先后順序的。
是否有黑客?
系統為什么會發生災難?是偶然的事故嗎?或者是出現了什么愚蠢的錯誤?還是有黑客在作怪?
要學會識別黑客的攻擊,采取適當的對應措施。大家一定要明白,如果真的是有黑客在作怪的話,必須要迅速采取一些“關閉大門”的措施。
停止攻擊。如果必須的話,通過關閉網絡來隔離系統。如果是服務器遇到了問題,并且可以鎖定是哪臺服務器遇到了黑客攻擊的話,可以關閉該服務器。你是否有記錄服務器活動日志呢?是否是在遠端服務器上進行這項工作呢?(如果是的話,這確實是一個非常好的習慣。)然后,如果可能的話,迅速對黑客做出識別。你可能能夠封鎖黑客的攻擊途徑,關閉通路,在幾分鐘之內完成系統的備分。
記錄遠端用戶的身份,并將這些用戶的身份迅速保存起來,以防黑客搶在你之前抹去這些身份。如果你不能迅速識別黑客身份的話,就一定要給自己充分詳細的活動資料以備日后的調查。即使是最狡猾的黑客也難免會留下蛛絲馬跡的。
觀察公司內所有的服務器用戶。在這些用戶當中,有沒有人能夠進入服務器的安全通道呢?有的時候,“黑客”行為是偶然發生的。某個應用程序可能會由于用戶的介入而變得混亂,而對系統造成破壞。有的時候,用戶難免會犯一些錯誤。要了解那些用戶/工作站可能出現問題,迅速對其進行檢查。
最后,不管系統故障的發生原因如何,是由黑客攻擊引起的,還是其他的什么原因,都要考慮系統鏡像工具的應用。這種工具在很多場合都在應用,比如說美國宇航局控制中心在應對像哥倫比亞號航天飛機失事這樣的災難性事故時。應用系統鏡像工具有什么好處呢?一旦你的應用程序重新恢復商業應用,你可以重建系統出現問題是的確切數據。這不僅可以幫助你判斷什么地方出了問題,還可以幫你找到系統自身存在的弱點。要記住,理想的災難恢復不僅僅是要恢復系統的運行,還要重建一個更為穩定和安全的系統。 本文出自:億恩科技【www.vbseamall.com】 |