數十年來, 信息技術(IT)專業人士已經認識到災難恢復的重要性。 備受矚目的互聯網蠕蟲 ,自然災害以及其他引人注目的安全漏洞都提醒我們需要妥善規劃災難恢復和其他業務連續性問題。
災難恢復主要適用於公司和其他大型組織,但家庭網絡也適用相同的基本原則。
什麼是災難恢復?
災難恢復涉及在發生重大計劃外停電時採取的一系列行動,以盡量減少其不利影響。 在網絡中,災難可能由事件導致,如
- 電腦惡意軟件
- 電力故障
- 黑客攻擊
- 地下電纜切斷或故障
- 火災,洪水,地震和其他自然災害
- 系統管理中的錯誤
業務連續性的相關概念涉及確保組織的關鍵業務流程(包括使用IT系統的業務流程)在發生災難時能夠得以維護。
為什麼災難恢復很重要
如果執行得當,災難恢復程序可以節省大量資金。 即使是幾個小時的網絡和互聯網連接丟失,對公司的財務影響也很容易達到數百萬美元。 災難恢復還可以提高人類的生活質量,甚至可以拯救生命。 在緊急情況下,與朋友和家人失去手機聯繫變得非常具有破壞性。
所有這一切說,對業務連續性的投資需要與成本的實際考慮和為未知未來做準備的複雜性相平衡:
- 成本 - 全面的災難恢復過於昂貴
- 可測試性 - 災難恢復計劃在紙面上看起來不錯,但在技術上未經證實可能會在實踐中失敗
- 過分強調後台 - 很容易迷戀服務器機房的解決方案,但如果沒有足夠的人員和客戶端基礎設施條款,業務連續性將不會發生
家庭網絡缺乏大型企業的昂貴硬件,但保存數據和通信同樣重要。
災難恢復計劃
災難恢復的最佳方法主要側重於規劃和預防。 雖然地震和恐怖襲擊通常很難預測,但還是可以詳細分析許多其他災難情景。
對於那些無法預防的事件,IT災難恢復計劃會考慮到需要
- 盡快檢測中斷或其他災難影響
- 通知任何相關方,以便他們採取行動
- 隔離受影響的系統,以免損壞不能傳播
- 修復受影響的關鍵系統,以便恢復操作
這些統稱為風險管理或風險緩解活動。
災難恢復技術
所有優秀的IT災難恢復計劃都考慮到操作的三個主要組成部分:數據,系統和人員。
從技術角度看,大多數組織依靠某種形式的冗餘來恢復數據和系統。 冗餘允許輔助數據或系統資源在主要資源發生故障或不可用時,在短時間內被壓入服務中。 組織可以在多個位置複製服務器和其他關鍵硬件,以防止出現任何單點故障。
傳統磁盤鏡像在正常情況下保持數據的高可用性,但它只能在短距離內運行。 備份允許捕獲數據的快照移至遠程位置。 例如,傳統的網絡備份策略會定期存檔關鍵數據的副本,以便在需要時可以稍後進行恢復。 如果備份保留在現場或僅保留位置,則其災難恢復的價值較低。 較大的組織投資於存儲區域網絡(SAN)技術,以在其內部網絡中更廣泛地分配數據。 一些還利用第三方託管服務來存儲雲 。
家庭網絡也可以利用網絡備份和雲存儲解決方案,以更好地管理風險。
其他支持災難恢復計劃的常用技術包括:
- 指派組織中的人員在發生災難時承擔特殊角色,並為他們提供必要的培訓
- 執行針對特定恢復場景的災難恢復演練