越來越多的行業用戶選擇利用云計算技術構建自己的數據中心,但業務集中、數據集中的同時,也意味著風險的集中。
一旦發生數據中心人為誤操作、網絡故障甚至災難時,企業及分支機構將無法對外提供服務,甚至關鍵數據也會丟失。
從GitLab事件看企業災備現狀
去年,全球知名的開源托管服務平臺GitLab數據丟失事件可能大多數人還印象深刻,因為缺乏完善的災備方案,人為誤刪數據庫致使系統宕機,并且長時間無法恢復。慶幸的是,運維工程師利用一次偶然產出的LVM快照,使數據得以恢復到6個小時之前的狀態,但中間丟失的那部分數據對用戶的潛在影響是無法用數字衡量的。
事實上,缺失災備方案的并不只有GitLab,諸多企業均存在類似的情況。由于成本和技術等原因,企業只應用傳統的本地備份方案,并且通常只針對企業重要的業務數據(數據庫、電子郵件等)進行備份,而不對操作系統及應用程序進行備份。故障發生后,需要耗費大量的時間在備份文件的導入恢復和配置上。業務恢復周期長、操作復雜,很多企業在做了災備方案后,卻束之高閣,無法應用。
因此,如何以更高的性價比實現企業業務連續性,平衡風險、效率與成本,是當前企業用戶的迫切期望。
企業災備建設需要“因地制宜”
不同類型的風險其影響程度、發生概率和造成的損失大小是不同的, 在討論企業災備建設方案之前,可以將企業各信息系統所面臨的風險因素、概率、影響和應對手段進行分析,以便于企業根據風險的抵御能力以及應用系統的重要程度,評估如何采取相應的災備措施來減低各種風險和威脅可能帶來的影響和損失。
企業信息化風險評估與應對措施
根據上面的分析,基于不同的風險抵御能力,災備的建設分為兩個維度、四個層次:
- 數據維度(本地、異地)
- 業務維度(同城連續性、異地連續性)
企業應用云計算技術之前,災備的建設更多還是解決數據層面的問題,主要是利用傳統存儲設備的數據復制特性,由存儲設備統一完成上層業務(包括數據庫系統)的跨地域數據復制。但因為技術綁定和所有業務系統共吃一個”大鍋飯”的原因,建設成本高昂,災備效率不高,兼容性和數據一致性也存在一定的風險,并且由于只是數據級的復制,依舊無法解決數據備份和業務恢復復雜度高的問題。