制定數(shù)據(jù)中心災(zāi)難恢復(fù)計劃需考慮的因素
當(dāng)你在制定數(shù)據(jù)中心災(zāi)難恢復(fù)方案的時候,你的目標(biāo)是為了保護公司在信息技術(shù)、通信和人員方面的投入。一旦遭到破壞,你的數(shù)據(jù)中心要么是完全不受影響要么就可能遭到徹底的毀壞。當(dāng)你在檢查一次破壞性事件對你的數(shù)據(jù)中心產(chǎn)生的后果時,請務(wù)必參考這份數(shù)據(jù)中心的檢查清單,或者是針對你自己的要求對它進行修改。當(dāng)你完成了對于破壞情形的初步評估,并且對你的員工所處的位置滿意之后,再開始根據(jù)災(zāi)難恢復(fù)方案采取行動。
制定數(shù)據(jù)中心災(zāi)難恢復(fù)計劃時的若干假定
一項數(shù)據(jù)中心災(zāi)難恢復(fù)計劃僅僅關(guān)注于數(shù)據(jù)中心的設(shè)施和基礎(chǔ)設(shè)備,比如它的物理位置、建設(shè)、安全、能源、環(huán)境系統(tǒng)以及它的工作人員。你不光要考慮到數(shù)據(jù)中心運作的部分,也要考慮到支持它工作的人。這意味著在制定DR方案時,要滿足以下條件:
數(shù)據(jù)中心技術(shù)和管理人員,包括所有的班次
數(shù)據(jù)中心的建筑(比如,物理的基礎(chǔ)設(shè)施、建筑物、出入口位置、提升地板的區(qū)域)
建筑的位置(比如,進入路線、離高速公路、火車線路、飛機場有多近,離燃油儲存柜的距離)
電能的產(chǎn)生(比如,商業(yè)用電、備用電源系統(tǒng))
電能保護(比如,接地及連結(jié)、避雷針、線路調(diào)節(jié)器、電涌抑制器)
環(huán)境(比如,供暖、通風(fēng)備以及空調(diào))
關(guān)鍵系統(tǒng)(比如,服務(wù)器、配電裝置、VoIP系統(tǒng)、呼叫中心系統(tǒng))
網(wǎng)絡(luò)設(shè)備(比如,電纜、連接器、路由器、銅和光纖線路、電纜架)
安全(物理進入和信息安全)
工作空間(比如,辦公室、會議室、辦公小隔間、家居、照明)
防火(比如,火災(zāi)探測器、煙霧探測器、滅火器、FM200滅火系統(tǒng))
建筑樓層和墻體(耐火墻、提升地板)
公共設(shè)施(比如,水、電、下水道、通信)
提升面對緊急情況時候的響應(yīng)能力
作為災(zāi)備規(guī)劃中及時響應(yīng)的一部分要求,當(dāng)我們在制定響應(yīng)行動計劃的時候,如果房屋是租賃的或者自有的,那么需要和房屋管理部門或者設(shè)施管理部門協(xié)商,除此之外,IT部門也需要溝通。制定好響應(yīng)計劃后,還需要復(fù)查一下和內(nèi)部以及外部資源進行充分溝通以確保所有部門都萬無一失。
在災(zāi)難恢復(fù)計劃設(shè)計過程中需要考量的因素如下:
-和不同IT部門之間的關(guān)系,比如內(nèi)部技術(shù)團隊,應(yīng)用團隊和網(wǎng)絡(luò)團隊等。以確保所有日常使用數(shù)據(jù)中心設(shè)施的團隊部門全部都在災(zāi)難響應(yīng)流程里。
與外部股票持有者之間的關(guān)系,比如廠商以及服務(wù)提供商。
如果公司油氣田辦公室的話,和其他辦公室之間的關(guān)系特需要考慮進去,因為他們也可能會是災(zāi)難恢復(fù)規(guī)劃中的一部分。比如說要提高另外的數(shù)據(jù)中心機房等。
-和架構(gòu)相關(guān)的文檔,比如說建設(shè)規(guī)劃,樓面規(guī)劃,系統(tǒng)視圖,網(wǎng)絡(luò)拓撲以及設(shè)備配置信息等。
在災(zāi)難響應(yīng)的制定中需要考慮到以下的幾個方面:
1.管理層對數(shù)據(jù)中心最有威脅的幾個方面的認識,比如火災(zāi)、人為操作不當(dāng)、斷電、系統(tǒng)故障和安全問題。有可能管理層開始做的預(yù)想不符合實情,但需要在后面快速做出正確的改變。
2.管理層需要意識到數(shù)據(jù)中心里最容易出問題的環(huán)節(jié),比如說,陳舊的備份電力保障系統(tǒng)。
3.之前數(shù)據(jù)中心故障的處理結(jié)果,比如,如何應(yīng)對情況的以及我們從中學(xué)到了些什么。
4.管理層對數(shù)據(jù)中心宕機能接受的最長時間是多少。
5.行業(yè)現(xiàn)有的應(yīng)對數(shù)據(jù)中心宕機的準(zhǔn)則是怎樣的。
6.從其他數(shù)據(jù)中心災(zāi)難恢復(fù)經(jīng)驗中學(xué)到的。
7.受訓(xùn)過的數(shù)據(jù)中心緊急響應(yīng)團隊處理突發(fā)事件的能力。
8.主數(shù)據(jù)中心和備用數(shù)據(jù)中心服務(wù)提供商的緊急響應(yīng)能力以及兩個數(shù)據(jù)本身的緊急響應(yīng)能力。如果之前使用過,那么當(dāng)時用的時候遇到過問題嗎?此外還需要了解服務(wù)的成本以及服務(wù)合同目前的情況。
數(shù)據(jù)中心檢查清單:響應(yīng)概要