大型數據中心IT系統(tǒng)搬遷項目實踐感想
—鼎誠服務,細節(jié)為先
隨著經濟的發(fā)展,企業(yè)對IT的要求也越來越高,有些企業(yè)IT中心對自身的業(yè)務要求也越來越不能滿足,也有些企業(yè)隨著業(yè)務的發(fā)展或者經營場所的變化需要對IT中心機房調整。因此,企業(yè)IT中心機房搬遷項目也就越來越多,華創(chuàng)云鼎最近一年來就陸續(xù)承接了金融等行業(yè)10來個以上的大中型數據中心機房的搬遷項目,其中有Z總行及各分行、光大銀行、平安證券、中國證券登記結算中心等中心機房的搬遷就具有搬遷項目的代表性,我們也在為客戶提供搬遷服務的過程中總結、完善并形成了一套科學高效的服務管理及實施方法,這套方法提取了技術服務過程中的普遍要素和共性特點,運用科學的方法論,對技術服務難點、風險等要素都做了分析和準備,即DCPM。它在所有服務實施的項目中得到體現,并是我們成功實施各類技術服務項目的管理基礎。
IT中心機房搬遷項目是一類比較特殊的項目,涉及的要素也非常的多,PM在整個項目實施中對項目的掌控都有較高的要求,需要我們采用DCPM方法指導技術服務管理和實施工作。通過對各個項目階段的科學規(guī)劃和有效掌握與控制,從項目和實施管理的角度為客戶技術服務的成功提供有力的保障。再加上華創(chuàng)云鼎的專業(yè)顧問人員的支持,保證了整個技術服務過程的成功,確保了客戶對相關技術的理解和應用以及系統(tǒng)的穩(wěn)定健壯運行。
基于以上關于搬遷項目的特點,有必要對這類項目的成功實施進行總結,有針對性地加以完善和客戶化,為后續(xù)的搬遷項目提供有效的借鑒和幫助。
在今年執(zhí)行的幾個中心機房搬遷項目都是機房整體搬遷,設備種類涉及小型機、PCServer、網絡、存儲、安全等幾百臺設備的搬遷,而且涉及的業(yè)務眾多,重要的核心業(yè)務,辦公系統(tǒng)等。我們作為服務商需要在安全第一的前提下,在盡可能短的時間內完成所有設備的搬遷工作以及業(yè)務恢復工作,及時恢復業(yè)務的正常運行。
通過分析搬遷的特點,我們可以針對搬遷的難點及關鍵點進行可行性分析,并給出切實可行的解決辦法。在我們所完成的這些大型的搬遷項目中,其特點可以歸納如下:
- 全業(yè)務設備搬遷,設備眾多,系統(tǒng)復雜,業(yè)務多為核心業(yè)務;
- 客戶業(yè)務數據非常重要,需要保證數據的完整性;
- 設備有超重、超高設備,需要制定詳細的搬遷方案;
- 搬遷時間有特殊性,需要在停機時間內完成設備的搬遷、系統(tǒng)恢復等工作;
- 搬遷中涉及的人員眾多,現場管理難度較大;
搬遷項目是一個系統(tǒng)性工程,需要在項目的啟動階段對項目進行細致全面的分析和制定切實可行的項目計劃,以保障項目在實施階段的順利進行。因此,項目啟動的越早我們就能有充足的時間了解客戶的要求和對搬遷過程的期望,我們也就能對搬遷的各個環(huán)節(jié)有足夠的準備和把握,從而降低項目實施環(huán)節(jié)的風險,并能及時就實施中出現的變化采取及時有效的措施降低由此帶來的項目風險影響。
針對搬遷項目,在下面的計劃階段我覺得需要從以下幾個方面入手:
- 搬遷團隊的組建:為保證搬遷項目的順利進行,我們需要組建項目組,并詳細規(guī)范相關責任人的分工,有效利用資源,保證搬遷流程化,同時,根據搬遷項目的特點,在項目規(guī)劃規(guī)劃階段和搬遷實施階段的組織架構又不一樣,其目的就是為了更好的保證不同階段人員工作職責和分工的合理性和易管理;
- 現場調研:這是一個非常重要的工作,需要對新舊機房環(huán)境、設備的擺放位置、設備配置信息、邏輯結構、業(yè)務屬性、設備的進出通道進行現場勘查和信息調研。根據機位的位置規(guī)劃主機搬遷的順序、搬遷路線和搬遷所需的設備和人力,在出現難題地點時,進行記錄,幾方商討提出解決方案;
- 設備的檢測和核實:在設備搬遷前對重要搬運設備進行硬件級和系統(tǒng)級的檢查;對于發(fā)現的軟、硬件故障,及時進行修復和更換,保證搬遷前設備狀態(tài)正常;
- 標簽的設計和粘貼:標簽在整個搬遷項目中有三種,線纜標簽、設備標簽和包裝箱標簽,這些標簽在搬遷中發(fā)揮著非常重要的作用。
- 線纜標簽:由于搬遷中設備的種類繁多,設備之間的連接非常復雜,需要在搬遷之前對這些連線進行標識,以便設備到新機房就位后能盡快連接加電以盡快恢復系統(tǒng)和業(yè)務,因此,線纜的標簽制作是一個非常重要的工作;
- 設備標簽:為確保每臺設備搬遷的起始位置、搬遷中設備識別和清點等,我們對每一臺設備粘貼標簽,每臺設備有唯一的識別碼,并標示設備的應用系統(tǒng)、序列號、新舊機房的物理位置以及設備高度、電源數、IP地址等,以便識別。通過這樣一個小標簽,在搬遷過程中工作人員就能獲得各工作位置的信息,確保設備能準確無誤的就位和恢復;
- 包裝箱標簽:在搬遷中我們會對所有設備進行包裝,每個箱子中裝的設備及數量各不相同,我們在每個箱體外面設計標簽,標明箱中的設備標識和其他信息,方便和確保設備搬遷中包裝箱中的設備能清楚的記錄和清點。
題外話:標簽的制作是一個比較繁瑣的工作,如何準確快速的完成標簽的制作就顯得非常重要,尤其是設備達到幾百上千臺的規(guī)模,我們就需要采用一些技術手段來完成標簽制作,華創(chuàng)云鼎在幾十個搬遷項目的實施中建立了一套從設備連接信息表批量輸出數據生成設備標簽,這極大的減少了標簽制作的工作量,并保證了標簽制作的準確度。
- 材料的準備:對于搬遷項目中,我們需要準備搬遷相關的材料,比如包裝箱、填充泡沫、膠帶等。搬遷項目對業(yè)務恢復的時間有著嚴格的要求,而這些搬遷項目中涉及的設備非常多,搬遷中設備包裝的時間是一個非常耗時的工作,我們定做了標準的包裝箱,極大的減少了大量PCServer設備的包裝時間,保證了搬遷的順利進行。
- 搬遷次序:在搬遷中,我們根據客戶業(yè)務特點和設備情況執(zhí)行詳細的搬遷批次,并與網絡切換方案對接,與客戶業(yè)務、系統(tǒng)及網絡組不斷的討論和溝通,就設備的批次和順序達成一致并形成搬遷實施方案。
- 搬遷實施計劃書:這是一個搬遷的指導性基準文件,對搬遷中的各項問題進行了全面的闡述和約定,包括資源準備、分工職責、實施方案、風險控制等。
實施階段是在項目啟動后,我們對整個搬遷方案進行了不斷的討論和交流后形成共識而實施我們構想的階段,我想實施階段的重中之重是安全第一、其次是時間。這個是我們和客戶一致的,我們的目標是在停機的時間內安全的將設備搬遷到新的機房并及時恢復系統(tǒng)。
在完成的搬遷項目中,我們沒有發(fā)生一起設備物理損傷,沒有一臺設備因為搬遷不能恢復業(yè)務,每個項目都在要求的時間內完成全部設備的搬遷和系統(tǒng)的恢復,這些都得到了客戶的肯定和贊許。
我想我們在項目實施中能保證設備的安全和及時恢復主要是對項目的執(zhí)行做了充分的準備,為了保證安全,在實施前主要從以下方面來保證:
- 成熟的搬遷流程和操作規(guī)范保證安全和進度;
- 對關鍵數據備份確保數據安全;
- 現場備件準備保證設備硬件出現問題及時修復;
- 制定風險應對方案全面理清項目風險;
- 購買商業(yè)保險對不可控風險轉移。
此外,為了保障項目實施能在有限的時間內完成,我們不斷吸取歷史搬遷項目的經驗,不斷完善我們的搬遷流程,并通過搬遷流程管理單控制搬遷進程,引進了流水線的流程化管理實施搬遷項目。
下面是我們一般的搬遷流程:
根據搬遷流程的各個環(huán)節(jié),我們制定相應的管理單,對搬遷的各個環(huán)節(jié)進行控制,管理單在各個環(huán)節(jié)流轉,保證了設備搬遷像生產線一樣流動起來,有限保障了大量設備能在很短的時間內完成。例如,Z總行TEST中心300多臺小機存儲設備在2020年5月1日期間4h全部完成搬遷,北京分行200臺設備也在2018年9月分4批次完成搬遷。
我們能夠在非常短的時間內完成所有設備的搬遷工作而沒有任何的設備損壞、遺失等,并保障客戶系統(tǒng)的及時恢復,主要是我們在下面實施之前與客戶保持了充分的溝通,就項目實施的各個環(huán)節(jié)進行了細致的分析和討論,形成了詳細的實施方案,此外,我們豐富的搬遷項目的實施經驗和優(yōu)秀的項目團隊保證了實施過程中各個環(huán)節(jié)的有效管理,確保了實施中設備與人員的安全以及項目的實施進度。
工程實施,特別是搬遷項目的實施過程中總會存在一定的風險和不可預測的因素。通過分析潛在的風險并采取有效的應對策略可以提前排除一些風險或者最大限度的減小風險帶來的損失,保證業(yè)務系統(tǒng)的運行不受影響。
因此,風險的分析和應對顯得尤為重要,一般搬遷項目的風險主要有:
通過分析風險,我們能夠提前發(fā)現項目實施中可能存在的問題,并且能將可能導致嚴重后果的一些問題提前消除,同時,經過項目組成員的頭腦風暴,也能加深團隊成員對整提項目和項目實施的細節(jié)有比較清晰的認識。當然,風險的分析也能提醒客戶對項目的實施中一些關鍵點重視,在具體實施中能夠積極配合我們全力保障項目的成功。
搬遷項目的一個非常重要的主要問題是項目的變更,由于變更給項目的搬遷進度和實施的成本都會帶來影響,有些是可能嚴重影響進度和成本的,在我們操作的這幾個搬遷項目中,項目的中的變更經常發(fā)生,作為項目的PM需要對客戶的變更進行評估并給出相應的方案,拒絕、接受,還是形成新的服務,這些都考量PM的智慧和問題的處理能力。
1、搬遷內容的變化:
在項目的實施中,客戶會經常有之前沒有考慮進搬遷清單的設備需要搬遷,還有一些額外的辦公設備等,有些可能不是少量的,可能導致工作量大大超出原有計劃,也增加了搬運費用。這些變更會極大的影響搬遷的進度、成本,增加項目實施風險。
對于這些變更,我們一方面要理解客戶的需求,另一方面要讓客戶理解變更對搬遷帶來的影響。我們需要評估變更的影響,并針對不同的影響程度制定相應的應對策略。
為了盡量減少實施中的變更,需要在項目啟動時與客戶充分溝通,盡量能分析客戶對搬遷項目的范圍并和客戶確認,針對客戶現場增加設備的要求,我們需要有一個變更的流程來影響客戶。對于變更可能對現有搬遷可能導致搬遷時間會延后,并且,搬遷成本會有大幅度的增加,這些都需要評估并與客戶溝通項目進度的影響。
2、設備信息的不準確
由于搬遷的設備到新機房后要馬上要投入運行,因此認真的調研和規(guī)劃是必不可少的。那么客戶提供的設備信息的準確度對我們項目的規(guī)劃和系統(tǒng)的及時恢復就顯得非常重要,但很多時候,客戶提供的搬遷設備信息可能不準確,這對我們的搬遷工作的風險是非常大的。因此,每次搬遷項目的準備階段,我們都需要花費了大量時間在原有機房設備的調研工作上,我們需要經過多次的核對以確保數據的準確性。
3、規(guī)劃變更
搬遷項目由于客戶規(guī)劃不規(guī)范或者規(guī)劃本來就沒有做好導致我們做搬遷方案和搬遷實施中可能由于規(guī)范的變更給我方的工作帶來很大難度,導致了很多無用功。
在調研的初期階段,我們會對新機房的機柜放置,設備放置,電源供電方式、IP地址和VLAN劃分等一系列規(guī)劃。基于這些規(guī)劃,我們來指定詳細的搬遷計劃。而做設備搬遷計劃涉及的限制因素太多(如機柜利舊,電源逆變器搬遷,電源分配,VLAN規(guī)劃等等),需要花費了大量精力,整個項目組花了好幾天的時間才完成,還要與客戶做了認真溝通和確認。然而在真正實施前以及實施過程中,客戶都可能由于某種原因對最初確認的規(guī)劃做大量的變更,很多地方甚至推倒重來,不僅增加了工作量和工作難度,也使之前的很多工作成果付之東流。
比如,某企業(yè)客戶在計劃階段就由于多次對搬遷設備的批次和順序變更導致實施方案變更,從而導致我們粘貼的標簽作廢,而在設備搬遷到新機房就位后由于客戶新機房網絡設備安裝錯誤導致上架好的設備重新調整機柜,影響到整個項目的進度。同樣在其他搬遷項目中,規(guī)劃的變更都會或多或少的發(fā)生,那么,作為項目團隊需要做好充分的溝通和詳細的方案設計并經客戶認可,以此來減少客戶的變更,當然,對于變更,如果能事先就有嚴格的變更流程增加變更的流程規(guī)范性以此讓客戶理解變更的成本。
4、布線和理線施工
搬遷項目中涉及最多的一項工作可能是光線線纜的布線和機柜線纜的理線工作,而這塊的重要性和工作量的巨大。在項目計劃階段就需要明確該項工作的責任:
- 布線和理線的分工界面要清晰
- 線材的準備要提前到位以免影響工期
- 布線標準和規(guī)范要提前確定好,以免返工
- 標簽規(guī)范要提前確定
- 布線和理線時間要預留充足的調整和測試時間
一般,搬遷項目的啟動之初,我們的主要精力都放在設備的搬遷上,主要考慮的是怎樣調研和規(guī)劃得更充分,如何在搬運環(huán)節(jié)不出任何差錯,保證將設備完好的搬遷到位,并保證馬上投入運行。針對項目中可能的變更帶來項目實施的工作量和難度則需要有一個提前的預判,對可能發(fā)生的問題有相應的應急預案。同時,需要對項目中的一些細節(jié)都要充分的估計。
搬遷項目的設備繁多,種類復雜,用戶需求反復變更,應用允許中斷的時間很短,實施難度非常大,需要與客戶協調的工作很多,作為機房搬遷工作的總協調服務商,負責總體進度控制、資源確認、實施協調等工作。主要完成需求清單附表中的設備搬遷工作,包括制定搬遷實施方案、風險分析報告以及應急方案,負責搬遷環(huán)境的勘查、路線設計、搬遷物資工具準備;負責搬遷前硬件檢測、設備核實、下架拆卸、標識、搬遷、運輸,裝開箱登記、核查、上架安裝、等物理搬遷工作,協助進行設備調試,準備必要的備機備件,提交項目管理及工作流程有關報告。客戶對我們的工作也很認可,也為后續(xù)其他項目的入圍和合作打下了深厚的基礎。
每個項目搬遷沒有發(fā)生設備丟失、損壞、掉包等事故,都按照計劃完成各階段工作,從中,我們體會也很多,要想比較完美的完成這樣一個系統(tǒng)工程,需要我們做好以下事情:
- 溝通,及時有效的溝通;
- 細節(jié),細節(jié)決定成敗;
- 流程,通過流程提高項目效率;
- 控制,實時掌握進度并及時調整方案;
- 確認,減少我們的“想當然”;
- 合作,分工合作,規(guī)范作業(yè)。
在華創(chuàng)云鼎承接的這些搬遷項目中,項目組密切協作,經常是不分日夜的艱苦奮戰(zhàn),克服了種種困難,最終保證每個搬遷項目的設備無一丟失,以近乎于零的故障率,順利完成搬遷和驗收。搬遷項目是對一個PM的歷練,也是對每一個項目組成員的考驗,職業(yè)規(guī)范、體力等等,經歷這些項目的實施,讓我們感受到部門、同事之間的無間配合,在此真誠感謝每一位參與項目的同事和關心項目實施的領導對我們的大力支持,感謝大家放棄元旦、五一、十一等節(jié)假日的時間支持項目,也感謝各位的家人對我們工作的理解和支持!
華創(chuàng)云鼎根據十余年的豐富的搬遷經驗,總結搬遷中關鍵點控制自研開發(fā)了“數據中心遷移管理信息平臺”,旨在對復雜搬遷項目的整體過程的關鍵環(huán)節(jié)進行有效的實時控制和管理,并展示整個搬遷實施的全景過程。
由于搬遷項目是一個項目實施時間長、項目重要性高、而且風險極大的工程,整個甲乙雙方的項目團隊都比較辛苦,作為實施責任主體的信息技術部也是一個出彩的機會,華創(chuàng)云鼎適時提供搬遷易企秀制作以宣傳客戶部門,為客戶提供整體的制作方案。目前制作的易企秀案例: