機房搬遷工程是非常復雜的,不只是搬設備,還需要制定一系列的計劃,今天就分享一篇機房搬遷方案。
機房搬遷工作內容
對于機房的搬遷,我們分為以下幾個步驟來考慮:
1、新機房的準備2、搬遷規(guī)劃3、系統(tǒng)的備份4、設備文檔的準備5、搬遷設備標簽6、設備拆除、打包和運輸7、設備重新安裝8、測試及驗收,下面我們分各個步驟來討論。
1.新機房的準備工作
1.1、確認設備的布局
新機房的基本設計(如:墻面的設計、空調的安裝等)完成后,我們需要提前規(guī)劃各個機柜、各個網(wǎng)絡設備的擺放位置。可以事先量好機器的具體尺寸,之后到現(xiàn)場規(guī)劃機器的具體擺放位置,力爭合理、充分地利用機房的有效空間。此處需要注意的問題:如果需要擴展機柜,則提前將綜合布線的數(shù)據(jù)信息點打在配線架上,這樣,等把交換機路由器等網(wǎng)絡設備搬遷過來,安裝好跳線,則網(wǎng)絡就可以正常使用。
1.2、設計綜合布線
為保證業(yè)務的正常運行,我們應該提前設計新機房的綜合布線、配線系統(tǒng)等準備工作,并和電信部門協(xié)調光纖接入,保證搬遷之前對外線路的暢通,確保不因線路問題影響搬遷的進度。提供新機房的綜合布線點位對照表。
1.3、設置正確的物理環(huán)境
正確的物理環(huán)境應該對場地的封閉、防火、防盜、防靜電、適當?shù)耐L、溫度的控制以及電源的安全等提供符合網(wǎng)絡設備要求的安全保證,具體包括:電力控制,溫度控制:機房溫度控制在15-23º C以內,如果可能,盡量配備溫度感應器進行監(jiān)測;濕度控制:機房內濕度一般應當控制在45-55%之間,火險控制,雷擊避免, 防塵,避光,空間控制。
這里遵循的原則是:利用空間、努力保持溫控、保持電源和KVM等線路的日常維護等綜合考慮。曾有人計算過,得出以"機體距離墻面12cm左右為宜"的結論,這里列舉出來,供我們參考。
1.4、設計合理的網(wǎng)絡結構
考慮新的機房時繼續(xù)沿用現(xiàn)在的拓撲結構、還是重新設計,設計時考慮和舊系統(tǒng)之間的對應關系。
2.搬遷規(guī)劃
機房的搬遷,一般都會涉及到服務器、交換機、路由器、工作站等大量的設備,很多軟件的問題,以及新機房IP的分配問題等。因而如果不提前進行詳細的規(guī)劃,匆匆上馬進行機房服務器等設備的搬遷,勢必會造成工作的混亂。所以在搬遷前,一個完整合理的機房搬遷規(guī)劃是必需的。
在進行詳細的規(guī)劃時,我們需要提供如下的材料: 機房的網(wǎng)絡拓撲圖、機房的設備連接圖和線路分布圖(細到每個設備的每條線路的連接)、設備等IP地址分配表、應用描述、服務時間。
應用的描述也是一個重要的方面。每臺服務器都是在運行不同的應用,我們收集這方面的資料以后,會根據(jù)不同的應用來考慮,如果機器在搬遷過程中出現(xiàn)由于系統(tǒng)問題導致應用無法啟動,將會準備一系列的方案,來協(xié)調其他的服務器來處理這部分的應用或者使用我們的備機來使機器恢復正常的運行。這部分的工作我們將在用戶的配合下來實施完成。
服務時間的確定也是搬遷工作中*的部分,我們會根據(jù)每臺服務器的不同的性質來安排每臺機器的菪機時間,根據(jù)每臺機器的不同的菪機時間來確定我們整個搬遷過程的安排,從而使搬遷過程能夠順利進行。避免計劃外的菪機時間。
此處需要注意的問題:
1.如果新舊機房的網(wǎng)絡配置有所改變的話,要提前作新網(wǎng)絡的規(guī)劃,并給出新舊網(wǎng)絡的信息對應表;
2.網(wǎng)絡配置需要考慮考慮VPN、VLAN的劃分,DHCP DNS的配置等;
3.根據(jù)網(wǎng)絡拓撲,合理分配新IP對應相應的域名和服務器;
4.做好IP更換腳本。即執(zhí)行該腳本,遷移前關機,再開機設備得到的就是新的IP。
3.系統(tǒng)的檢測及備份
在搬遷以前,我們要針對現(xiàn)有的服務器設備進行一次全面的檢測工作,包括:硬件的配置的檢測和軟件信息的檢測。準備工作要做的充分,這是保證搬遷工作能夠順利進行的首要條件。通過檢測我們不僅可以有效地把一部分隱患排除在搬遷之前,確保在搬遷過程中,機器設備的故障率降到低,從而避免在搬遷工程中的計劃外菪機時間。
3.1、硬件設備的檢測
針對服務器的硬件設備,我們將詳細的記錄服務器的硬件配置信息,在搬遷以前明確硬件配置,具有針對性地準備一些備件,在服務器菪機的時候能夠及時的修復服務器,及時的解決由于硬件故障產生的計劃外菪機,避免不必要的菪機時間。
3.2、服務器軟件應用的檢測
針對服務器的軟件應用,我們同樣也要進行一些常規(guī)的檢測,把一些由于軟件問題產生菪機時間減少到低限度。從而使搬遷工作能夠順利進行。
3.3、數(shù)據(jù)的備份
數(shù)據(jù)的安全性在每個企業(yè)中都是至關重要,數(shù)據(jù)的丟失,不是以金錢來衡量的,所以數(shù)據(jù)備份在搬遷過程中顯得尤為重要,甲方負責搬遷前數(shù)據(jù)備份工作,即使在搬遷過程中,真正遇到服務器系統(tǒng)問題時,我們也能夠在短的時間內解決問題,減少計劃外的菪機時間。確保搬遷工作的順利進行這里數(shù)據(jù)的備份,包括所有關鍵數(shù)據(jù),如:操作系統(tǒng)、應用程序、數(shù)據(jù)庫、服務器的配置參數(shù)、網(wǎng)絡設備的配置參數(shù)等。
4.設備文檔的準備
4.1、對設備進行分類統(tǒng)計
目前我們的中央機房設在四層,其中的設備包括UPS、配線架、核心交換機、服務器、防火墻、存儲設備等, 我們對于機房目前涉及的設備統(tǒng)計表如下:
4.1.1、網(wǎng)絡統(tǒng)計
保證搬遷后系統(tǒng)的正常工作,出具一份現(xiàn)有網(wǎng)絡設備的設備列表、網(wǎng)絡設備連接表、原有的IP地址分配表以及模塊線纜型號統(tǒng)計表。
4.1.2、服務器、存儲等設備統(tǒng)計
原有存儲設備、服務器確認,確定服務器的數(shù)量,服務器的型號等,并且在搬動服務器之前必需有詳細的表格記錄。同時對SAN網(wǎng)絡涉及的陣列、交換機也做一個詳細的記錄。
進一步需要做的工作是: 給出進一步詳細的設備統(tǒng)計信息,包括設備型號、配置、所在的網(wǎng)絡、電源接口及功率等,在搬遷之前給出相應的表格記錄文檔; 確定相關的輔助設備配件等,同樣需要有詳細的記錄文檔。
4.2、IP地址的統(tǒng)計
統(tǒng)計出需要遷移的設備的IP地址(包括公網(wǎng)和私網(wǎng))以及路由情況,給出各個設備IP對應表; 列出設備在新系統(tǒng)和舊系統(tǒng)中的IP 對應表。
4.3、各類設備的搬遷
一般來講,設備搬遷的順序是: UPS、服務器系統(tǒng)、通訊系統(tǒng),然后網(wǎng)絡設備,終端設備等。當然,也可以考慮先把不影響辦理日常業(yè)務的設備先行搬到新大樓,例如:一些顯示器、終端、主機、電源線等。
4.3.1、UPS
UPS(不間斷電源)是能夠提供持續(xù)、穩(wěn)定、不間斷的電源供應的重要外部設備。它主要的功能就是,當市電輸入正常時,會將電流穩(wěn)壓后供應給負載使用;當市電中斷時,會及時向用電設備提供電能,使設備仍能持續(xù)工作一段時間,以便處理好未完成的工作。
我們在UPS的搬遷時需要注意:搬遷的過程中注意不要接觸磁性物質,正確的開關的步驟
一般情況下,打開UPS電源的正確順序應該是:先檢查UPS電源的輸入端電源極性與市電供電線路的電源極性連接是否一致,然后再檢查UPS電源輸出端所接負載的總功率大小是否在UPS電源的額定功率之內;滿足了上面的條件后,打開UPS電源控制柜上的電源開關,來讓市電為UPS內的電池組進行供電,過一段時間,再將負載的電源開關逐一打開,如此一來可以確保負載電流,不會對UPS電源的內部供電線路造成過度沖擊,從而可以有效保證UPS電源不受內傷。正確關閉UPS電源的順序應該是:先將連接到UPS電源輸出端的負載逐一關閉掉,之后再將電源控制柜上的電源開關關閉掉就可以了,如果長時間不使用UPS電源的話,可以考慮將連接到市電插座上的電源線纜拔掉,以避免雷雨季節(jié)UPS遭遇雷電襲擊,從而引發(fā)雷擊事故。
新機房放置UPS時需要注意:
· 重量承受:UPS長延時配置時,電池可能較重,此時應考慮地板承重;?
· 空間大小:應保證UPS進行維護時,工程人員有一定實施空間。
· 接地情況:有良好的接地系統(tǒng),一般接地電阻應小于5歐姆。
4.3.2、服務器
服務器是網(wǎng)絡數(shù)據(jù)的核心。 對于服務器這種集成度和精密度都非常高的計算機設備,我們在進行安裝和卸載部件操作時,一定要格外小心。
搬遷時需要注意
· 正確關閉電源
對于一臺已經(jīng)配置好的服務器來說,它的關閉和打開操作很簡單,但如果操作方法不當,有可能對設備造成不必要的損壞。因此,有必要對服務器的開機、關機做一詳細介紹。
關機操作:1.關閉操作系統(tǒng);2.關閉主機電源;3.關閉外設電源 (如磁盤陣列,磁帶庫等);4.關閉其他設備電源和機柜電源;5.關閉總電源。
開機操作:1.打開總電源;2.打開計算機機柜電源;3.打開外部設備電源(如磁盤陣列,磁帶庫等);4.待外部設備自檢完成后,打開主機電源。
· 服務器的拆裝
總的原則:先關掉所有的服務器工作站,關掉交換機路由器等用電設備,然后關掉總的電源,后才進行服務器的拆卸。
· 全面預防靜電
雖然計算機是靠電力工作的,但靜電卻會給計算機帶來致命傷害,尤其是可能對主板芯片造成不可逆的損壞。靜電產生的原因很多:各種電源設備可能產生靜電,計算機CRT顯示器可能產生靜電,工作中的對講機也會在周圍空間產生大量的靜電,這就要求我們要特別小心靜電的干擾,全面預防。1.盡量使服務器及其周邊設備的接地良好。2.如果設備沒有接地,當我們要接觸里面的板卡時,應先用接地導線或其他放電設施對其進行放電。3.對設備進行操作時,應配戴防靜電手套,如果沒有的話,也可以用手觸摸一下機箱外部的金屬來放掉自身攜帶的靜電。
· 電纜連接(插拔)
電纜在進行電纜連接(插拔)時,通過該電纜連接(或將要連接)的設備應當是沒有加電的,即應當先將設備的電源關掉,然后再進行電纜連接(插拔)操作。否則,如果帶電進行電纜連接,有可能會對設備造成無法預料的損壞。
4.3.3、網(wǎng)絡設備
網(wǎng)絡設備主要包括防火墻、路由器、交換機等設備,這些設備在搬遷過程中注意標記,并且在接入新網(wǎng)后根據(jù)新網(wǎng)的結構進行正確的參數(shù)設置。這里需要注意的是,路由器使用帶有接地的電源。一般要求使用的電源的零地間 的電壓<4V,零火/地火的電壓就為220V。地線保護基本上要求上網(wǎng)的設備需有保護地線,這些設備包括主機、工作站 、HUB、交換器、路由器及連接路由器的MODEM等。配置路由器的終端或PC機也必須使用帶有接地的電源。
搬遷之前注意檢查設備的配置、正確斷電,搬運過程中注意不要碰撞。
5.搬遷設備標簽
我們的目標是:掌握原有的網(wǎng)絡情況,力求要做到每一條物理,邏輯的線纜,專線都心中有數(shù),所有網(wǎng)絡設備的配置,每個接口都要一清二楚,所有設備,線纜都要貼標簽,所有接口的配置,說明都要有文字上的說明。在給設備做標簽時,一般是采用貼設備銘牌的方式,線纜采用的標識環(huán)。
關于設備標簽的規(guī)劃,一般是各單位自己制定,沒有統(tǒng)一的標準,這里我們可以考慮,按設備的類型、功能、區(qū)域等進行編號。每臺機器搬之前都要貼好標簽,特別是多端口的機器,每個接線端口都貼上標簽,與接線的另一端相對應,比如storage的盤柜與controller的連線端口,storage與server的光纖的連接端口等,還有每臺server的每個網(wǎng)卡的ip等。
后,對設備標識完成后,注意做好標識的備份工作,以備設備重裝時核查。所有標示,做到一一對應,保證在搬遷過程中能夠準確的找到某一臺機器設備,保證搬遷的順利進行。
6.設備拆除、打包和運輸
在對設備進行統(tǒng)一的標記后,進行設備的拆除、電纜的拆除。這里我們需要注意的是:
· 確保所有的工作都在斷電的情況下進行;
· 考慮各部件的拆卸步驟;
· 嚴格按照各類設備的規(guī)范來拆除。
設備拆除后,裝入專門的搬遷保護裝置,如:電纜放入線槽進行保護。之后在各個責任人的共同監(jiān)視下裝上車,大家共同看護下,將設備運往新大廈的機房。由于我們搬運的設備,如服務器,UPS,終端等都是集成度和精密度非常高的設備,因而在整個過程中,需要注意防止設備的碰撞。
6.1、設備的拆卸
工程師按照項目進度表的時間來確定設備的拆卸時間,嚴格遵守規(guī)范化操作,保證設備沒有物理性的損壞。
操作步驟:
1、把連接設備的數(shù)據(jù)線和電源線拔掉,從機柜上拆卸下來,所有的電源線放置在統(tǒng)一的包裝箱中,在包裝箱上寫上貨物的名稱,并打包封后待運。
2、把設備從機柜上拆卸下來,進行除塵工作后,放到的包裝箱中,在包裝箱的外殼上寫上貨物的名稱,并打包封箱后待運。
3、把設備的導軌從機架上拆卸下來,并貼上標簽,注明使用的設備的名稱,放到的包裝箱中,在包裝箱上標明貨物的名稱,并打包封箱后待運。
4、把PDU從機柜上拆卸下來,放到的包裝箱中,在包裝箱的外殼上寫上貨物名稱,并打包封箱后待運。
5、所有的螺絲等輔助設備分類分包,放在其關聯(lián)設備的包裝箱中保存待運。
6.2、運輸過程
使用專業(yè)的設備運輸包裝箱,確保硬件設備在運輸過程中的安全性。包裝要求按照工業(yè)標準。并附有貨物清單,由人員進行驗收,簽字確認。
1、裝箱用手推車運送到運輸車輛處,由專業(yè)的搬運工小心輕放到運輸車上,整齊擺放,固定,以防滑落。
2、有押運人清點貨物后,押運到新的辦公地點。
3、運輸車在運輸?shù)倪^程中,一定要注意車輛慢行,以防在道路顛簸的情況下?lián)p壞設備。
4、卸貨時由專業(yè)的搬運工把貨物先卸到貨梯門口,然后由押運人清點貨物全部到場后,由專業(yè)的搬運工把貨物搬至位置。押運人再次清點無誤后準備安裝。
7.設備重新安裝
7.1、物理安裝
設備搬運到新的機房后,首先確定設備的放置位置,檢查電源等相關事宜是否做好,后,進行物理連接。
這里需要注意:
· 區(qū)域規(guī)劃。在設備安裝時,盡量按網(wǎng)絡拓撲結構進行區(qū)域的規(guī)劃,并為以后的擴展保留空間和相關接口。
· 對機柜進行有效的固定。機柜不能是直接擺放在靜電地板上,而要進行有效的固定,這樣安裝才可靠。
工程師按照安裝方案,把包裝箱打開,根據(jù)安裝方案把服務器上機架。嚴格遵守規(guī)范化操作,把服務器安裝到位子。
1、安裝PDU:安裝工程師首先安裝PDU,按照安裝方案要求,把PDU固定到機柜上的位置。
2、安裝導軌:安裝工程師把服務器的導軌安裝到機柜上的位置,以便服務器上機柜。
3、安裝服務器:安裝工程師把服務器安裝到機柜上的位置。
4、安裝電源線:用電源線把服務器于PDU連接,把電源線捆綁在配線架上。
5、安裝SWICH:把SWICH固定在機柜上的位置。
6、連接數(shù)據(jù)線:連接SWICH到服務器,連接網(wǎng)絡線。
7.2、設備加電系統(tǒng)核查
設備物理連接完成后,為設備加電,測試電源電壓,進行加電后系統(tǒng)的軟硬件檢查。
8.測試及驗收
設備重新安裝后,我們接下來要做的工作是:打開設備,查看數(shù)據(jù)是否損壞,并進行相關的軟件設置。一般來說,要進行的工作大致包括如下的幾項:
1.服務器狀態(tài)的恢復,查看是否出現(xiàn)了數(shù)據(jù)的丟失或損壞。這里由于我們之前對系統(tǒng)數(shù)據(jù)作了備份,所以,一旦出現(xiàn)了這種數(shù)據(jù)的損壞等,我們應該把搬遷前的數(shù)據(jù)重新恢復過來。
2.進行相應的IP地址的調整。
3.進行相關DNS設置的調整。
4.進行相關軟件的調整。
5.進行全網(wǎng)設備連通型的測試
6.進行應用測試,確保系統(tǒng)的正常運行。
7.所有的設備重新啟動,看設備運行的速度和質量等指標是否達到標準。
8.驗收并進行相關的日志紀錄。
需要注意的幾點問題:
1、搬遷時間的選擇由于我們的系統(tǒng)需要保證實時、不間斷的運行,所以盡量選在假期或工作日的半夜2-3點,這時訪問量是相對比較低,減少對業(yè)務的影響。考慮到此因素,我們會定在長假期間進行搬遷。
2、設備標簽在搬遷過程中,注意對標簽的保護,防止標簽的脫落,尤其是光纖等線纜的標簽,以免對后面的重組造成影響。有時候,可能就是一根光纖跳錯位,就可能影響整個網(wǎng)絡的暢通。
3、數(shù)據(jù)的備份在系統(tǒng)遷移前,一定要做好各個系統(tǒng)的備份(磁帶機備份),確保數(shù)據(jù)的完整性和正確性。
4、提前做好設備的測試方法確保在搬遷完后,各類設備都有明確的測試方法。
5、制定應急方案對于搬遷過程中可能發(fā)生的多種突發(fā)事件的應急方案,如主機不能正常運轉怎么辦,網(wǎng)絡核心設備無法正常運轉怎么辦,電源意外斷電怎么辦等。
6、責任到人搬遷時候要有個切換步驟詳細到具體某個人做什么,設備的運輸時要裝箱、登記、發(fā)貨、收貨都要有專人負責。
7、確保搬遷階段新機房市電供應正常,以及貨運電梯工作正常,所有準備工作*到位之后,才能開始具體的搬遷工作