電信IDC機房維護保障方案
福建電信IDC機房維護保障方案
1.機房穩(wěn)定保障:應提供基本IDC保障,包括穩(wěn)定的電力供應、網(wǎng)絡環(huán)境、溫濕度,并提
供可靠的網(wǎng)絡安全、安保、消防等防護。并配備經(jīng)驗豐富工程師隨時應急處理故障等。如因環(huán)境問題引起的網(wǎng)絡中斷、設備損壞等情況應賠償我方直接、間接經(jīng)濟損失。
2.機房基本設施提供:包括座椅、機房專用推車、顯示器、鍵鼠、排查、螺絲刀、老虎鉗、
網(wǎng)線、夾線鉗、測線儀、拖鞋、鞋套等。(目前東門機房座椅較少)
3.機房值班配合:如服務器出現(xiàn)宕機、我們暫無人員在現(xiàn)場或短時間內無法到達現(xiàn)場時電
信值班人員現(xiàn)場配合處理,此要求重點在于電信機房值班電話必須7*24小時電話暢通,機房值班人員具備IDC相應技能。
4.機房施工配合:我方新入服務器時安排足夠網(wǎng)絡、電力、機架空間等相應環(huán)境資源。如
服務器進入時安排施工隊對內外網(wǎng)網(wǎng)線進行布置、機架擋板調整等工作,施工工作應在當日進行,避免出現(xiàn)應環(huán)境未搭建拖延服務器出機完成時間現(xiàn)象。
5.機房日常巡查:每天至少一次巡查機房。核查電力、空調運行是否穩(wěn)定,并每周巡查所有服務器前端告警界面是否出現(xiàn)異常告警等。
6.目前網(wǎng)龍公司在電信所有操作都必須向電信下操作單,因本司移服、更換IP操作機器
頻繁。下單又存在一定延時,給本市工作效率造成一定影響。建議今后網(wǎng)龍公司在電信機房除服務器進出仍需下單外其他操作,如更換IP、遷移位置、劃分VLAN操作免除電子單據(jù)。
7.升級機制配合措施:(包含多種方案)方案A:如因網(wǎng)龍公司人員無法每日前往機房處理問題,建議針對網(wǎng)龍公司升級服務,遇到如更換故障服務器硬盤時配合更換。針對電信擔心備件數(shù)量問題,我司將針對此建立應急備件庫專供電信使用。
方案B:如因網(wǎng)龍公司人員無法每日前往機房處理問題,建議針對網(wǎng)龍公司升級服務,在突發(fā)故障時由電信幫忙進行現(xiàn)場操作,包括服務器故障排查,網(wǎng)龍故障排查,服務器IP變更,服務器機柜遷移等操作。
方案C:如因網(wǎng)龍公司人員無法每日前往機房處理問題,建議針對網(wǎng)龍公司升級服務,所有公司現(xiàn)場操作有電信幫忙處理,包括服務器上下架,GHOST系統(tǒng),現(xiàn)場故障處理,現(xiàn)場服務器運維等(類似服務器租用服務)。此工作量較大,需電信擴招一專人負責。7*5服務標準即可。
擴展閱讀:IDC機房維護應急預案
應急預案手冊
數(shù)據(jù)中心服務應急預案手冊
二O一0年三月
第1頁應急預案手冊
目錄
一、市民卡機房部分應急預案..........................................31機房系統(tǒng)故障處理通則............................................3
1.1故障等級........................................................31.2故障處理與通報制度..............................................32機房動力應急預案................................................4
2.1機房停電故障:..................................................42.1.1準備工作:...................................................42.1.2停電情況下處理方式:.........................................42.1.3市電恢復后的操作:...........................................52.2UPS故障處理.....................................................52.3開關電源整流模塊故障的緊急處理方案..............................62.4機房空調及局部過熱故障的緊急處理方案............................62.4.1機房空調故障的應急處理步驟...................................62.4.2機房局部設備溫升過快或過熱的處理步驟.........................72.5應急方案處理過程中非常事件的處理................................73機房防汛應急預案................................................7
3.1防汛應急預案內容................................................73.1.1第一預案.....................................................73.1.2第二預案.....................................................73.1.3第三預案.....................................................73.1.4第四預案.....................................................74機房防火應急預案................................................8
4.1應急保障原則....................................................84.2火災事故應急處理流程及措施......................................9
第2頁應急預案手冊
一、市民卡機房部分應急預案
1機房系統(tǒng)故障處理通則
凡系統(tǒng)發(fā)生故障時,網(wǎng)管運行監(jiān)控負責人必須立即組織搶修,不得拖延。運行監(jiān)控人員均應熟悉故障緊急處理流程,熟練掌握操作步驟和方法。
運行監(jiān)控管理人員應如實上報故障情況,故障報告應當做到時間清、原因清、結果清。
重大故障和嚴重故障要報上級業(yè)務主管領導。對已處理的重大故障和嚴重故障,事后必須做故障分析,查清故障原因,確定故障性質和責任,采取防范措施,避免同類故障再次發(fā)生。
故障處理基本原則:先重點后一般;先調通后維修。1.1故障等級
網(wǎng)管系統(tǒng)的故障等級共分三類:1、重大故障
在系統(tǒng)運行期間,關鍵設備(包括傳輸或其它專業(yè)所屬設備)、軟件故障造成所有網(wǎng)管業(yè)務中斷超過24小時。
2、嚴重故障
在系統(tǒng)運行期間,關鍵設備(包括傳輸或其它專業(yè)所屬設備)、軟件故障造成下列情況之一的系統(tǒng)故障:
(1)所有網(wǎng)管業(yè)務中斷超過12小時但不超過24小時;(2)網(wǎng)管個別業(yè)務中斷超過24小時;3、一般故障
除重大故障和嚴重故障外的其他故障。1.2故障處理與通報制度
網(wǎng)管中心應建立相關設備故障處理聯(lián)系制度,并將聯(lián)系人和聯(lián)系方法張貼在醒目位置。
網(wǎng)管中心應建立設備操作手冊和故障處理流程,并存放在固定地點。網(wǎng)管中心應建立設備運行情況統(tǒng)計和登記表,并存放在固定地點。故障處理:
1、在系統(tǒng)發(fā)生故障時,值班人員應對照運行維護手冊進行簡單的故障處理和準確定位,對無法處理的故障應立即通知系統(tǒng)維護主管工程師,并逐級上報。系統(tǒng)維護主管工程師組織相關人員現(xiàn)場處理,故障處理完畢后,馬上通知故障發(fā)起點,并進行詳細記錄。當系統(tǒng)發(fā)生故障時,網(wǎng)管中心運行維護負責人必須立即組織搶修,不得拖延。
2、在處理故障時,應嚴格按照故障處理流程進行,整個流程強調閉環(huán)管理,按先重點后一般;先調通后維修的原則進行。
3、在系統(tǒng)和設備故障處理的過程中,若出現(xiàn)較為嚴重或一時無法解決的問題,及時通知故障發(fā)起點,并立即向主管領導匯報,同時與廠家聯(lián)系,及時爭取技術支持,填寫故障報告。
4、在系統(tǒng)設備故障處理過程中,若使用了備件單元或備用電路板,應按規(guī)定分別詳細登記故障發(fā)生的工作單元、故障現(xiàn)象或故障代碼、換用備件名稱、編號,有條件時應附上當時的打印記錄,向主管報告,并及時與備件管理人員取得聯(lián)系,按正確的手續(xù)
第3頁應急預案手冊
發(fā)送返修。
5、在相關專業(yè)部門或設備供應商進行搶修的過程中,網(wǎng)管中心應負責協(xié)調相關專業(yè)部門,采取其它措施對網(wǎng)絡進行監(jiān)控。
6、在相關專業(yè)部門或設備供應商進行搶修的過程中,網(wǎng)管中心應負責協(xié)調相關專業(yè)部門,采取其它措施對網(wǎng)絡相關數(shù)據(jù)進行保存和統(tǒng)計。
7、網(wǎng)管中心在相關故障排除后48小時內提交故障分析報告。報告將視故障級別上報所在公司運行維護部和上級網(wǎng)管中心。
運行維護人員均應熟悉故障緊急處理流程,熟練掌握操作步驟和方法。故障通報:
1.發(fā)生嚴重故障和重大故障時,由地(市)級網(wǎng)管維護部門直接向省級分公司網(wǎng)管中心和運行維護部報告。
2.對重大故障,分別由省級分公司網(wǎng)管中心和運行維護部上報至總部運行維護部網(wǎng)管中心。
3.如遇特殊情況也可越級上報。各分公司必須嚴格按照規(guī)定時限執(zhí)行。
4.重大故障和通信事故,由總部運行維護部通報總部相關部門和各省級分公司。當出現(xiàn)值班人員不能解決的故障時,值班人員應立即上報系統(tǒng)維護主管工程師和部門主管
故障處理完畢一天內,系統(tǒng)主管工程師寫出故障報告,上報部門主管,重大故障和嚴重故障要報上級業(yè)務主管部門。
當發(fā)生故障時,機房當班人員應將故障發(fā)生經(jīng)過詳細填寫進《值班日志》。
5、如果網(wǎng)管系統(tǒng)出現(xiàn)嚴重故障,在故障發(fā)生后應在第一時間向上一級網(wǎng)管中心通報相關情況。
6、出現(xiàn)故障后,由網(wǎng)管中心指定專人向相關部門通報故障影響范圍和處理情況等。運行維護負責人應如實上報故障情況,故障報告應當做到時間清、原因清、結果清。
2機房動力應急預案
2.1機房停電故障:2.1.1準備工作:
1、停電后第一時間電話咨詢供電公司(95598)詢問停電原因及停電時長。
2、電話通知相關領導停電狀況,如果在值班過程中停電需同事共同處理的也及時通知,在停電期間要保持通信暢通有問題及時聯(lián)系。(領導電話:顧星:15651500818;石振:15651500660;張黎明:15651500661)
3.準備扳手、六棱起、數(shù)字萬用表、“+”字“”字螺絲刀各兩把(大、。┑瘸S秒姽すぞ,準備好高壓絕緣手套、絕緣鞋、專用扳手。以及油機房鑰匙.
4.以上3點工作盡量在最短時間內結束,然后針對故障原因作出相應處理。2.1.2停電情況下處理方式:
由于永豐IDC機房為一路高壓市電引入,如出現(xiàn)市電停電,變壓器故障等原因造成停電現(xiàn)象出現(xiàn),只能采用應急油機發(fā)電.現(xiàn)應急油機發(fā)電步驟如下:
1、維護人員趕至永豐IDC機房后,首先確認是否需要發(fā)電.若趕至現(xiàn)場后,發(fā)現(xiàn)市電已經(jīng)恢復供應,只需要將低壓配電系統(tǒng)中P1柜和P6柜的斷路器合閘即可恢復機房市電
第4頁應急預案手冊
供應.
2、確認需要發(fā)電,首先前往一樓辦公室內拿油機室鑰匙(聯(lián)系電話:15651500661).并將位于永豐大樓北側的油機出風口打開.
3、打開出風口后,前往位于永豐地下車庫的油機房,首先打開油機房玻璃移窗方便油機進風,檢查油機油位,水位等.檢查無誤后,啟動油機.
4、啟動固定柴油發(fā)電機,觀察油機工作狀態(tài),正常,運行5-10分鐘后將油機負載開關合閘。此時,油機電送至機房低壓P12發(fā)電機柜,由于斷路器未合閘,機房尚未恢復供電.油機空載運行.
5、在油機空載運行期間,分別切斷負載電流比較大的用電設備,以減小合閘電流對油機的沖擊。依次切斷:開關電源的主用,備用分路開關,2樓空調配電箱和辦公空調的電源開關,1#、2#UPS的市電輸入開關,
6、搖出P1進線柜斷路器,確認與市電網(wǎng)絡斷開后,將P12油機斷路器搖至運行位置,將P11進線柜斷路器搖至運行位置,合P12斷路器,合P11斷路器.合P6斷路器.機房照明恢復.再分別合上:開關電源的主用,備用分路開關,2樓空調配電箱和辦公空調的電源開關,1#、2#UPS的市電輸入開關等負載較大的開關。
7、此時所有負載由油機供電,油箱內200L柴油預計能帶載運行7小時左右。如果停電時間超過4小時應聯(lián)系供油車添加柴油,加油工作必須停柴油發(fā)電機后進行。電池放電時間估計在40分鐘左右,加油工作必須在停機20分鐘內結束,如果不能加滿可等電池充滿電后再次添加。
2.1.3市電恢復后的操作:
1.當市電來電后,再依次切斷:開關電源的主用,備用分路開關,2樓空調配電箱和辦公空調的電源開關,1#、2#UPS的市電輸入開關。
2.斷開P11柜的低壓母聯(lián)開關,斷開P12柜的油機供電開關,油機退出帶載運行。(油機空載運行5-10分鐘后停機。)
3.分別將P1柜的市電總開關搖至運行位置并合閘,檢查確已合上;合上P6柜聯(lián)絡開關,并檢查確已合上。
4.無異常,再分別合上:開關電源的主用,備用分路開關,2樓空調配電箱和辦公空調的電源開關,1#、2#UPS的市電輸入開關.
5.所有設備恢復市電供電,檢查設備的供電運行情況。
6.確認設備運行正常后,至油機室分油機負載開關,關閉油機,關閉油機室玻璃窗,關閉北側油機室出風口.
2.2UPS故障處理
永豐核心機房UPS系統(tǒng)為2臺梅蘭日蘭80KVAUPS的并機系統(tǒng).如80KVAUPS系統(tǒng)中一臺UPS故障,系統(tǒng)自動將負載倒到另一臺UPS上,如何關閉故障的UPS,如何再次開啟UPS,如下:
關機:
1、先將旁路轉換開關打到“ON”的位置:2、將UPS輸出開關打到“OFF”位置
3、分別關掉UPS的S1,F1和F2開關,這時UPS停止運行;4、關掉UPS輸入開關,系統(tǒng)關機完畢。開機:
1、首先確認UPS的S1,F1和F2開關都打到“OFF”位置,配電柜的UPS輸出開關也
第5頁應急預案手冊
在“OFF”位置。
2、先把旁路轉換開關打到“ON”的位置
3、分別將UPS的F1,F2開關合閘,再將S1開關合閘;
4、當UPS面板指示為旁路供電狀態(tài)時,再把旁路轉換開關打到“OFF”位置這時,UPS轉到正常工作模式,啟動完成。
5、最后合上UPS輸出開關,系統(tǒng)供電正常。當關掉其中一臺UPS再啟動的方法:1、先把旁路轉換開關打到“ON”的位置
2、再把已關掉的UPS的S1,F1,F2開關分別打到“ON”的位置;
3、當兩臺UPS面板指示為旁路供電狀態(tài)時,再把旁路轉換開關打到“OFF”位置這時,兩臺UPS轉到正常工作模式,啟動完成
2.3開關電源整流模塊故障的緊急處理方案開關電源整流模塊故障的更換操作步驟:以永豐IDC機房的整流柜為例:
開關電源系統(tǒng)總共有10個整流模塊,實際運行6個,4個備用。
假設第5個整流模塊故障,無直流輸出,現(xiàn)場檢查后無法修復,需要更換備用的模塊。
1、關閉該模塊的交流輸入開關,
2、將背面的交流輸入電源線、直流輸出電源線和通訊線依次拔下,3、擰下前面板的固定螺絲,將故障模塊抽出,
4、將備用模塊插入故障模塊原來的位置,擰緊固定螺絲,
5、然后將背面的交流輸入電源線、直流輸出電源線和通訊線依次插上,6、調整此備用模塊的地址編碼為:4,7、合上此模塊對應的交流輸入開關,
此時,備用模塊更換完畢,查看模塊輸出是否正常。
注意:更換整流模塊時要注模塊前面板的地址碼,必須要和故障模塊的一致,否則會產(chǎn)生模塊通訊中斷告警。
2.4機房空調及局部過熱故障的緊急處理方案2.4.1機房空調故障的應急處理步驟
發(fā)生機房空調故障,會使機房的溫度升高,危害設備正常運行。所以發(fā)生此類故障后,要積極維修,如果一時無法修復,必須采取應急措施,保障機房環(huán)境符合要求。
現(xiàn)在的機房空調都是2主1備份或一主一備,一臺空調故障,其他空調可以正常工作。
1、首先判斷機房空調什么故障,如果壓縮機故障,送風機工作正常,
此時,要把鄰近的空調的溫度設定值調低1-2度即可。這樣,故障空調的風機可以形成空氣對流,對故障空調區(qū)域的設備影響不大;蛘弑M量將機房防靜電地板掀開.增將出風口.
如果是空調的送風機故障,不能正常送風,
此時,就要把鄰近的空調的溫度設定值調低2-3度,然后把鄰近空調的送風口的格柵盡量調整到故障空調前面的區(qū)域,這樣才能的保障機房溫度不至于上升。或者盡量將機房防靜電地板掀開.增將出風口.
第6頁應急預案手冊
或者拿普通的電風扇在故障空調的影響區(qū)域吹風,打開機柜門,冰塊局部降溫等措施防止局部升溫過快。
2.4.2機房局部設備溫升過快或過熱的處理步驟首先將此設備的機柜門打開,讓熱空氣充分散出,也可以用電風扇對此設備吹風,加快散熱速度,
購買冰塊,放在大盆里,置于局部過熱部位,利用冰塊融化吸收熱量,或者同時放置冰塊并用電風扇吹。
2.5應急方案處理過程中非常事件的處理
1、當?shù)归l過程中出現(xiàn)可盡快恢復的操作錯誤時,機房負責人要及時制止,并立刻安排恢復操作。
2、當停電倒閘或油機帶載過程中發(fā)生不可預見的非常情況時,全體現(xiàn)場人員應采取適當?shù)膽贝胧┍Wo通信設備供電安全并立即報告相關領導,召開緊急會議,研究處理方案。
3機房防汛應急預案3.1防汛應急預案內容3.1.1第一預案
當受臺風或強熱帶風暴影響風力達8級以上,暴雨日雨量達50.1毫米以上或氣象等有關部門發(fā)布暴雨將達起始標準后,各機房負責人、機房代維負責人必須到位,加強值班,嚴格執(zhí)行報告制度,做到上情下達,下情上報。值班領導和人員遇到突發(fā)事件或災情,及時下達臨時緊急處置指令,并迅速向公司上級分管領導匯報。各值班人員要做好防汛值班記錄,并檢查機房防汛值班到崗到位情況。無錫防汛工作值班電話:88654444。
3.1.2第二預案
當氣象臺發(fā)布暴雨警報時,防汛應急工作小組成員全部到位。并及時向公司分管領導通知防汛信息,通報風情、水情、雨情。各機房防汛應急工作小組成員要根據(jù)各自的職責,加強值班,進一步檢查落實各項防汛應急措施,組建各類防汛搶險隊伍,落實搶險物資。
3.1.3第三預案
當暴雨襲擊或縣有關部門發(fā)布緊急警報時,防汛應急工作小組成員要按各自的職責進入指揮崗位。并立即進行緊急部署要把防汛作為壓倒一切工作的頭等大事來抓,并落實各項防汛應急措施。
3.1.4第四預案
遇暴雨突發(fā)性災害天氣時,防汛應急工作小組成員要迅速組織人員及時檢查疏通地下排水管道,做到排水暢通;要組織專門力量,對易積水的機房進行監(jiān)測,及時報告災情,小組領導要監(jiān)督各校園有關人員到位、到崗,確保機房排澇設施全過程、滿負荷運轉,必要時及時組織足夠的臨時排澇設施進行強排。確保人員生命、公司財產(chǎn)安全。
第7頁應急預案手冊
當遇到暴風雨襲擊時,各小組成員應及時把機房汛情在第一時間報告公司分管領導,公司根據(jù)災情,聯(lián)系有關部門及時趕赴現(xiàn)場,做好搶救、轉移和安置工作。
4機房防火應急預案
4.1應急保障原則
一、當發(fā)生火災事故時,搶險工作應遵循如下原則:
1.堅持“統(tǒng)一領導、分級負責、嚴密組織、密切配合、快速反應、保障有力”的原則。
2.堅持快速恢復生產(chǎn)、減少經(jīng)濟損失的原則。
3.堅持原則性與靈活性相結合的原則,注意講究策略和方法。
二、消防安全管理基本原則:
1.堅持“預防為主,防消結合”的原則。
2.堅持“誰主管、誰負責”的“兩誰”原則。
第8頁應急預案手冊
4.2火災事故應急處理流程及措施永豐大廈機房消防操作流程
確認火警真實火警通知所有值班人員撥119報警報消防負責人準備圖紙組織公司接消防車滅火人員動滅火查明原因備案
接到火警報告誤報警查原因緊急疏散設備及系統(tǒng)復位復位未復位隔離報修啟
第9頁應急預案手冊
警衛(wèi)室消防控制器告警消音ALARMSILENCE現(xiàn)場確認誤報警確認起火機房內無人復位SYSTEMRESET起火機房門口FM-200氣體滅火報警控制盤誤報警打開黃色按鈕EXTINGUISHANT消音SILENCEALARM復位LAMPTEST&RSET綠色急停按鈕EXTINGUISHANTHOLDOFF緊急停止并延時30秒(長按保持停止狀態(tài))滅火復位LAMPTEST&REST
若按鈕無效,則進入鋼瓶室內,找準相對應的鋼瓶(鋼瓶上標有機房名稱),拔掉鋼瓶頂端紅色按鈕下方的阻塞桿,按下紅色按鈕即可。
注意:必須先確認起火機房內已無任何人員
第10頁應急預案手冊
IDC機房消防系統(tǒng)使用流程
值班人員發(fā)現(xiàn)消防系統(tǒng)告警判斷是否誤告警判斷是否可以自滅自救啟動管網(wǎng)式氣體滅火系統(tǒng)確認誤告警原因,消除誤告警切斷著火點電源,并用手提式二氧化碳滅火器滅火當氣體滅火系統(tǒng)電路損壞(此事啟動按鈕失效)可將消防鋼瓶室內的驅動瓶(靠近門口的兩個小鋼瓶)瓶口電磁閥安全銷拔下,將頂部按鈕壓下,氣體將強行噴出.
機房門道口設有管網(wǎng)式氣體滅火系統(tǒng)緊急啟動和停止按鈕,敲碎玻璃,按下緊急啟動按鈕(紅色).噴灑系統(tǒng)啟動,氣體噴出,覆蓋火情區(qū)域.如有其他情況出現(xiàn),需要緊急停止氣體噴灑時,按下緊急停止按鈕(綠色),氣體停止噴灑
疏散機房內人員,第一時間報告公司領導,撥打119火警
第11頁
友情提示:本文中關于《電信IDC機房維護保障方案》給出的范例僅供您參考拓展思維使用,電信IDC機房維護保障方案:該篇文章建議您自主創(chuàng)作。
來源:網(wǎng)絡整理 免責聲明:本文僅限學習分享,如產(chǎn)生版權問題,請聯(lián)系我們及時刪除。