IT運維管理系統(tǒng)規(guī)劃
IT運維管理系統(tǒng)規(guī)劃
MIS網(wǎng)絡(luò)信息運維管理系統(tǒng)規(guī)劃(征求意見稿)作者:張鵬二一年一月前言
托電信息化發(fā)展歷經(jīng)八年,從只有一個OA辦公系統(tǒng)、數(shù)十臺終端到如今擁有包括小型機在內(nèi)的服務(wù)器五十余臺、交換機等網(wǎng)絡(luò)設(shè)備百余臺、終端上千臺。信息化工作的重點已經(jīng)從信息系統(tǒng)建設(shè)向運維管理和系統(tǒng)應(yīng)用的深度整合等轉(zhuǎn)移。
目前,信息中心每天的工作量,多數(shù)都屬于運維管理的范疇。信息中心從機組四期工程結(jié)束后就著手開始運維管理方面的建設(shè)工作,幾年間相繼上了藍帶思科桌面管理系統(tǒng)、東華的IT運維系統(tǒng)、青鳥桌面管理系統(tǒng)。這些系統(tǒng)的應(yīng)用情況都不盡如人意,原因是多方面的,個人認(rèn)為主要有以下幾點:
1.運維管理的理念形成需要逐步成熟的過程。2.受到與運維相關(guān)的信息技術(shù)發(fā)展制約。3.現(xiàn)有運維相關(guān)的產(chǎn)品有各自的側(cè)重或局限性。
信息中心正在實施的兩個項目NETIQ和機房環(huán)境監(jiān)測系統(tǒng)為我們提供了一個契機,我們可以建設(shè)一個真正適合自己的網(wǎng)絡(luò)運維管理系統(tǒng),這個時機已經(jīng)基本成熟。一、運維管理系統(tǒng)建設(shè)的可行性
信息中心運維工作主要來自網(wǎng)絡(luò)設(shè)備、系統(tǒng)應(yīng)用、機房設(shè)備、終端。NETIQ服務(wù)器監(jiān)控系統(tǒng)可以對服務(wù)器、數(shù)據(jù)庫進行集中監(jiān)控管理。機房環(huán)境監(jiān)測系統(tǒng)可以對機房溫濕度、空調(diào)、UPS等指標(biāo)進行集中監(jiān)控管理。終端管理方面,可以考慮購置更好的產(chǎn)品加上二次開發(fā)或者在現(xiàn)有桌面管理系統(tǒng)的基礎(chǔ)上進行二次開發(fā)。相對于以上,網(wǎng)絡(luò)設(shè)備的管理使用SNMP基本可以滿足運維需求,NETIQ可以實現(xiàn),也可以在運維管理中心開發(fā)相應(yīng)的管理模塊。這些系統(tǒng)的建設(shè),本身就是具有針對性的綜合管理系統(tǒng),而且可以為運維管理中心系統(tǒng)提供運維信息的采集平臺,是運維管理系統(tǒng)建設(shè)的基礎(chǔ)。二、運維管理系統(tǒng)的構(gòu)想
運維管理系統(tǒng)由外圍管理系統(tǒng)群和運維管理中心兩部分組成。外圍管理系統(tǒng)群包括網(wǎng)絡(luò)設(shè)備管理模塊、NETIQ系統(tǒng)、機房環(huán)境監(jiān)測系統(tǒng)、終端管理系統(tǒng),外圍系統(tǒng)群為運維管理中心提供運維信息采集平臺。運維信息采集包括網(wǎng)絡(luò)設(shè)備運維信息采集、服務(wù)器組運維信息采集、機房環(huán)境運維信息采集、終端運維信息采集。
運維管理中心主要包括以下幾個部分:運維任務(wù)的生成、運維任務(wù)的處理、完成確認(rèn)、知識庫、運維統(tǒng)計分析、運維報告、績效評價、違規(guī)處理、維護商管理、應(yīng)急預(yù)案管理、系統(tǒng)權(quán)限等。㈠生成運維任務(wù)
運維任務(wù)的生成有兩個途徑,一個是從信息采集獲得,另外可以手動生成。運維任務(wù)分為運行管理任務(wù)和維護管理任務(wù)兩類,運行任務(wù)管理是指系統(tǒng)、設(shè)備在正常運行狀態(tài)下的監(jiān)控管理或操作,主要包括定期巡檢任務(wù)、正常的配置操作、補丁管理、用戶管理、升級操作等,巡檢任務(wù)由系統(tǒng)按規(guī)定自動生成,包括信息中心人員的日常巡檢和維護商的定期巡檢。維護管理任務(wù)是指當(dāng)設(shè)備、系統(tǒng)出現(xiàn)異;蚬收蠒r的處理過程。運維任務(wù)的生成包括的信息有:設(shè)備或系統(tǒng)名稱、IP地址、報警信息、時間、運維編碼等等,由終端直接發(fā)起的運維信息應(yīng)該包含聯(lián)系人的電話等,以便于運維人員接手任務(wù)后與發(fā)起人主動取得聯(lián)系。生成的運維任務(wù)包括網(wǎng)絡(luò)設(shè)備、應(yīng)用系統(tǒng)、機房操作、終端運維等幾種任務(wù)。運行管理和維護管理并沒有嚴(yán)格的界限,往往是你中有我我中有你。㈡運維任務(wù)的處理
運維任務(wù)生成后,由管理人員按照各自的職責(zé)分工,領(lǐng)取相應(yīng)的運維任務(wù)進行處理,運維任務(wù)處理過程及信息分類:
運維類別網(wǎng)絡(luò)設(shè)備包括:交換機、路由器、防火墻、VPN設(shè)備、行為管理設(shè)備、其他應(yīng)用系統(tǒng)包括:操作系統(tǒng)、應(yīng)用服務(wù)、數(shù)據(jù)庫、接口、其他
機房運維包括服務(wù)器、網(wǎng)絡(luò)設(shè)備、空調(diào)系統(tǒng)、供電系統(tǒng)、消防系統(tǒng)、環(huán)境監(jiān)控系統(tǒng)終端運維包括:終端、外設(shè)運維內(nèi)容
網(wǎng)絡(luò)設(shè)備包括配置操作:增加、更改、刪除,其他操作:版本升級、設(shè)備更換、其他應(yīng)用系統(tǒng)包括:配置變更、軟件安裝、升級、用戶管理、數(shù)據(jù)管理、日志管理、補丁管理、策略管理、其他
機房運維包括具體的設(shè)備信息
終端運維包括:電腦硬件、操作系統(tǒng)、應(yīng)用程序、打印機、其他處理過程處理結(jié)果原因分析影響情況對用戶的影響情況(時間范圍)
運維任務(wù)在處理過程中包含以下幾個狀態(tài),分別是:等待處理:等待運維人員接手執(zhí)行狀態(tài):運維人員正在處理任務(wù)
掛起狀態(tài):運維過程中出現(xiàn)其他急需辦理的事物或其他原因暫停執(zhí)行提交狀態(tài):任務(wù)處理完畢,等待完成確認(rèn)完成狀態(tài):一個任務(wù)完全結(jié)束后的狀態(tài)
駁回狀態(tài):任務(wù)處理過程中信息有待補充等原因被駁回。
當(dāng)任務(wù)處理人員發(fā)現(xiàn)需要維護商來處理的時候,將任務(wù)轉(zhuǎn)給維護商,由維護商接手任務(wù),相關(guān)人員配合共同完成運維任務(wù)并填寫相應(yīng)的記錄,最后由運維人員給予維護商相應(yīng)的評價。㈢運維任務(wù)的完成確認(rèn)
對已經(jīng)完成并提交的運維任務(wù)進行確認(rèn)、評價,對于運維內(nèi)容是否放入知識庫給予確認(rèn),對于運維過程中存在的違規(guī)情況根據(jù)相關(guān)規(guī)定給予處罰確定等。㈣知識庫
知識庫的信息積累來自于運維管理系統(tǒng)和平時的手工錄入,應(yīng)做好信息的分類、查詢功能。當(dāng)運維任務(wù)生成后,系統(tǒng)會把相關(guān)的信息在知識庫中進行檢索,并把結(jié)果顯示在任務(wù)中,供運維人員參考。㈤運維統(tǒng)計分析
當(dāng)某些問題經(jīng)常出現(xiàn)的時候,信息中心必須運用統(tǒng)計分析對設(shè)備、系統(tǒng)產(chǎn)生的問題或故障協(xié)同相關(guān)維護商,進行深入分析,找出原因,解決問題。另外運用統(tǒng)計分析可以為今后的運維工作提供指導(dǎo)方向,制定下一步運維計劃。㈥運維報告
通過運維管理中心,對運維數(shù)據(jù)有選擇的篩選、匯總,定期生成信息系統(tǒng)運維報告,以便于工作總結(jié)、分析、計劃。運維報告應(yīng)具有針對性,例如呈送公司領(lǐng)導(dǎo)的、呈送各部門的以及信息中心的整體報告。㈦績效評價
運維系統(tǒng)內(nèi)的各方包括終端用戶、維護商、運維人員都是可以評價的對象。終端用戶可以給打印機維護商評價;也可以給信息中心運維人員給予評價;維護商可以給維護人員評價;運維人員可以給維護商的工作給予評價;運維人員可以對終端用戶使用計算機的情況給予評價。㈧違規(guī)處理對于運維過程中發(fā)現(xiàn)違反信息系統(tǒng)相關(guān)制度的行為應(yīng)予以必要的處理。需要做兩方面工作:涉及這個內(nèi)容的制度條款應(yīng)該拿到系統(tǒng)中來,處理的方式方法有待確定;對于違規(guī)行為,在運維處理過程中應(yīng)該做相應(yīng)的證據(jù)記錄。㈨維護商的管理
對維護商的信息集中管理,運維工作予以記錄、評價,運維合同的到期提醒等,如何對維護商產(chǎn)生實際的約束力,發(fā)揮其在運維工作中應(yīng)有的作用,是我們需要考慮的問題。(十)應(yīng)急預(yù)案管理
當(dāng)設(shè)備或系統(tǒng)的故障達到規(guī)定程度時,啟動應(yīng)急預(yù)案,并對整個處理過程實現(xiàn)系統(tǒng)化管理,以及預(yù)案的演練等其他工作進行記錄。三、終端管理系統(tǒng)
目前通行的終端管理系統(tǒng)所包含的功能主要有:硬件信息的提取(CPU、內(nèi)存、硬盤等)、操作系統(tǒng)基本信息(操作系統(tǒng)版本、安裝的應(yīng)用程序等)、軟件分發(fā)、補丁管理、外設(shè)管理、遠程管理、主機防護等。有的產(chǎn)品還具有接入認(rèn)證、內(nèi)外網(wǎng)隔離、硬盤加密、網(wǎng)絡(luò)行為管理等功能。360安全套件在終端健康狀況、插件管理、實時防護、木馬查殺、垃圾清理等方面做的比較好。瑞星網(wǎng)絡(luò)版則是著重防病毒。將這些軟件的功能加以綜合利用,建設(shè)終端管理系統(tǒng)平臺(組),為運維管理中心提供數(shù)據(jù)。
廠區(qū)終端使用最多的是OFFICE辦公軟件和瀏覽器,出現(xiàn)問題最多的是瀏覽器,所以應(yīng)當(dāng)把對瀏覽器的運維作為終端運維的重點之一。此外終端管理系統(tǒng)收集的終端硬件信息可以與信息中心現(xiàn)有的資產(chǎn)管理系統(tǒng)建立聯(lián)系,可以實現(xiàn)較為準(zhǔn)確的資產(chǎn)定位,協(xié)同各部門信息員及時掌握資產(chǎn)的變動情況。
客戶端的二次開發(fā)要求:客戶端既屬于終端管理系統(tǒng),又可以和運維管理中心通信,同時可以對于我們所需的現(xiàn)有產(chǎn)品沒有涉及到的進程或指標(biāo)進行檢測。1、實時交互性
當(dāng)運維人員需要遠程維護時與終端用戶進行詢問、控制申請等信息交互,當(dāng)運維任務(wù)結(jié)束后,終端用戶可以給維護人員以相應(yīng)的評價。運維管理中心收集到的終端健康情況也可以發(fā)送到目的終端,給使用者以相關(guān)的提醒。2、人性化
終端使用人提交運維申請后,可以看到運維管理中心當(dāng)前的運維狀況,誰接手了自己提交的申請,自己排在第幾位等信息?蛻舳诉\行應(yīng)盡量避免對終端用戶的正常工作形成干擾,如果能做到讓使用者感覺很舒服又實用那是最好了。3、資源占用率客戶端運行時,進程的大小,CPU占用率可以參考較為成熟的軟件如360及瑞星運行時的情況。
4、定制化安裝
對于信息中心維護范圍內(nèi)和維護范圍外的終端,應(yīng)該采取不同的安裝策略。比如對維護范圍外采用接入認(rèn)證、監(jiān)控健康狀態(tài)、信息提醒等,但不啟用維護功能。用戶在安裝客戶端時,填寫相應(yīng)的信息以便系統(tǒng)管理。四、運維系統(tǒng)建設(shè)工作重點1.運維管理中心的開發(fā)2.終端管理系統(tǒng)的建設(shè)
3.NETIQ系統(tǒng)所涉及監(jiān)測指標(biāo)的調(diào)整,與運維管理中心的接口準(zhǔn)備4.機房環(huán)境監(jiān)測系統(tǒng)所涉及監(jiān)測指標(biāo)的調(diào)整,與運維管理中心的接口準(zhǔn)備
5.對于特定應(yīng)用系統(tǒng)的運行監(jiān)測,NETIQ能否開發(fā)出對應(yīng)的監(jiān)測服務(wù)模塊,或者應(yīng)用系統(tǒng)的開發(fā)商可以開發(fā)出對自身運行狀況的監(jiān)測功能。6.與運維工作相關(guān)制度的完善、建立。五、總結(jié)
綜上所述,運維管理系統(tǒng)由多個子系統(tǒng)組成,我們應(yīng)該看到它的復(fù)雜性。如何讓整個系統(tǒng)協(xié)調(diào)運作,如何挖掘、調(diào)整、發(fā)揮運維系統(tǒng)的功能,提高運維工作效率,不是一朝一夕的事情。運維管理系統(tǒng)體現(xiàn)的是管理理念,相關(guān)制度的落實是整個運維工作做的好壞的關(guān)鍵,也是運維管理系統(tǒng)成功的關(guān)鍵。
擴展閱讀:一種基于ITIL的IT運維管理系統(tǒng)設(shè)計方法 Word 文檔
1商業(yè)銀行IT運維管理系統(tǒng)現(xiàn)狀
隨著國內(nèi)商業(yè)銀行業(yè)務(wù)信息化的深入,銀行內(nèi)的IT運維部門對轄內(nèi)的IT設(shè)備及軟件的運行維護工作變得越來越復(fù)雜,技術(shù)難度也越來越高。傳統(tǒng)的運行維護系統(tǒng)大多以人工為主,這種方式事件響應(yīng)慢、故障排查周期長,嚴(yán)重影響了IT運維部門對核心業(yè)務(wù)的支撐力以及IT運營部門的聲譽。同時,IT環(huán)境的不斷復(fù)雜化,使得對維護人員的技術(shù)能力要求也越來越高。如何將已有的知識有效共享,使管理人員和技術(shù)人員的業(yè)務(wù)能力持續(xù)不斷提高,逐漸成為IT運營部門是否高效運行的關(guān)鍵因素。
構(gòu)建新一代的以ITIL理論為基礎(chǔ)的IT運維管理系統(tǒng),將滿足商業(yè)銀行最新的業(yè)務(wù)支撐需求。新IT運維管理系統(tǒng)從事件發(fā)生到妥善處理并達到與客戶協(xié)議的服務(wù)水平,形成了一整套完整的可進行財務(wù)計量的閉環(huán)服務(wù)體系。該運維管理系統(tǒng)充分體現(xiàn)了ITIL的以服務(wù)為核心、以技術(shù)和平臺為手段的服務(wù)管理思想。2ITIL服務(wù)管理流程概念
ITIL(InformationTechnologyInfrastructureLibrary)又稱作“信息技術(shù)基礎(chǔ)構(gòu)架庫”,是英國政府組織并由一批國際知名IT廠商和專家共同研究開發(fā)形成的一套IT行業(yè)的服務(wù)管理標(biāo)準(zhǔn)庫。該套標(biāo)準(zhǔn)庫開發(fā)目的是:提高IT服務(wù)質(zhì)量;使IT資源的使用規(guī)范化,并且這種使用是可以進行財務(wù)計量的。20世紀(jì)90年代中期ITIL已經(jīng)成為IT管理領(lǐng)域事實上的國際標(biāo)準(zhǔn)。ITIL標(biāo)準(zhǔn)主要包括6大模塊,即業(yè)務(wù)管理、服務(wù)管理、ICT基礎(chǔ)構(gòu)架管理、IT服務(wù)管理規(guī)劃與實施、應(yīng)用管理和安全管理。其中服務(wù)管理是最核心的模塊,該模塊包括“服務(wù)提供”和“服務(wù)支持”兩個流程組,是構(gòu)建現(xiàn)代運營維護管理的重要流程。本文介紹的商業(yè)銀行運維管理系統(tǒng)設(shè)計就是依據(jù)這兩個流程組的概念來展開的。
服務(wù)提供流程組包括5個流程,即服務(wù)級別管理、IT服務(wù)財務(wù)管理、能力管理、IT服務(wù)持續(xù)性管理和可用性管理。服務(wù)支持流程組包括一項管理職能及5個運營流程,即服務(wù)臺、事件管理、問題管理、配置管理、變更管理和發(fā)布管理。ITIL服務(wù)支持流程結(jié)構(gòu)如圖1所示。
圖1ITIL服務(wù)支持流程結(jié)構(gòu)
服務(wù)臺(ServiceDesk):是用戶和IT服務(wù)組織的中心聯(lián)系點。為IT管理人員和IT客戶訪問提供唯一界面。它通過一個集中和專職的服務(wù)聯(lián)系點促進業(yè)務(wù)流程與服務(wù)管理基礎(chǔ)構(gòu)架的集成。它是協(xié)調(diào)客戶和IT部門之間聯(lián)系的桌面平臺。
事件管理(IncidentManagement),是負(fù)責(zé)記錄、歸類和安排專家處理事故并監(jiān)督整個處理過程直至事件被解決和終止的流程管理。事件管理的目的是在盡量不影響客戶和用戶業(yè)務(wù)的情況下使IT系統(tǒng)能恢復(fù)到服務(wù)級別協(xié)議所規(guī)定的服務(wù)水平。
問題管理(ProblemManagement),是指通過調(diào)查和分析IT基礎(chǔ)構(gòu)架的薄弱環(huán)節(jié),查明事故原因,由此制定解決方案和防止事故再次發(fā)生的具體措施。問題管理與事件管理的不同之處是:事件管理強調(diào)的是事故恢復(fù)的速度,而問題管理強調(diào)的是找出事故產(chǎn)生的根源。
配置管理(ConfigurationManagement),是識別和確認(rèn)系統(tǒng)的配置項、記錄和報告配置項狀態(tài)和變更請求、檢驗配置項的正確性、完整性等信息。其目的是提供IT基礎(chǔ)構(gòu)架的邏輯模型,支持其他服務(wù)管理流程的運作,特別是變更管理和發(fā)布管理。
變更管理(ChangeManagement)是指為了在最短的中斷時間內(nèi)完成基礎(chǔ)構(gòu)架或服務(wù)的某一方面變更而對整個變更過程進行控制的服務(wù)管理流程。變更管理的目標(biāo)是確保在變更實施過程中使用標(biāo)準(zhǔn)的方法和步驟,盡快地實施變更,將變更所導(dǎo)致的業(yè)務(wù)影響減少到最低。
發(fā)布管理(ReleaseManagement),是指對經(jīng)過測試后需要導(dǎo)入實際應(yīng)用的新增或修改后的配置項進行分發(fā)和宣傳的管理流程。發(fā)布管理以前又稱為軟件控制與分發(fā),它是由變更管理流程控制的。
服務(wù)級別管理(ServiceLevelManagement),為簽訂服務(wù)級別協(xié)議(SLAs)而進行的計劃、草擬、協(xié)商、監(jiān)控和報告以及簽訂服務(wù)級別協(xié)議后對服務(wù)績效的評價等一系列活動所組成的一個服務(wù)管理流程。服務(wù)級別管理旨在確保組織所需的IT服務(wù)質(zhì)量在成本合理的范圍內(nèi)得以維持并逐漸提高。
IT服務(wù)財務(wù)管理(ITServicefinancialManagement),是負(fù)責(zé)預(yù)算和核算提供IT服務(wù)所需的成本、并向客戶收取相應(yīng)服務(wù)費用的管理流程。它包括IT投資預(yù)算、IT服務(wù)成本核算和服務(wù)記費3個子流程,其目標(biāo)是通過量化服務(wù)成本減少成本開支,減少不必要的浪費,合理引導(dǎo)客戶行為。IT服務(wù)財務(wù)管理可以為服務(wù)級別管理、能力管理、IT服務(wù)持續(xù)性管理和變更管理等提供決策依據(jù)。
基于ITIL理論的商業(yè)銀行IT運維管理系統(tǒng)的設(shè)計就是根據(jù)以上管理內(nèi)容來規(guī)劃系統(tǒng)功能模塊,將ITIL服務(wù)支持流程內(nèi)容集合設(shè)計到一個或多個系統(tǒng)功能模塊中。3基于ITIL標(biāo)準(zhǔn)的商業(yè)銀行IT運維管理系統(tǒng)設(shè)計
商業(yè)銀行IT運維管理系統(tǒng)的設(shè)計采用模塊化、分層次的結(jié)構(gòu),其系統(tǒng)組成如圖2。IT基礎(chǔ)構(gòu)架管理是銀行內(nèi)部已存在的各種監(jiān)控管理工具,它們采集IT基礎(chǔ)構(gòu)架中各種管理對象的配置、性能、事件信息,將這些信息按統(tǒng)一格式處理并分類,統(tǒng)一后的信息被發(fā)送給業(yè)務(wù)轉(zhuǎn)換管理平臺。
圖2商業(yè)銀行IT運維管理系統(tǒng)邏輯結(jié)構(gòu)業(yè)務(wù)轉(zhuǎn)換管理平臺對來自IT基礎(chǔ)構(gòu)架平臺的信息進行分析、過濾、篩選,并轉(zhuǎn)化成IT運維的業(yè)務(wù)信息,這些信息又被發(fā)送給流程管理平臺。服務(wù)臺接收來自用戶或客戶的事件報告信息,這類信息被自動轉(zhuǎn)化為業(yè)務(wù)信息,與來自IT基礎(chǔ)構(gòu)架的業(yè)務(wù)信息一起傳送給上一級請求處理。
流程管理平臺將判別業(yè)務(wù)信息類別,根據(jù)不同類別轉(zhuǎn)入相應(yīng)的流程管理。流程管理平臺提供了ITIL服務(wù)支持管理中的主要流程模塊的功能。它們包括問題管理、配置管理、變更管理、服務(wù)協(xié)議管理、IT財務(wù)預(yù)算管理。每個流程管理實現(xiàn)的功能遵照了ITIL服務(wù)支持管理的要求。
報表管理模塊負(fù)責(zé)生成不同平臺、不同階段、不同格式的報表信息。
商業(yè)銀行IT運維管理系統(tǒng)中的功能模塊按IT運維部門人員組織機構(gòu)劃分不同的管理角色。不同的管理角色擁有不同的權(quán)限和不同的界面,各流程管理采用統(tǒng)一的數(shù)據(jù)庫設(shè)計原則,使信息的組織、存儲、調(diào)用效率較高。
商業(yè)銀行IT運維管理系統(tǒng)設(shè)計采用了分層次和模塊化體系架構(gòu)。各層次和各模塊之間采用統(tǒng)一的信息交換模式,系統(tǒng)部署具有良好的可擴展性。4結(jié)束語
基于ITIL的商業(yè)銀行IT運維管理系統(tǒng)的實現(xiàn)將極大地改進銀行內(nèi)部支持運作效率,大大降低銀行IT運營成本。該方案在集成性、擴展性、適應(yīng)性、易用性等方面都達到了較高要求,是一個值得推廣的運維管理系統(tǒng)。
%20stable/e100-3.5.17/
友情提示:本文中關(guān)于《IT運維管理系統(tǒng)規(guī)劃》給出的范例僅供您參考拓展思維使用,IT運維管理系統(tǒng)規(guī)劃:該篇文章建議您自主創(chuàng)作。
來源:網(wǎng)絡(luò)整理 免責(zé)聲明:本文僅限學(xué)習(xí)分享,如產(chǎn)生版權(quán)問題,請聯(lián)系我們及時刪除。