摘要:國家廣播電影電視總局在信息化發(fā)展的過程中積累了大量it基礎(chǔ)設(shè)施,如何保障這些設(shè)施健康穩(wěn)定的運(yùn)行是信息中心日常工作的重心。浪潮應(yīng)用監(jiān)管系統(tǒng)(ssm)接入總局內(nèi)部局域網(wǎng),對(duì)網(wǎng)內(nèi)所有it資源和業(yè)務(wù)系統(tǒng)進(jìn)行24小時(shí)不間斷監(jiān)控,實(shí)現(xiàn)了所有業(yè)務(wù)系統(tǒng)和it資源的狀態(tài)可知化、質(zhì)量可量化、決策數(shù)據(jù)化以...
企業(yè)的it系統(tǒng)隨著應(yīng)用的不斷增多而復(fù)雜,管理者如何掌握系統(tǒng)的運(yùn)行狀況?這是it部門普遍面臨的難題。國家廣播電影電視總局(以下簡(jiǎn)稱:廣電總局)在it系統(tǒng)不斷發(fā)展的過程中,同樣的問題擺在了眼前。與龐大it系統(tǒng)相伴的是應(yīng)用監(jiān)管的困難加劇、系統(tǒng)安全得不到有效保護(hù),完全依靠純?nèi)斯みM(jìn)行系統(tǒng)管理不僅讓工作人員疲于奔命而且無法對(duì)故障進(jìn)行跟蹤和快速處理。近日,廣電總局通過將浪潮應(yīng)用監(jiān)管系統(tǒng)(ssm) 應(yīng)用于內(nèi)部局域網(wǎng),對(duì)網(wǎng)內(nèi)所有it資源和業(yè)務(wù)系統(tǒng)進(jìn)行24小時(shí)不間斷監(jiān)控,實(shí)現(xiàn)了所有業(yè)務(wù)系統(tǒng)和it資源的狀態(tài)可知化、質(zhì)量可量化、決策數(shù)據(jù)化以及監(jiān)控內(nèi)容預(yù)警化的新“四化”。
人工巡檢:帶來巨大工作量和安全隱患
廣電總局把握國內(nèi)輿論導(dǎo)向,對(duì)廣播電視宣傳和影視創(chuàng)作進(jìn)行方向性把控,其政策對(duì)全民娛樂生活具有重大影響。與業(yè)務(wù)職能的“高大上”相比,廣電總局的網(wǎng)絡(luò)管理卻差強(qiáng)人意?!拔覀兿到y(tǒng)中所有設(shè)備的維護(hù)都依靠人員巡檢,管理人員每天按部就班的每一臺(tái)服務(wù)、網(wǎng)絡(luò)設(shè)備,逐個(gè)去檢查它們的狀況。當(dāng)出現(xiàn)問題的時(shí)候,工作人員從幾千條日志中找到有價(jià)值的內(nèi)容進(jìn)行排查。it主管在檢查工作時(shí),需要面對(duì)管理人員提交的紙質(zhì)表單。最初只有幾臺(tái)設(shè)備的時(shí)候,應(yīng)用監(jiān)管并不太困難。但隨著系統(tǒng)越來越龐大和復(fù)雜,需要管理的設(shè)備越來越多,應(yīng)用監(jiān)管的難度逐步提升。目前,系統(tǒng)內(nèi)部署著二十多個(gè)不同品牌的兩百多臺(tái)設(shè)備,運(yùn)維監(jiān)管對(duì)我們來說已經(jīng)變成了巨大的負(fù)擔(dān)。” 廣電總局信息中心負(fù)責(zé)人表示。
人工巡檢的工作方式,不僅造成了人員工作的巨大負(fù)擔(dān),而且也增加了運(yùn)維的安全風(fēng)險(xiǎn)。由于業(yè)務(wù)系統(tǒng)和設(shè)備數(shù)量不斷增加,各應(yīng)用系統(tǒng)的運(yùn)行維護(hù)、硬件設(shè)備性能及其他指標(biāo)的監(jiān)測(cè)等工作量不斷增大,也更困難,完全依靠人工方式對(duì)大量業(yè)務(wù)系統(tǒng)的硬件、軟件、數(shù)據(jù)庫進(jìn)行監(jiān)控和管理,不但缺少故障預(yù)警能力,不能對(duì)故障進(jìn)行跟蹤和快速處理,還會(huì)影響到業(yè)務(wù)的順利開展。
因此,一套集中監(jiān)控管理平臺(tái)成為廣電總局網(wǎng)絡(luò)的當(dāng)務(wù)之急。這套網(wǎng)絡(luò)需要實(shí)現(xiàn)針對(duì)it基礎(chǔ)架構(gòu)的整體監(jiān)控與管理自動(dòng)化,以便最大限度的保證組織信息系統(tǒng)不間斷為業(yè)務(wù)開展提供信息化服務(wù)。
浪潮ssm協(xié)助廣電總局信息系統(tǒng)實(shí)現(xiàn)“四化”
“根據(jù)我們的考察和測(cè)試,浪潮ssm提供了成熟、可靠的面向業(yè)務(wù)的監(jiān)控模塊,能夠提供全方位的資源監(jiān)控能力,與我們的系統(tǒng)契合度很高。此外,在自動(dòng)預(yù)警和多類型展示方面也表現(xiàn)出色。所以,我們最終選擇了浪潮ssm為我們系統(tǒng)進(jìn)行應(yīng)用監(jiān)管?!痹撠?fù)責(zé)人說。
部署浪潮ssm之后,廣電總局信息系統(tǒng)告別了純?nèi)斯さ膽?yīng)用監(jiān)管,不僅提高了工作效率,系統(tǒng)安全性也得到大幅度提升。由于建立了集中的告警分析處理機(jī)制和故障預(yù)警機(jī)制,提供自動(dòng)化的事件處理能力,當(dāng)故障產(chǎn)生時(shí),可以快速定位故障,很快發(fā)現(xiàn)問題根源并找到相應(yīng)的解決方案,從而縮短故障解決時(shí)間,減少維護(hù)成本。
該負(fù)責(zé)人說:“ssm實(shí)現(xiàn)了對(duì)所有it業(yè)務(wù)系統(tǒng)和it資源全方位、深度化的監(jiān)控,解決了傳統(tǒng)的監(jiān)控管理、服務(wù)運(yùn)維、配置管理的分割化問題,形成了統(tǒng)一可擴(kuò)展的監(jiān)控體系,完善itil服務(wù)的提供和處理能力,總體提高運(yùn)維管理的工作效率和主動(dòng)性,提升信息化建設(shè)的運(yùn)行保障能力??偨Y(jié)一句話就是ssm幫助我們的系統(tǒng)實(shí)現(xiàn)了四化。”
所謂“四化”就是對(duì)網(wǎng)絡(luò)設(shè)備、服務(wù)器、應(yīng)用系統(tǒng)進(jìn)行自動(dòng)巡檢,做到運(yùn)行狀態(tài)可知化;直觀的了解業(yè)務(wù)系統(tǒng)的運(yùn)行情況,做到業(yè)務(wù)系統(tǒng)的運(yùn)行質(zhì)量可量化;提供由多維度、層次化的數(shù)據(jù)展現(xiàn),做到管理決策數(shù)據(jù)化;有效實(shí)現(xiàn)監(jiān)控內(nèi)容預(yù)警,完善的告警體系,做到預(yù)警化。
具體來說,浪潮ssm通過在廣電總局系統(tǒng)數(shù)據(jù)中心配置采集策略,并部署采集探針(probe),完成了對(duì)it系統(tǒng)內(nèi)各個(gè)不同品牌、不同類型主機(jī)設(shè)備、網(wǎng)絡(luò)設(shè)備、虛擬化平臺(tái)等一系列it資源的數(shù)據(jù)收集,實(shí)現(xiàn)設(shè)備與應(yīng)用系統(tǒng)的完全覆蓋。這些數(shù)據(jù)的收集實(shí)現(xiàn)了系統(tǒng)運(yùn)行狀態(tài)可知化。
性能監(jiān)控視圖使系統(tǒng)運(yùn)行狀態(tài)一目了然
收集數(shù)據(jù)是第一步,也是從機(jī)制上替代人員巡檢的最重要步驟,并且覆蓋的范圍更廣,深度更深。數(shù)據(jù)收集之后的步驟是數(shù)據(jù)增值的過程,能夠?yàn)閺V電總局不同角色的使用者提供響應(yīng)的分析結(jié)果,是過去巡檢所不具備的。收集到的數(shù)據(jù)將通過數(shù)據(jù)處理層,狀態(tài)和性能數(shù)據(jù)經(jīng)過整理、歸并與挖掘處理,為廣電總局的領(lǐng)導(dǎo)層提供可靠的決策參考,做到管理決策數(shù)據(jù)化;同時(shí)故障數(shù)據(jù)經(jīng)過過濾、壓縮、歸并與關(guān)聯(lián)分析之后,產(chǎn)生告警信息與事件記錄,提交給網(wǎng)絡(luò)維護(hù)人員,實(shí)現(xiàn)監(jiān)控內(nèi)容預(yù)警化。
分散的數(shù)據(jù)價(jià)值有限,分析過后的數(shù)據(jù)卻可以全面展示系統(tǒng)的運(yùn)行狀態(tài),如果把這些數(shù)據(jù)再分發(fā)給相應(yīng)的業(yè)務(wù)模塊,就可以對(duì)業(yè)務(wù)起到支撐作用。廣電總局信息中心正是通過浪潮ssm將處理過后的數(shù)據(jù)輸送到不同的業(yè)務(wù)模塊,為最終展示提供了全面業(yè)務(wù)功能的支撐,實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)的運(yùn)行質(zhì)量可量化。
最終,這些視圖可以直接通過瀏覽器查看網(wǎng)絡(luò)環(huán)境拓?fù)洹㈡溌窢顟B(tài)和各類it資源的即時(shí)性能指標(biāo),方便快捷。
從純?nèi)斯ぱ矙z到實(shí)現(xiàn)“四化”,浪潮ssm協(xié)助廣電總局大幅提升了系統(tǒng)監(jiān)管效率和系統(tǒng)安全性,實(shí)現(xiàn)了所有業(yè)務(wù)系統(tǒng)和it資源運(yùn)行的可量、可知、可控的目標(biāo)。