機(jī)房管理為網(wǎng)強(qiáng)IT綜合管理系統(tǒng)/網(wǎng)絡(luò)管理系統(tǒng)的增值(可選)功能模塊,已有網(wǎng)強(qiáng)IT綜合管理系統(tǒng)/網(wǎng)絡(luò)管理系統(tǒng)的用戶,可在原有系統(tǒng)基礎(chǔ)上直接升級即可。
機(jī)房監(jiān)控的必要性
隨著社會信息化程度的不斷提高,機(jī)房建設(shè)規(guī)模日益擴(kuò)大,其設(shè)備數(shù)量也日益增多,機(jī)房環(huán)境設(shè)備(如供配電系統(tǒng)、UPS電源、空調(diào)、消防系統(tǒng)、安防系統(tǒng)等)必須時時刻刻為業(yè)務(wù)系統(tǒng)提供正常的運(yùn)行環(huán)境。任何影響整個業(yè)務(wù)系統(tǒng)的隱患,將對數(shù)據(jù)傳輸、存儲及系統(tǒng)運(yùn)行的可靠性構(gòu)成一定的威脅,若出現(xiàn)故障又不能及時處理就可能造成嚴(yán)重后果。對于金融、運(yùn)營商、政府、互聯(lián)網(wǎng)等需要實(shí)時交換數(shù)據(jù)的信息機(jī)房,其機(jī)房管理尤為重要,一旦系統(tǒng)發(fā)生故障,造成的經(jīng)濟(jì)損失將不可估量。
為了保證機(jī)房能給設(shè)備提供一個良好的運(yùn)行環(huán)境,從而保障業(yè)務(wù)系統(tǒng)的正常運(yùn)行,就有必要對機(jī)房環(huán)境的運(yùn)行狀態(tài)變量,進(jìn)行24小時實(shí)時監(jiān)測與智能化調(diào)節(jié)控制。而各行業(yè)用戶對于機(jī)房監(jiān)控的管理力度和方法也不盡相同,很多單位甚至仍然采用傳統(tǒng)的24小時專人值班的方式定時巡查機(jī)房環(huán)境。
機(jī)房與網(wǎng)管系統(tǒng)有效集成,6招擺脫機(jī)房監(jiān)控現(xiàn)狀
網(wǎng)強(qiáng)機(jī)房管理系統(tǒng)(簡稱:Environment Manager)通過與網(wǎng)強(qiáng)IT綜合管理系統(tǒng)實(shí)時聯(lián)動,利用智能分析和影響度關(guān)聯(lián)技術(shù),將機(jī)房環(huán)境中的溫濕度、漏水、電源、UPS、煙霧、視頻監(jiān)控、消防及門禁等與用戶的網(wǎng)絡(luò)設(shè)備、應(yīng)用、服務(wù)等IT資源關(guān)聯(lián)在一起,并完整集成到業(yè)務(wù)模型。通過智能業(yè)務(wù)模型,系統(tǒng)將自動對各項(xiàng)業(yè)務(wù)以及承載業(yè)務(wù)的各個設(shè)備、服務(wù)器、應(yīng)用等資源進(jìn)行整體全面分析,同時在業(yè)務(wù)結(jié)構(gòu)中清晰的反映機(jī)房環(huán)境對整體業(yè)務(wù)的影響程度。任何一個業(yè)務(wù)中的細(xì)小變化和端倪,都能通過系統(tǒng)實(shí)時組合成及展現(xiàn)出各個符合個人所關(guān)注的性能數(shù)據(jù)或信息,并進(jìn)行實(shí)時直觀展現(xiàn),如整體業(yè)務(wù)健康度、可用率等。當(dāng)機(jī)房環(huán)境出現(xiàn)異常時,系統(tǒng)則會可根據(jù)不同的異常等級進(jìn)行告警,并通過多種告警方式及時通知運(yùn)維人員,從而保障各設(shè)備、業(yè)務(wù)系統(tǒng)的高效運(yùn)行,大大降低了業(yè)務(wù)系統(tǒng)運(yùn)行中產(chǎn)生的風(fēng)險。
現(xiàn)狀一:機(jī)房的環(huán)境和動力設(shè)備如供電源、UPS、空調(diào)、煙感、消防等必須時時刻刻為計(jì)算機(jī)信息系統(tǒng)提供正常的運(yùn)行環(huán)境。一旦它們出現(xiàn)異常或故障,后果將不堪設(shè)想。為此很多單位已經(jīng)重視并對機(jī)房環(huán)境進(jìn)行監(jiān)控與管理。但傳統(tǒng)的機(jī)房監(jiān)控軟件只能對機(jī)房動力環(huán)境進(jìn)行監(jiān)控,而這些環(huán)境的變化對單位關(guān)鍵業(yè)務(wù)的影響度為多少,運(yùn)維人員卻無從得知。
機(jī)房管理系統(tǒng)與網(wǎng)管集成,使機(jī)房環(huán)境與業(yè)務(wù)系統(tǒng)相關(guān)聯(lián)
網(wǎng)強(qiáng)機(jī)房管理系統(tǒng)通過與網(wǎng)強(qiáng)IT綜合管理系統(tǒng)的有效集成,利用智能分析和影響度關(guān)聯(lián)技術(shù),將機(jī)房環(huán)境中的溫濕度、消防設(shè)施(煙霧、漏水)、UPS電源設(shè)備、供配電系統(tǒng)(電流、電壓、空氣開關(guān))、機(jī)房空調(diào)、安防系統(tǒng)(視頻、門禁、紅外)等與業(yè)務(wù)系統(tǒng)及承載業(yè)務(wù)系統(tǒng)的各種下屬網(wǎng)絡(luò)設(shè)備、應(yīng)用系統(tǒng)、服務(wù)器等IT資源關(guān)聯(lián)在一起,自動進(jìn)行整體全面的分析,實(shí)現(xiàn)統(tǒng)一的資源管理。同時在業(yè)務(wù)結(jié)構(gòu)中清晰的反映機(jī)房環(huán)境對整體業(yè)務(wù)的影響程度,任何一個業(yè)務(wù)系統(tǒng)中的細(xì)小變化和端倪,都能通過系統(tǒng)實(shí)時組合成及展現(xiàn)出各個符合個人所關(guān)注的性能數(shù)據(jù)或信息,并進(jìn)行實(shí)時直觀展現(xiàn),從而有效反映影響業(yè)務(wù)系統(tǒng)健康度、利用率的關(guān)鍵因素,幫助運(yùn)維人員盡快找到相關(guān)瓶頸或隱患。
現(xiàn)狀二:通常機(jī)房環(huán)境監(jiān)控?cái)?shù)據(jù)的采集都是通過特定的硬件監(jiān)控設(shè)備協(xié)助完成的,每一套機(jī)房管理軟件都需要部署硬件設(shè)備,對于采集的數(shù)據(jù)都有對應(yīng)的指標(biāo)。一般十幾個指標(biāo),運(yùn)維人員基本能應(yīng)付查看,但對于幾十個甚至上百個指標(biāo),如果無法通過數(shù)據(jù)或圖形形式對機(jī)房的運(yùn)行情況進(jìn)行直觀展現(xiàn),運(yùn)維人員了解起來也就有點(diǎn)力不從心了。
機(jī)房變量數(shù)據(jù)實(shí)時采集,指標(biāo)一覽、示意拓?fù)鋱D直觀展現(xiàn)
系統(tǒng)通過對機(jī)房環(huán)境中的各個硬件設(shè)備進(jìn)行數(shù)據(jù)采集,并將采集的數(shù)據(jù)在IT綜合管理系統(tǒng)的監(jiān)控指標(biāo)列表中集中展示。通過指標(biāo)一覽,可以直觀了解到各個指標(biāo)的類型、當(dāng)前值、當(dāng)前狀態(tài)、異常規(guī)則、監(jiān)控頻度等。不僅如此,用戶還可以通過增加示意圖元、示意鏈路的方式建立示意拓?fù)鋱D來模擬機(jī)房實(shí)際物理環(huán)境的擺設(shè)與布局等,將機(jī)房環(huán)境實(shí)時的在示意拓?fù)鋱D中直觀的展現(xiàn)出來。通過機(jī)房示意拓?fù)鋱D,可以了解到機(jī)房環(huán)境中的溫度、漏水、煙霧探測、視頻、消防設(shè)備、空調(diào)與門禁等設(shè)備的運(yùn)行情況和分布情況。另外,還可以根據(jù)每個示意圖元的顏色狀態(tài)來判斷該設(shè)備的異常等級情況。當(dāng)設(shè)備發(fā)生故障時,在機(jī)房示意拓?fù)鋱D上可以直觀看到相關(guān)設(shè)備的異常提示,直接點(diǎn)擊異常設(shè)備則可以自動關(guān)聯(lián)到該異常設(shè)備的詳細(xì)信息。
現(xiàn)狀三:一般情況下機(jī)房環(huán)境出現(xiàn)的問題不會直接影響業(yè)務(wù)系統(tǒng)運(yùn)行的,都是在異常變化出現(xiàn)后,問題無法及時發(fā)現(xiàn)并處理,使環(huán)境不斷的惡化致使業(yè)務(wù)系統(tǒng)的運(yùn)行受到影響;為了保證機(jī)房能給設(shè)備提供一個良好的運(yùn)行環(huán)境,保障業(yè)務(wù)系統(tǒng)的正常運(yùn)行,企業(yè)不得不采用24小時專人值班的方式定時巡查機(jī)房環(huán)境。即便如此,當(dāng)業(yè)務(wù)系統(tǒng)不能正常運(yùn)行時,運(yùn)維人員才發(fā)現(xiàn)是機(jī)房環(huán)境運(yùn)行情況出現(xiàn)異常所致。
機(jī)房環(huán)境出現(xiàn)異常實(shí)時告警,及時通知運(yùn)維人員恢復(fù)故障
結(jié)合IT綜合管理系統(tǒng)的告警敏感度、告警合并、告警過濾以及異常依賴、根源分析等多種高端技術(shù)手段,能夠避免大量的無謂重復(fù)告警信息,防止告警泛濫。并能在眾多的告警信息中,屏蔽不重要的告警信息,幫助運(yùn)維人員將精力集中在關(guān)鍵問題上,準(zhǔn)確定位可能的故障根源,真正做到事先運(yùn)維、整體運(yùn)維,將影響業(yè)務(wù)系統(tǒng)健康度和可用率的一切因素事先排除。當(dāng)機(jī)房環(huán)境產(chǎn)生異常時,例如當(dāng)前機(jī)房煙霧漏水積水、門禁開關(guān)量狀態(tài)不符合規(guī)范等,將通過配置的告警功能自動觸發(fā)IT綜合管理系統(tǒng)進(jìn)行告警。系統(tǒng)可以根據(jù)不同的異常等級,通過聲音、消息框、電話、手機(jī)短信、電子郵件、廣播及燈光警鈴等多種告警方式及時通知運(yùn)維人員,將影響業(yè)務(wù)系統(tǒng)健康度一切因素事先排除,真正做到事先運(yùn)維。運(yùn)維人員還可以由異常直接關(guān)聯(lián)到系統(tǒng)的知識庫,并從知識庫中找到故障的解決方案,從而及時恢復(fù)故障,滿足24 小時機(jī)房管理要求,最大限度保證了業(yè)務(wù)的服務(wù)水平。
現(xiàn)狀四:當(dāng)機(jī)房環(huán)境出現(xiàn)異常時,運(yùn)維人員可以通過相關(guān)告警方式得知異常信息并及時排查。在排查故障時,如果只是單點(diǎn)的報警,運(yùn)維人員的排查與故障恢復(fù)的效率通常都會比較高。但有多點(diǎn)頻繁發(fā)生異常并告警時,運(yùn)維人員由于無法有效判斷故障的輕重緩急,常常沒有針對性的排查而拖延了故障恢復(fù)的時間。
詳細(xì)的異常信息一覽便于直觀判斷輕重緩急,使排查更有針對性
系統(tǒng)對機(jī)房環(huán)境進(jìn)行全盤監(jiān)控,當(dāng)產(chǎn)生不同等級的異常時,并自動記錄異常信息,如異常的指標(biāo)名稱、異常來源、異常等級、時間、恢復(fù)狀態(tài)、異常總數(shù)及確認(rèn)人等。運(yùn)維人員只需查看異常列表即可了解到具體異常情況,點(diǎn)擊異常列表中的任意指標(biāo)異常可能進(jìn)一步了解該異常指標(biāo)的詳細(xì)信息,如異常來源、指標(biāo)名稱、最新異常等級、異常時間段、異常總數(shù),是否已恢復(fù)及事件合并記錄描述信息等。以便于進(jìn)一步確定異常的輕重緩急,以及異常的根源,從而使運(yùn)維人員能更快更有效的解決故障。
現(xiàn)狀五:任何一個有經(jīng)驗(yàn)的運(yùn)維人員都可以在發(fā)生異常接到告警后及時的解決故障,但每天圍著機(jī)房環(huán)境出現(xiàn)的異常現(xiàn)象日復(fù)一日已是司空見慣,運(yùn)維人員疲于奔命并且仍無法根除問題。當(dāng)機(jī)房某個設(shè)備或環(huán)境出現(xiàn)異常,運(yùn)維人員也由于缺少關(guān)于該設(shè)備或環(huán)境的一些歷史數(shù)據(jù)來進(jìn)行判斷和分析,從而無法從根本上確定該異常問題是偶然性的還是由于該設(shè)備或機(jī)房環(huán)境已經(jīng)長時間負(fù)荷過高所致使的。
機(jī)房環(huán)境運(yùn)行情況實(shí)時和統(tǒng)計(jì)分析,全面了解以及預(yù)測變化趨勢
系統(tǒng)支持當(dāng)日性能分析、指標(biāo)時段分析(實(shí)時分析和統(tǒng)計(jì)分析)、資源對比分析及時段對比分析,運(yùn)維人員可以通過相關(guān)統(tǒng)計(jì)分析數(shù)據(jù),來詳細(xì)查看機(jī)房異常情況的出現(xiàn)頻率和變化規(guī)律。例如、通過多指標(biāo)分析圖可以直觀了解到個人所關(guān)注的某幾個指標(biāo)于不同時間段的對比分析情況。根據(jù)指標(biāo)的性能分析來確定機(jī)房出現(xiàn)的問題和存在的潛在威脅,以便于給出更準(zhǔn)確、更徹底的解決方案。
現(xiàn)狀六:企業(yè)目前諸多的IT管理工具由于功能層次不齊、管理范圍受限,相互不能兼容,從而造成信息孤島,很難協(xié)同辦公建立最大價值。面對再次的網(wǎng)絡(luò)擴(kuò)展和升級,原有的監(jiān)控工具和維護(hù)人員都將面臨著再投入與再集成的困境。另外,傳統(tǒng)IT管理系統(tǒng)對于IT設(shè)備的僅僅具有最基礎(chǔ)的監(jiān)控項(xiàng),對于用戶而言如果需要保證IT管理質(zhì)量,這些基本監(jiān)控指標(biāo)是必須實(shí)時監(jiān)控的,但是這樣不可避免就會增加新的額外軟件開發(fā)資金和大量的人力工作量投入。
開放的系統(tǒng)兼容性與自定義指標(biāo),有效應(yīng)對各種網(wǎng)絡(luò)變更與擴(kuò)展
基于IT綜合管理系統(tǒng)所支持的WEB Service 、CORBA及RMI 等服務(wù)接口還能供第三方調(diào)用,全面保證系統(tǒng)的兼容性,大大滿足了用戶在實(shí)際的網(wǎng)絡(luò)管理中,與其它多種應(yīng)用和業(yè)務(wù)系統(tǒng)能夠高效整合的需要。同時,系統(tǒng)在對具體的資源監(jiān)控上,不僅有內(nèi)建的監(jiān)控指標(biāo)、擴(kuò)展的監(jiān)控指標(biāo),還有自定義的監(jiān)控指標(biāo),用戶可以把一個資源本身的指標(biāo),將若干個個人所關(guān)注的內(nèi)建指標(biāo)與擴(kuò)展指標(biāo)組建成一個新的指標(biāo)。并可以對此新的指標(biāo)設(shè)置閾值、異常類型、異常過濾等,有效滿足運(yùn)維人員對IT設(shè)備指標(biāo)的靈活監(jiān)控需求,省去了傳統(tǒng)網(wǎng)管系統(tǒng)高昂的二次開發(fā)費(fèi)用的同時,真正幫助運(yùn)維人員應(yīng)對各種網(wǎng)絡(luò)的變更、調(diào)整與擴(kuò)展等,以不變應(yīng)萬變維護(hù)好整個網(wǎng)絡(luò)。
來源:機(jī)房監(jiān)控 http://m.u88-cn-zhifuxiaoxiangmu.cn/ 本文采集于網(wǎng)絡(luò),如有問題有聯(lián)系刪除
北京金恒智能系統(tǒng)工程技術(shù)有限責(zé)任公司 版權(quán)所有 Copyright 2007-2020 by Create-china.com.cn Inc. All rights reserved.
法律聲明:未經(jīng)許可,任何模仿本站模板、轉(zhuǎn)載本站內(nèi)容等行為者,本站保留追究其法律責(zé)任的權(quán)利!
電話:86+10-62104277/2248/4249 傳真:86+10-62104193-819 京ICP備10010038號-2網(wǎng)站XML
智慧機(jī)房
在線體驗(yàn)