前言:
數(shù)據(jù)中心機房監(jiān)控系統(tǒng)也可以稱為“自我監(jiān)控系統(tǒng)”,主要是針對機房所有的設備及環(huán)境進行集中監(jiān)控和管理的,其監(jiān)控對象構成機房的各個子系統(tǒng):動力系統(tǒng)、環(huán)境系統(tǒng)、消防系統(tǒng)、保安系統(tǒng)、網(wǎng)絡系統(tǒng)等,通過監(jiān)控系統(tǒng)采集數(shù)據(jù)中心機房運行的各種數(shù)據(jù)參數(shù)來判斷是否出現(xiàn)異常,以便運維的人員做出積極準確的判斷,因此監(jiān)控系統(tǒng)對于數(shù)據(jù)中心機房尤為重要。
數(shù)據(jù)中心機房的監(jiān)控系統(tǒng)其實是包含多方面的,而不是簡單的視頻監(jiān)控,當數(shù)據(jù)中心機房出現(xiàn)一些隱患時,通過監(jiān)控系統(tǒng)及時發(fā)現(xiàn),就可以將危險消滅在搖籃之中。理論上,在數(shù)據(jù)中心機房里任何地方,任何運行的系統(tǒng)都有出問題的可能,監(jiān)控系統(tǒng)是否完全能覆蓋到將在一定程度上決定了數(shù)據(jù)中心機房運行的穩(wěn)定性。
任何一個數(shù)據(jù)中心機房都有監(jiān)控系統(tǒng),區(qū)別僅在于監(jiān)控系統(tǒng)做的完善程度上,一座數(shù)據(jù)中心機房在正式投入運營之前,就需要對數(shù)據(jù)中心機房的運轉做好完面的監(jiān)控系統(tǒng),下面詳解數(shù)據(jù)中心機房中三大重要監(jiān)控系統(tǒng)以及在高質量的數(shù)據(jù)中心機房里,監(jiān)控系統(tǒng)里都有哪些鮮為人知的功能。
數(shù)據(jù)中心機房之“設備監(jiān)控系統(tǒng)”
數(shù)據(jù)中心機房里的設備成千上萬,對這些設備的運行情況進行監(jiān)控非常必要,比如服務器運行的CPU內(nèi)存參數(shù),網(wǎng)絡設備的端口流量,業(yè)務層面的監(jiān)控等等,設備層面的監(jiān)控就更為復雜了,需要對設備的各種運行參數(shù)比較清楚,因此一般設備的監(jiān)控系統(tǒng)都采用設備廠家提供的監(jiān)控軟件或者標準的第三方軟件來進行管理。
(1)通過這些監(jiān)控軟件,7*24小時對設備運行的各種參數(shù)進行監(jiān)控,一旦發(fā)現(xiàn)有異常就發(fā)出告警。
(2)告警的方式也比較多,可以打印到日志主機上,可以通過短信發(fā)送到運維人員的手機上,也可以通過軟件系統(tǒng)自行嘗試修復。
(3)監(jiān)控的軟件做的是否完善將決定故障出現(xiàn)時,能否給出告警,所以涉及設備的監(jiān)控往往是在不斷完善的過程,很多監(jiān)控參數(shù)都是經(jīng)驗之道,甚至是歷史的教訓,只有通過不斷地改進、優(yōu)化,才能將發(fā)生的風險及時發(fā)現(xiàn),當然要做到所有的故障都可能提前預知、發(fā)現(xiàn),是非常困難的。
(4)有時的故障可能無任何征兆,尤其是硬件故障,會突然出現(xiàn),而往往監(jiān)控系統(tǒng)是無法監(jiān)測到硬件級別的、元器件的故障。
數(shù)據(jù)中心機房之“視頻監(jiān)控系統(tǒng)”
和其它的商務建筑一樣,數(shù)據(jù)中心機房也需要部署視頻監(jiān)控系統(tǒng)。視頻監(jiān)控主要是對進出數(shù)據(jù)中心機房的人員進行監(jiān)控,在數(shù)據(jù)中心機房的出入口要部署攝像頭,在數(shù)據(jù)中心機房內(nèi)部樓道,重要的機房入口都要部署。
在有的非常重要業(yè)務的機房內(nèi),有時也要部署攝像頭,以便防止一些人員的惡意操作或者誤操作,發(fā)現(xiàn)這些異常時及時制止,以防止給數(shù)據(jù)中心機房業(yè)務帶來影響。數(shù)據(jù)中心機房里的很多設備、儀器都是非常昂貴的,因為人為的原因導致?lián)p壞的情況是非常多見的,還有就是防止一些偷盜行為。比如數(shù)據(jù)中心機房里的光模塊,一個光模塊,尤其是40G/100G光模塊,一個都要數(shù)千元,順手拿出去幾個,轉手可以獲利上萬元。
有了視頻監(jiān)控系統(tǒng),就能大限度地避免這些行為出現(xiàn),或者在出現(xiàn)后可以通過這些監(jiān)控錄像進行分析、追責,這些視頻錄像是重要的證據(jù),所以視頻監(jiān)控系統(tǒng)是數(shù)據(jù)中心機房不可缺少的一部分,有的數(shù)據(jù)中心機房除了視頻的監(jiān)控,還要在數(shù)據(jù)中心機房出入做好人員訪問登記工作,對外來人員進行管理,避免放入一些惡意分子。
數(shù)據(jù)中心機房之“煙霧溫濕監(jiān)控系統(tǒng)”
數(shù)據(jù)中心機房一樣怕火,一旦發(fā)生火災對于數(shù)據(jù)中心機房來說就是毀滅性的打擊。以往也出現(xiàn)過一些慘痛的教訓,所以對于放火,數(shù)據(jù)中心機房且不可大意。數(shù)據(jù)中心機房和其它的建筑不同,內(nèi)部有太多的電子設備,并不適用于噴淋系統(tǒng),只能采用干粉滅火或者惰性氣體滅火。
當機房內(nèi)的煙霧濃度超過了報警器設定的門限,即觸發(fā)監(jiān)控系統(tǒng),及時將火滅除,除了煙霧,機房內(nèi)的溫度和濕度也是需要監(jiān)控的重要部署。數(shù)據(jù)中心機房內(nèi)部要盡量保持恒溫恒濕,但實際上在數(shù)據(jù)中心機房內(nèi)部會有局部的溫度死角,長期以往會大大降低電子設備的使用壽命,通過在數(shù)據(jù)中心機房內(nèi)多個區(qū)域部署溫濕度傳感器,建立起溫濕度的監(jiān)控網(wǎng)絡,就可以及時地發(fā)現(xiàn)局部區(qū)域過溫過濕的情況,在一些空氣污染較為嚴重的地方,還可以部署空氣清潔度監(jiān)測的設備,數(shù)據(jù)中心機房設備運行在污染嚴重的環(huán)境里,容易造成靜電、電容擊穿器件等故障,為何我們要求數(shù)據(jù)中心機房設備要周期性地進行除塵就是這個道理,本身灰塵中就含有不少的污染物。
數(shù)據(jù)中心機房在高速的發(fā)展,各種新技術層出不窮,也讓數(shù)據(jù)中心機房運行變得愈加復雜,這給監(jiān)控系統(tǒng)也帶來了不小的挑戰(zhàn),如何通過監(jiān)控系統(tǒng)及時發(fā)現(xiàn)運行風險,是監(jiān)控系統(tǒng)關心的永恒話題。
盡管數(shù)據(jù)中心機房有各種各樣的監(jiān)控系統(tǒng),但是可以確定的是監(jiān)控系統(tǒng)無法提前發(fā)現(xiàn)所有的故障,尤其是設備級別的故障,但是通過完善的監(jiān)控系統(tǒng)的確可以大大避免很多故障。就算監(jiān)控系統(tǒng)沒有在發(fā)生故障時,給出告警,但是在事后故障分析中,監(jiān)控系統(tǒng)的各種技術參數(shù)和記錄依然是可供分析的重要資料,通過對這些監(jiān)控記錄很可能可以找出故障的原因。監(jiān)控系統(tǒng)的作用就是將歷史經(jīng)驗、教訓轉化為一些數(shù)據(jù)參數(shù),然后采集數(shù)據(jù)中心機房里的各種數(shù)據(jù)信息進行對比,如果發(fā)現(xiàn)異常,就及時給出告警。數(shù)據(jù)越豐富,監(jiān)控系統(tǒng)的功能就越強大。
不要以為一個數(shù)據(jù)中心機房不是部署了監(jiān)控系統(tǒng)就可以高枕無憂了,任何的系統(tǒng)都有漏洞,何況是監(jiān)控系統(tǒng),所以數(shù)據(jù)中心機房運維人員還要在日常的工作中,多檢查,多分析,及時發(fā)現(xiàn)隱患,如果監(jiān)控系統(tǒng)未能發(fā)現(xiàn),那么想辦法將這些隱患的判斷加到監(jiān)控系統(tǒng)中,使監(jiān)控系統(tǒng)越來越完善,決不能允許相同的錯誤,連續(xù)犯兩次。
來源:機房監(jiān)控 http://m.wer666.com 本文采集于網(wǎng)絡,如有問題有聯(lián)系刪除
北京金恒智能系統(tǒng)工程技術有限責任公司 版權所有 Copyright 2007-2020 by Create-china.com.cn Inc. All rights reserved.
法律聲明:未經(jīng)許可,任何模仿本站模板、轉載本站內(nèi)容等行為者,本站保留追究其法律責任的權利!
電話:86+10-62104277/2248/4249 傳真:86+10-62104193-819 京ICP備10010038號-2網(wǎng)站XML
智慧機房
在線體驗