產(chǎn)品中心 應(yīng)用方案 技術(shù)文摘質(zhì)量保證產(chǎn)品選型 下載中心業(yè)內(nèi)動態(tài) 選型幫助 品牌介紹 產(chǎn)品一覽 聯(lián)系我們
- 實現(xiàn)基礎(chǔ)設(shè)施有效監(jiān)控的十個步驟
- 來源:IT168 發(fā)表于 2011/1/18
一、測量
如果你無法對數(shù)據(jù)中心的一些數(shù)據(jù)進行監(jiān)測,那么你也就無法控制它,這也是為什么監(jiān)測是這10個步驟中首要的一步。部署傳感器可以幫助你搜集電力配置、冷卻能力等關(guān)乎數(shù)據(jù)中心安全的數(shù)據(jù)資料。
1、 溫度傳感器
高熱密度是數(shù)據(jù)中心向高密度和復雜性方向發(fā)展所造成的嚴重問題之一。隨著密度的增加,制冷負荷的增長,使數(shù)據(jù)中心問題更加多樣化。同一個高密度機架上可能會出現(xiàn)局部熱點,也可能會有局部溫度低于冷卻溫度的情況,所以,即便是同一個機架設(shè)備溫度也會有很大差異。
在整個數(shù)據(jù)中心安裝部署溫度傳感器網(wǎng)絡(luò)有助于確保設(shè)備工作溫度在ASHRAE推薦的64.4°F-80.6°F范圍內(nèi)。通過對機架多個位置溫度的監(jiān)測,可以精確的控制冷卻裝置,使其更加有效的運作。
另外通過傳感器網(wǎng)絡(luò),還可以放心地把數(shù)據(jù)中心溫度提高到接近ASHRAE所規(guī)定的溫度上限,例如從65°F提高到75°F。實驗證明,服務(wù)器入口溫度每提高10°F,其制冷耗電量就會減少30%。
對數(shù)據(jù)中心送風溫度和回風溫度的測量都是用于輔助測量服務(wù)器進風口溫度的,以便更精確地掌控服務(wù)器的運行溫度。如今,越來越多的制冷系統(tǒng)已經(jīng)遷移至機架上,而傳感器也可以直接連接到冷卻裝置的某個特定位置上,形成一個小型的傳感器網(wǎng)絡(luò),服務(wù)器入口的溫度可以根據(jù)對相鄰機架溫度和冷卻溫度的測量而進行相應(yīng)的調(diào)整。
最好的做法是在每個機架上至少安裝一個傳感器,也可以在冷通道/熱通道的機架上統(tǒng)一安裝,傳感器的位置必須是在該行溫度最高的那臺機架的頂部。這樣也可以監(jiān)測到是否有熱空氣從熱通道進入到冷通道。
傳感器直接連接到冷卻系統(tǒng)的優(yōu)勢在于,當傳感器與冷卻系統(tǒng)協(xié)同冷卻系統(tǒng)可以自動調(diào)整運行溫度,可以消除熱點,對熱負荷的變化作出反映,還可以協(xié)調(diào)同一工作區(qū)間的其他制冷設(shè)備運行。傳感器安裝的具體位置應(yīng)該遵循ASHRAE所提供的《數(shù)據(jù)處理環(huán)境熱指南》,以便讀取機架入口處的溫度數(shù)據(jù),測量送風溫度、回風溫度和風量值。
2、監(jiān)測電源的使用情況
功率密度和能源成本上升的同時,能夠監(jiān)測能源的有效使用率對數(shù)據(jù)中心管理是至關(guān)重要的。那么電源監(jiān)測是如何影響能源使用效率的呢?要通過更多的監(jiān)測信息對PUE進行討論。
為了對數(shù)據(jù)中心的能耗有一個全面的了解,應(yīng)該在UPS進行監(jiān)測,并在機架上安裝電源分配單元(PDU)。對UPS進行監(jiān)測所搜集的數(shù)據(jù)可以用于計算電源使用效率(PEU),使IT經(jīng)理確定電源消耗的方向并作出應(yīng)對措施。利用PDU還能預(yù)防發(fā)生過載事件,確保設(shè)備的電力分布平均。
最好的IT功耗檢查方法就是機架內(nèi)部的PDUA,機柜PDU的特點是能夠?qū)B續(xù)運行功率實施綜合測量和控制。由于每個機架的負載和機架內(nèi)的基礎(chǔ)設(shè)備的功耗都有所不同,所以每個機架都應(yīng)該安裝一個PDU,在雙總線環(huán)境下,機柜PDU可以監(jiān)測電源的消耗,多種輸入型式與多樣的插位組合的PDU在過載時起到保護作用。
這就為數(shù)據(jù)中心的電力消耗管理提供了直接的監(jiān)測數(shù)據(jù),同時也提高了數(shù)據(jù)中心的效率和可用性。除了有效的電源管理,機柜PDU還能為IT服務(wù)價格提供參考和識別未被充分利用的空間。遠程開啟和關(guān)閉功能還能防止因新增設(shè)備而造成的過載。
3、對機柜運行環(huán)境的監(jiān)測
隨著密度的增長,現(xiàn)在單個機柜支撐的計算能力可以相當于過去的整個機房。機柜內(nèi)設(shè)備運行情況的可見性,能夠幫助預(yù)防其常見的威脅,包括:意外的或是惡意的篡改、水的進入、煙霧、濕度或者溫度過高。
當機柜門被打開、監(jiān)測到有水或煙霧,或是當溫度或濕度超出設(shè)定值時,都會觸發(fā)機柜內(nèi)的監(jiān)控單元配置的報警器發(fā)出警報。這些“機柜內(nèi)的眼睛”可以連接到中央監(jiān)控系統(tǒng),其環(huán)境數(shù)據(jù)和機柜內(nèi)PDU所采集的電源消耗數(shù)據(jù)可以被集成,如果監(jiān)測出現(xiàn)問題也會通過激活指示燈和報警器發(fā)出本地報警。因此,這些設(shè)備應(yīng)該被部署在高密度機架和機架內(nèi)的關(guān)鍵業(yè)務(wù)設(shè)備中。
4、液體泄漏監(jiān)測
數(shù)據(jù)中心內(nèi)液體泄漏會造成數(shù)千萬美元的設(shè)備損壞和失去大量的數(shù)據(jù),嚴重影響客戶交易和企業(yè)的生產(chǎn)力。液體泄漏監(jiān)測系統(tǒng)利用部署在不同位置的傳感器探測整個數(shù)據(jù)中心,通過及時報警防止設(shè)備損壞。
泄漏監(jiān)測系統(tǒng)可以作為一個獨立的操作系統(tǒng)進入到中央監(jiān)控系統(tǒng),這樣就簡化了報警管理。無論那種方式,它都是讓數(shù)據(jù)中心經(jīng)理了解其運營狀況的傳感器網(wǎng)絡(luò)的一個重要組成部分。
二、控制管理
4、精密制冷系統(tǒng)的智能控制
把智能控制整合到房間空氣調(diào)節(jié)器里,可以更高效、更精確地控制溫濕度。智能控制系統(tǒng)可以協(xié)調(diào)多個制冷機組運行,使個機組之間實現(xiàn)功能互補并避免沖出。例如,對濕度的控制,絕對濕度的控制方式可以按空氣中的水分含量控制濕度,不會因溫度波動引起相對濕度波動,造成機組不必要的加濕或除濕動作,也節(jié)約了不必要的能耗。數(shù)據(jù)中心或者機架級制冷系統(tǒng)的控制系統(tǒng)還可以縮短管理人員對系統(tǒng)問題的響應(yīng)和維護時間,控制系統(tǒng)還能根據(jù)所搜集的數(shù)據(jù)對組件進行預(yù)測分析,對整個系統(tǒng)維護提供依據(jù)。另外,詳細的事件日志、服務(wù)歷時記錄、備件清單都能提高服務(wù)的效率。
5、供電系統(tǒng)的智能控制
現(xiàn)在,數(shù)字化和智能化大大優(yōu)化了UPS供電系統(tǒng)的性能。UPS的智能化主要通過系統(tǒng)的控制軟件實現(xiàn)。在系統(tǒng)運行狀態(tài)識別與控制方面,通過內(nèi)部傳感器和狀態(tài)邏輯及識別系統(tǒng)所處的運行狀態(tài),判定系統(tǒng)運行程序和運行是否正常。數(shù)字化則是采用數(shù)字信號處理算法,有效地解決并行系統(tǒng)之間的相互溝通問題,以減少故障機會。在大部分情況下,還能自行診斷故障并且隨即解決問題。如果遇到用戶預(yù)先設(shè)定的重大故障,則會直接報警。
通過能源優(yōu)化和智能并聯(lián)等特性還能使系統(tǒng)更有效地運作。能源優(yōu)化模式在提高UPS系統(tǒng)對IT負載供電效率的同時,還具有調(diào)節(jié)功率的特點,例如在電力需求不高的周末或晚上,可以對供電功率進行調(diào)整,就能有效避免不必要的能源消耗。
并聯(lián)智能控制為模塊化UPS提供了一個提高效率的途徑,它不僅能對多模塊并聯(lián)UPS進行智能管理,還可以實現(xiàn)自動關(guān)閉不需要支持負載的UPS模塊,以提高系統(tǒng)效率。
6、集中監(jiān)控和管理
集中監(jiān)控的目標就是要能夠通過管理與技術(shù)的應(yīng)用,對基礎(chǔ)設(shè)施與IT基礎(chǔ)架構(gòu)的運行情況進行監(jiān)視,實現(xiàn)故障與異常的實時發(fā)現(xiàn)與通知;此外還可以通過對監(jiān)控數(shù)據(jù)搜集與整理,為容量管理、事件管理、問題管理、符合性管理提供分析的基礎(chǔ),最終實現(xiàn)數(shù)據(jù)中心高可用性的目標。
目前,數(shù)據(jù)中心的供電系統(tǒng)和制冷系統(tǒng)都可以顯示運行數(shù)據(jù),例如可以顯示機架服務(wù)器的入口溫度,這些工具的使用都推動了集中監(jiān)控系統(tǒng)的發(fā)展。
7、報警和警報的管理
對數(shù)據(jù)中心基礎(chǔ)設(shè)施集中監(jiān)控的目的是最大限度地減少系統(tǒng)停機時間,及時有效地應(yīng)對系統(tǒng)問題。集中報警管理系統(tǒng)為數(shù)據(jù)中心提供一個統(tǒng)一的運營窗口,對臨界報警這種比較嚴重的事件可以做到優(yōu)先處理。對多個同時報警的故障,可以根據(jù)對業(yè)務(wù)的影響度決定其處理順序。
更近一步的說,管理人員可以根據(jù)監(jiān)測系統(tǒng)的數(shù)據(jù)來分析設(shè)備的運行狀況,并執(zhí)行有效的維護計劃。
8、監(jiān)測能源使用效率
在大多數(shù)情況下,數(shù)據(jù)中心并不會安裝相應(yīng)的能源使用使用監(jiān)測設(shè)施。很多數(shù)據(jù)中心的管理員覺得安裝這樣的設(shè)施很沒有必要,這對提高數(shù)據(jù)中心的能源使用效率并沒有多大的效果。其實并不是這樣的,建立一套能源使用狀況監(jiān)測系統(tǒng)對于提高能源使用效率有著很好的激勵作用,它能夠很直觀的顯示出數(shù)據(jù)中心內(nèi)部的能源狀況。這可以提醒數(shù)據(jù)中心的管理員應(yīng)該時刻關(guān)注數(shù)據(jù)中心的能源使用率并提高。
建立這樣的能源監(jiān)測系統(tǒng),可以根據(jù)數(shù)據(jù)輕松算出PUE值,有利于IT經(jīng)理跟蹤能源消耗,從而分析和優(yōu)化能源的使用。
9、電池監(jiān)測
為了防止數(shù)據(jù)丟失和提高正常運行時間,大多數(shù)數(shù)據(jù)中心需要一個專用的電池監(jiān)測系統(tǒng)。電池監(jiān)測系統(tǒng)可以把電池的潛在故障通知給管理員,最好的做法是實施一個監(jiān)測系統(tǒng),并跟蹤串聯(lián)電池組中的每節(jié)電池的健康狀況。有效的電池跟蹤監(jiān)測系統(tǒng)包括對內(nèi)阻參數(shù)的測量和對蓄電池充放電情況的監(jiān)測,以確保測量的準確度。
UPS的許多用戶認為UPS本身已帶蓄電池監(jiān)測功能,無需再安裝另外的蓄電池監(jiān)測系統(tǒng)。確實,大部分UPS都帶有一定的蓄電池監(jiān)測功能,可以監(jiān)測組壓及記錄放電曲線,但是對于準確掌握每節(jié)蓄電池的運行狀況這些監(jiān)測是遠遠不夠的。UPS一般只能監(jiān)測組壓,不能監(jiān)測每節(jié)電池的電壓,一旦某節(jié)電池失效,組壓往往還是正常的,而對于串接的電池組來說,這是非常危險的。
10、遠程監(jiān)控管理
在減少能耗的趨勢下,數(shù)據(jù)中心遠程監(jiān)控和管理應(yīng)運而生。你可以用最小的人力成本來執(zhí)行關(guān)鍵任務(wù)工作,且不管你身在何處,這也就是無人值守的概念。但無論如何,遠程管理確實節(jié)約了大量的成本。一個數(shù)據(jù)中心的管理者,只須考慮機架上的虛擬主機、高效的安全人員以及他的數(shù)據(jù)中心的地理位置,然后用遠程管理操作數(shù)據(jù)中心,所有他所要做的就是坐視成本的急劇下降。此外,限制訪問的另外的好處是,實際進入數(shù)據(jù)中心接觸到計算機的人少了,因此發(fā)生意外及安全漏洞的機會也少了。這種遠程管理用遠程輸入輸出系統(tǒng)訪問數(shù)據(jù)中心的服務(wù)器,這種方式還可以提高反應(yīng)時間。通過這個系統(tǒng),也可以實現(xiàn)地理上的獨立性。
三、基礎(chǔ)設(shè)施監(jiān)控的效益評估
通過這10個步驟,數(shù)據(jù)中心關(guān)鍵設(shè)施的可用性和效率是可以量化的。幾乎每個步驟都有助于監(jiān)測數(shù)據(jù)中心的可用性,并能分析系統(tǒng)潛在問題從而提高響應(yīng)速度。從整個監(jiān)控系統(tǒng)中,管理員可以準確知道任何一個機架在什么時候發(fā)生了什么事件,集中報警管理和電池監(jiān)測等基礎(chǔ)設(shè)施監(jiān)控從根本上消除了數(shù)據(jù)中心停機最常見的原因。
在許多情況下,這些系統(tǒng)是相對容易實現(xiàn)的,而且一旦安裝,可以對數(shù)據(jù)中心優(yōu)化提供可視的和必要的控制。
轉(zhuǎn)載請注明來源:賽斯維傳感器網(wǎng)(tcmtest.cn)