智能微模塊,構建智慧數據中心的基石
2014年10月8日 09:21

        數據中心的大型化增加了數據中心的建設運營的復雜度與約束,傳統建設模式面臨著前所未有的挑戰。

        當前數據中心面臨的挑戰

        1) 基礎設施無法彈性匹配業務需求

        數據中心基礎設施生命周期遠超出IT設備。UPS的壽命大約為10年,空調的壽命約為10-15年,而配電設施更可以達到20年以上,企業很難預測在此時間內IT系統的業務需求與發展。當業務增長時,基礎設施擴容困難,因此傳統數據中心基礎設施通常采用在規劃階段采用一次性部署完成的策略,致使初期投資大、負載率低、能耗高、投資回報周期過長。而且傳統數據中心工程化的建設方式過程復雜,多個子系統相互耦合,涉及多個施工單位,建設周期長,無法滿足業務快速上線的需求。當前虛擬化、云計算、物聯網、大數據等技術的發展正帶給IT系統革命性的變化,進一步增加了業務上線的速度要求及預測未來業務發展的難度,傳統數據中心更加無法適配業務發展變化對基礎設施彈性的需求。

        2) 高能耗大幅侵蝕利潤

        電費開支是數據中心的長期運營成本,其投入常超出基礎設施的投資。以部署1MW IT設備、PUE為2的數據中心為例,其年耗電可達到1752萬kWh,十年的生命周期內耗電就達到1.75億kWh。在全球范圍內,數據中心的年耗電量已達3000億度,約占全球總發電量的1%-2%,相當于1億噸標準煤,對環境有不可忽視的影響。當前國外數據中心的PUE約為1.8,國內大部分數據中心PUE在2.2-3.0之間,非IT設備能源消耗過高,巨大的電費支出侵蝕了企業的利潤,增加了企業的經濟負擔。

        3) 管理粗放、運營低效,ROI低

        傳統數據中心更多關心的是供電和空調制冷可靠,只需滿足基本的日常運行需求即可。對于精細化的運營管理不關注,而以粗放、低效的運營方式為主,產生了大量浪費,數據中心ROI處于低水平。具體表現在:①缺乏完善的狀態數據,關鍵數據依賴人工巡檢采集,更不用談自動報表與智能分析;②系統缺乏前瞻性的預防措施,必須在故障之后才發現問題,故障之后處理速度慢,無法快速定位消除故障;③運營效率低下,需要大量的人力、電力、空間等資源投入滿足管理與運行需求;④資產與資源利用率低,依靠人工優化,缺乏識別低效環境、提升效益的工具與方法。隨著數據中心規模與復雜度的增大、能源和人力成本的上升,傳統上依靠大量資源消耗、人力投入的運營維護方式難以為繼,亟需改變。

        4) 過度依賴系統冗余保障可靠性與業務連續

        傳統數據中心的設計為確保物理安全和運行可靠性,僅將基礎設施進行多重冗余設計,缺乏從運營角度保障系統的可靠性。比如,缺乏環境、設備狀態與健康程度的實時監測,當IT配置發生變化時,不能及時確認供電與制冷的冗余情況,系統的健康程度無法及時獲得。而依賴冗余保障可靠性的方式也導致實際負載量遠遠低于設計容量,基礎設施低效運行,后端能耗等成本大大增加。

        智慧數據中心是現代數據中心的必然選擇

        傳統數據中心僵化的建設模式、高能耗、高投入的運營模式已經無法適應數據中心大型化、精益化的趨勢,更難以匹配現代數據中心貫穿于整個規劃建造過程中多層次、相互依存、分布式、網絡化的特征。數據中心的建設運營必須完成從僵化到柔性、從粗放到精細、從依賴人力到依賴流程與工具的轉變,實現以高彈性、高效、高可靠及高度智能化自動化為特征的智慧數據中心。智慧數據中心具備以下特征:

        1) 上線速度快,易于疊加,按需在線擴展,以保護投資,確保每一分投資的效益最大化。

        2) 通過使用高效的供電、制冷方式實現非IT設施的節能,降低PUE,結合綠色IT系統,確保滿足業務需求的前提下整體能耗最小;并通過自學習、自優化能夠協同數據中心內各個系統與部件實現最優化狀態運行,進一步降低能耗與PUE,降低企業成本。

        3) 數字化、使系統可視可管。數字化實現器件級、部件級、系統級的可量化可感知,讓數據中心簡單易管,所有設備信息盡在掌控。

        4) 智能化實現系統自動管理和維護。傳統數據中心網點眾多,實行單點監控,分散管理,導致經驗無法共享,團隊無法復用,使得運維成本成倍上升。這就要求智慧數據中心能夠實現統一、智能管理,能夠提供大平臺滿足大容量監測的需求,并提供大數據分析能力,實現自動管理和維護。

        5) 網絡化實現高效運營。智慧數據中心趨向于網絡化統一管理,實現分層管理集中監控。高效運營主要體現在三方面,節能降耗,實現全網數據中心多層級、精細化能耗管理,構建綠色數據中心;最佳資產管理,全網資產的全生命周期管理;容量最優,全網數據中心配電、制冷、空間的精準監控,系統容量的三相平衡。

        智能微模塊是智慧數據中心的最佳載體

        智慧數據中心提倡數字化、智能化、網絡化的方式使數據中心實現高彈性、高效、高可靠的目標。這個趨勢和方向已經得到了業界的廣泛認可,圍繞“智慧”兩個字,國內外眾多涉及數據中心基礎設施領域的知名廠商都在悄然進行技術布局。如何結合物聯網技術,以新型的氣流組織管理理念,使復雜的大型數據中心變成如家用電器一樣易管理易維護的產品化設備,一時間成了熱門的話題,甚囂塵上。

        與此同時,模塊化的發展這幾年下來也愈演愈烈。早期模塊化以Google、Facebook近年來建設的眾多大型數據中心為例,采用集裝箱框架的模塊化單元,應用標準化的冷、熱通道隔離技術,來快速建設高效、低PUE的模塊化數據中心。在土地資源緊缺的國內,尤其是東部,直接照搬他們的經驗顯然未必合適。室內模塊化因更適合多層建筑而逐漸成為國內數據中心發展的主要方向,微模塊類產品在移動、電信、騰訊、世紀互聯等電信互聯網巨頭已經廣泛應用,因其靈活性和可預測性也深得大中型企業青睞。

        而一些走在行業前列的廠商,已經開始更進一步,在智慧數據中心的大構想下,結合模塊化理念,推出智能微模塊產品。據知情人士透露,住建部和工信部將會針對數據中心行業起草數據中心節能、檢測、運維等標準草案,同時也在考慮把微模塊,尤其是智能微模塊相關標準納入其中,以提升我國的數據中心能源利用和管理效率。

        那么智能微模塊,究竟有什么優勢,筆者認為,主要還在于以下幾點:

        1) 設計簡單,部署快速,可實現時間與空間兩個維度按需增長

        智能微模塊沿襲和繼承了模塊化數據中心的優勢,將復雜的數據中心系統分解為多個可獨立支撐業務的標準功能單元,并根據業務需要配置不同數量的模塊,實現按需投資。不過難能可貴的是,智能微模塊在傳統模塊化數據中心的基礎上,進一步將傳感器及通訊無線化,可縮短安裝交付周期至3周,支持業務快速上線,相比之下,建造傳統的數據中心通常需要數月,甚至數年。在時間維度上,智能微模塊可作為最小復制單元。當業務增長時,無需過多規劃、設計即可直接復制,實現按成長付費模式投資,避免一次性投資過多。在空間維度上,對于不同規模的數據中心,只需按需使用不同配置與不同數量的微模塊。

        2)前瞻性運維,更可靠、更值得信賴

        數據中心的可靠性一直是業界最關注的話題,尤其對于金融、互聯網等領域,無論是何種原因導致的數據中心業務中斷都會給企業帶來難以接受的巨大損失。智慧微模塊的管理是自動化的,將人力解放的管理,依靠數字化技術顛覆傳統部件監控模式,實現器件級精準管理,讓設備可視、可監、可管,讓數據中心更簡單,讓運維質量測點和標準更易懂。同時智慧微模塊可以將人為的日常巡檢、隱患預判斷、健康度檢查用傳感器、執行器所替代,實現數據中心內環境、設備、部件、器件多個層次完善的狀態獲取,提前評估不同層級的健康狀態,并在異常時提前發出告警,實現主動運維和及時備件更換,提升設備壽命進而大大改善整個系統的可靠性。

        智能微模塊創新性的提出了前瞻性運維的概念,對易損關鍵部件如電池、電容、空調風扇、水閥等進行實時監控,并形成健康度評估數據。以電池為例,通過監控電池的內阻、溫度、電壓、電流等關鍵數據,一旦發現數據變化超出正常工作范圍,智能控制器就可以迅速響應,給出告警并采取隔離措施。除此之外,還會結合出廠特性參數、歷史充放電數據、數據中心整網維護數據等相關數據,進行深度分析,見微知著,從細微的變化預測出可能存在的故障單體,并給出針對性預防措施。再比如UPS內部關鍵器件母線電容,可以通過實時在線的監測主動感知其健康度,避免突然失效導致設備宕機,將事后被動響應改為主動運維。

        智能微模塊結合傳感器與大數據分析技術,將傳統的故障維護變為了故障預測、前瞻性維護。這些措施將極大的提高數據中心可靠性。

        3)可實現高效運營的智能管理系統

        智慧微模塊同時能夠提供高效運營,智慧數據中心的高效運營主要是實現三個最佳:最佳綠色數據中心,最佳資產管理以及最佳容量匹配。

        智慧微模塊管理系統能夠幫助客戶節能降耗,實現數據中心多層級、精細化能耗管理,通過多種報表精確定位能源額外損耗點,基于大數據分析,輸出節能優化方案,構建綠色數據中心。以空調為例,傳統模式下,數據中心單個精密空調都是通過自身的出/回風溫濕度來判定如何工作,可以說是各自為政。智能微模塊的所有空調都是由統一智能控制器作為“將軍”,結合眾多溫度傳感器構成的溫濕度場情況來發布指令。少數廠商更甚一籌,通過智能微模塊內部的溫度傳感器和服務器、存儲自身獲得的芯片溫度疊加成“溫濕度天網”,生成實時的溫濕度場圖??删珳识ㄎ粷撛谶^冷/過熱區域,精確制冷,完全避免加濕和除濕在不同位置同時運行的惡劣情況,據稱同等硬件設施情況下可以再降低PUE0.07到0.15,對于我國大部分無法應用自然冷卻技術的區域,將會是很大的福音。

        在供電層面,智能微模塊通過內置模塊化UPS,結合IT業務量迅速匹配最佳供電效率點,UPS效率可持續保持在96%左右,而不會出現低載低效的情況。同時,智能微模塊的集成智能控制器通過和IT設備層保持通訊,可手動或自動下達指令對運行業務進行必要的遷移,提升設備利用率,關閉部分區域空閑設備,最高可減少耗電80%以上。

        最佳資產管理是對于全網資產的生命周期管理,從資產自動入庫,到資產變更信息同步,再到資產日常維護,最后到資產生命周期結束,通過標準化的ITIL流程管理機制,實現資產信息的閉環管理,保證數據及時刷新,及時管理。同時基于設備生命周期的精確監控,幫助制定資產維護計劃,在維護計劃內幫助客戶實現主動預警,在執行維護計劃過程中,依靠大數據分析,動態調整維護計劃,按照當前實際情況輸出優化方案,構建最佳資產管理功能。

        最佳容量匹配是對數據中心配電、制冷、空間的實時監控,從大樓級容量到機柜級容量,實現精確管理。通過歷史運行數據分析,對實際需求進行準確估測,減少實際需求與潛在需求間的余量,實現電源、制冷與負載間的匹配?;谧罴褭C位匹配算法,全面考慮供電、散熱、U空間、端口的匹配能力,使用what if的模擬測試方法,分析和測試發生變更可能產生的影響,從而已裝機的供電、制冷系統中獲得最佳的機柜供給,最大化的使用裝機容量。智能微模塊中,容量管理以實際的配置以及配置的變更為基礎,通過測量、分析與評估,給出問題改進建議以及可用性分析報告,促進數據中心容量最優化部署。

        智能微模塊在傳統微模塊的基礎上,融合了物聯網、數字技術與信息技術,制冷、供電、結構系統從孤立無思想的部件變成有思想、統一可管理、通訊的智能部件,系統可視可管,并從基礎設施、IT設施層多個層面進行綜合分析和優化,相比傳統數據中心確實更為簡單、高效、可靠,有著極大的優勢。

        總結

        隨著數據中心大型化、集中化的發展,傳統數據中心由僵化的結構、低效的管理與運營,向具有數字化、網絡化、智能化特征的智慧數據中心轉變,以實現投資效益與運營效率的最大化,無疑是大勢所趨。而筆者相信,智能微模塊作為智慧數據中心的載體,正是實現這種美好轉變的最佳選擇,在未來的數據中心發展中也必將占據更加重要的地位。