分析:數據中心容量危機應吸取的教訓 |
發布時間: 2012/7/21 15:09:28 |
2005年,美國能源部西北太平洋實驗室(PNNL)的數據中心存在的問題到了緊要關頭。
美國能源部管理的政府實驗室的數據中心服務經理Ralph Wescott說,意外的中斷幾乎每個月都會發生,每一次中斷都會使數據中心關閉幾個小時。機構正在購買越來越多的機架式服務器(找億恩小草qq858227563)增加計算資源。機架式服務器(找億恩小草qq858227563)最近變得越來越便宜。在2005年7月,數據中心曾達到其容量的極限。Wescott說,機構會購買一臺服務器(找億恩小草qq858227563),然后扔給我說,“嗨,安裝這臺機器。”但是,我沒有空間、電源或者冷卻容量來安裝這臺機器。如果我再安裝一臺機器,整個房間就會停電。 Wescott和PNNL(美國能源部西北太平洋實驗室)參加了一個廣泛的項目以便在不突破預算的情況下升級自己的數據中心。在最近三年的每一個季度里,這個數據中心組都有用一個周末的時間關閉服務器(找億恩小草qq858227563)房間,用效率更高的設備更換一些老式的服務器(找億恩小草qq858227563)和地板下面纏繞的網絡電纜線,從而用較少的在天花板上布線的電纜線連接更強大的服務器(找億恩小草qq858227563)。這種新的配置允許在這個房間里進行效率更高的冷卻。 這個結果是什么?PNNL把在500臺服務器(找億恩小草qq858227563)上運行的500個應用程序轉變為在150臺服務器(找億恩小草qq858227563)上運行的800個應用程序。 CIO.com的姊妹分析公司IDC的技術、金融和執行戰略計劃經理Joseph Pucciarelli說,在經濟緊縮時期,實施這種信息技術項目需要嚴格控制錢袋的帶子。他說,這種情況是很常見的。企業正在進行及時的投資。企業遇到一個問題,他們正在以克制的方式看待這個問題。 下面是PNNL把數據中心從容量極限恢復到正常狀態的過程中學到的一些教訓。 1.規劃,不要做出反應 Wescott要解決的第一個問題是數據中心組對發生的每一個小問題立即做出反應,而不是觀察這個系統性的問題和創建一個計劃以建立一個可持續的服務。除了這500臺服務器(找億恩小草qq858227563)之外,這個數據中心還有3.3萬條電纜線連接這些服務以便進行供電、連接網絡和安全系統。他說,我們確定這個數據中心應該是什么樣子,應該是什么容量。 這個小組的結論是,按照當前的軌道發展,這個數據中心在10年內將達到3000個應用程序,每個應用程序都在自己的服務器(找億恩小草qq858227563)上運行。現在,這個數據中心的應用程序有81%都進行了虛擬化,每臺服務器(找億恩小草qq858227563)平均運行17個應用程序。Wescott計劃把虛擬化的比例提高到90%。 IDC的Pucciarelli說,企業應該把重點放在三個方面來提高容量。減少物理服務器(找億恩小草qq858227563)的數量和在虛擬機上運行應用程序有助于減少電源需求,就像更有效的冷卻系統和配電系統的改善所做的那樣。這一般是更新數據中心的時候要做的三件事。 Pucciarelli曾遇到許多企業用兩臺或者三臺大容量系統替換50臺服務器(找億恩小草qq858227563)并且使用虛擬化允許自己的應用程序。 2.管理措施 PNNL的Wescott說,管理數據中心經理需要監視數據中心狀態的方法,但是,他們經常沒有合適的工具。在改變之前,PNNL沒有辦法衡量自己的數據中心的效率。當房間黑了時候,發現了電源問題或者通過更直覺的方式發現問題。他說,如果我們的電源線通過太多的電流,我發現的一個方法就是把手放在斷路開關上,如果感覺發熱,我就知道遇到問題了。這表明你現在需要工具。現在,PNNL在每一排的第四臺服務器(找億恩小草qq858227563)的底部、中部和頂部都配置了一個傳感器以創建一個服務器(找億恩小草qq858227563)機房的3D熱量圖。這個數據能夠讓Wescott改變他冷卻數據中心的方式,提高整個溫度和把冷卻應用到你需要冷卻的地方。 Wescott說,我認為那將為我節省許多錢,減少空調的磨損。他現在預計數據中心的冷卻效率提高了40%以上。 3.采取小的步驟 Wescott說,在不中斷運營的情況下徹底重新設置數據中心是一個大問題。數據中心經理主張采取小步驟以最大限度減少中斷,但是,把這個決定留給他的經理。 Wescott說,我向管理層提出了兩個選擇。我們用7天時間處理整個園區的事情;另一個選擇是每一個季度在周末關機一次。 通過采取小的步驟,這個組準備一次更換數據中心的一排服務器(找億恩小草qq858227563)。在第一個三天的周末,這個30個人的團隊在數據中心一天用了14個小時更換一排服務器(找億恩小草qq858227563)機架并且測試新的配置。這個數據中心立刻變得更可靠和穩定了。 如果管理層不同意允許數據中心關機,要提醒他們最好有一個計劃的關機的時間,不要突然的無計劃的中斷。當一艘船在大海中航行的時候,你不能給這艘船的船底刷油漆。但是,如果你不刷油漆的話,這艘船就會沉沒。 4.為長期的增長接受短期的痛苦 管理層在這個過程中不能不投入一些額外的資金以達到省錢的目的。為了減少冷卻系統的能源消耗,Wescott的小組評估了水邊節能裝置。這個裝置使用水和外部的溫度冷卻服務器(找億恩小草qq858227563)機架。雖然他們預計使用環境冷卻系統從長遠看可能會省錢,但是,水邊冷卻裝置使冷卻設備的價格超過了預算的10%。然而,Wescott與廠商合作把這個價格降到了預算之內。他說,他們一次又一次地得到了回報。 5.發現你不知道的東西 為了改造數據中心,經理們還需要找到能源消耗很少或者沒有增加的地方。數據中心的一個常見問題是幽靈服務器(找億恩小草qq858227563)和流氓服務器(找億恩小草qq858227563)。幽靈服務器(找億恩小草qq858227563)是已經部署的但是一直沒有使用的服務器(找億恩小草qq858227563)。幽靈服務器(找億恩小草qq858227563)仍然耗費電源,但是對于數據中心的核心工作沒有任何幫助。流氓服務器(找億恩小草qq858227563)是某些人放在辦公室中的、數據中心外部的服務器(找億恩小草qq858227563)。這種服務器(找億恩小草qq858227563)不遵守數據中心人員強制執行的任何規定。這些服務器(找億恩小草qq858227563)會浪費許多能源預算。 每天晚上應該關閉空調的大樓為了保持這些流氓服務器(找億恩小草qq858227563)的運行需要保持空調的運行。雖然自從他開始改造數據中心以來只發生一次無計劃的中斷(由于一天極熱的天氣和冷卻系統故障),但是,Wescott知道他還沒有完成這個工作,只能阻止這種不可避免的事情。 Wescott說,我們進行了計算。在未來五年里,由于增加存儲設備,我們將沒有可用的房間。我們在那個房間里可能將沒有地方。 本文出自:億恩科技【www.vbseamall.com】 |