一、前言
數(shù)據(jù)中心守護(hù)著企業(yè)重要IT設(shè)備的運(yùn)行,如服務(wù)器、網(wǎng)絡(luò)設(shè)備以及存儲(chǔ)設(shè)備等,在數(shù)據(jù)中心支持全球數(shù)十億人口上網(wǎng)的同時(shí),也產(chǎn)生大量的機(jī)房能耗,因此,勢(shì)必要研究具體的機(jī)房能效改善對(duì)策,才能真正實(shí)現(xiàn)節(jié)能。對(duì)于當(dāng)前的數(shù)據(jù)中心管理者來(lái)說(shuō),必須采用高效率的機(jī)房經(jīng)營(yíng)方針,才能取得“環(huán)保”及“經(jīng)濟(jì)”雙贏的好處。
提升數(shù)據(jù)中心能源效率的第一步,便是審慎評(píng)估能源使用效率(PUE, Power Usage Effectiveness),簡(jiǎn)單來(lái)說(shuō),PUE就是數(shù)據(jù)中心總耗電除以IT設(shè)備總耗電,或是數(shù)據(jù)中心總設(shè)施消耗的能源除以IT設(shè)備消耗的能源。PUE是由Green Grid所召集的政府及產(chǎn)業(yè)專家組成的項(xiàng)目小組所制定的一項(xiàng)指標(biāo),不僅信賴度高,而且可以用來(lái)檢驗(yàn)機(jī)房的能源效率,可以廣為適用于一般數(shù)據(jù)中心,目的是建立一個(gè)“一致且可重復(fù)使用的衡量指標(biāo)”,提供數(shù)據(jù)中心管理者持續(xù)監(jiān)控并改善能耗狀況。根據(jù)Uptime Institute于2014年進(jìn)行的調(diào)查研究顯示,全球業(yè)界平均PUE為1.7,高于2013年的1.67,但低于2012年的1.8,表示機(jī)房節(jié)能仍有改善空間(如圖1)。
圖1:數(shù)據(jù)中心平均PUE調(diào)查, 2011-2014
(數(shù)據(jù)來(lái)源:2014 數(shù)據(jù)中心產(chǎn)業(yè)調(diào)查報(bào)告--Uptime Institute)
受到近年來(lái)大數(shù)據(jù)、物聯(lián)網(wǎng)浪潮的推動(dòng),各地的機(jī)房建設(shè)持續(xù)進(jìn)行,同時(shí),在環(huán)保意識(shí)高漲的氛圍下,“機(jī)房節(jié)能”也成為了一門新的研究領(lǐng)域。從客觀事實(shí)來(lái)看,首先,數(shù)據(jù)中心的電力支出占總持有成本(TCO, Total Cost of Ownership)的一大部分,僅次于人力成本;其次,數(shù)據(jù)中心常背負(fù)著“不環(huán)保”的惡名。然而,實(shí)際上,以美國(guó)為例,數(shù)據(jù)中心僅消耗了總能源的百分之二,且低于全世界平均值,可見(jiàn)仍有許多機(jī)房采用節(jié)能手段達(dá)到節(jié)能減排的目標(biāo)。
截至目前為止,仍有許多數(shù)據(jù)中心尚未采用任何效率指標(biāo),導(dǎo)致數(shù)據(jù)中心的節(jié)能毫無(wú)標(biāo)準(zhǔn)可循。雖然PUE仍存有許多爭(zhēng)議,但是PUE值仍是衡量數(shù)據(jù)中心基礎(chǔ)設(shè)施效率的主要指導(dǎo)方針,而且對(duì)于擬定及執(zhí)行數(shù)據(jù)中心的綠色節(jié)能策略也很有參考價(jià)值。
二、數(shù)據(jù)中心綠色節(jié)能策略
根據(jù)《自然氣候變化(Nature Climate Change)》發(fā)表的一篇論文《低碳數(shù)據(jù)中心的特征》表示,IT設(shè)備如:服務(wù)器、存儲(chǔ)設(shè)備、通訊技術(shù)、基礎(chǔ)設(shè)施(風(fēng)扇、冷卻、水泵、配電等),其本身的效率以及碳排放,是影響數(shù)據(jù)中心產(chǎn)生溫室氣體的主要因素。這篇論文提出建議,如果專注于能耗改善的部分,將可對(duì)數(shù)據(jù)中心的綠色節(jié)能計(jì)劃產(chǎn)生顯著的影響。
以下列舉七大數(shù)據(jù)中心的綠色節(jié)能策略,將有助于改善數(shù)據(jù)中心能耗,并優(yōu)化PUE。
策略一:定期進(jìn)行硬件檢查
全球IT巨擘如Facebook、谷歌及蘋果持續(xù)投入研發(fā)來(lái)提升數(shù)據(jù)中心的效率,他們的做法可能看似很了不起,但是這里所建議的第一個(gè)策略是屬于大部分企業(yè)都能做到的,就是例行性檢查既有的硬件設(shè)備。
數(shù)據(jù)中心普遍存在許多不必要的IT設(shè)備,所謂“休眠的服務(wù)器”指的是仍然插在機(jī)柜里,實(shí)際上卻已不再使用的服務(wù)器,但是會(huì)占據(jù)寶貴的機(jī)柜空間,消耗大量能源,并且使PUE惡化。為了了解此問(wèn)題的普遍性,Uptime Institute于2013年進(jìn)行了一項(xiàng)相關(guān)調(diào)查,發(fā)現(xiàn)大約有半數(shù)的被調(diào)查者并未執(zhí)行計(jì)劃性的檢查及拔除多余的服務(wù)器。此外,在美國(guó)EPA樣本研究(U.S. EPA sample study)中,大部分機(jī)房的現(xiàn)場(chǎng)并無(wú)法準(zhǔn)確地監(jiān)控所有基礎(chǔ)設(shè)施及IT負(fù)載,可見(jiàn)機(jī)房節(jié)能改善之路還很長(zhǎng)。
以總部位于倫敦的英國(guó)巴克萊銀行為例,該銀行于2013年拔除了9,124個(gè)多余的服務(wù)器之后,不僅減少了使用的電力、冷卻和機(jī)柜空間,同時(shí)并擴(kuò)大了計(jì)算能力以及節(jié)省了450萬(wàn)美金的電費(fèi),可見(jiàn)減少服務(wù)器的好處非常明顯。
除了IT設(shè)備的檢查,對(duì)于非IT的基礎(chǔ)設(shè)施,也必須做定期的檢核,例如機(jī)房的不間斷電源系統(tǒng)(UPS),有別于傳統(tǒng)的工頻單機(jī)UPS,當(dāng)前的趨勢(shì)是采用高頻模塊化UPS,為了達(dá)到機(jī)房節(jié)能,選用UPS時(shí)應(yīng)該考慮以下兩大條件:
1. 隨需擴(kuò)容:模塊化UPS可以配合機(jī)房擴(kuò)容的腳步,適時(shí)增加電源模塊的數(shù)量,不需要在機(jī)房建置初期投入大量的資金,并且不占據(jù)多余的機(jī)房空間,使機(jī)房業(yè)務(wù)逐步成長(zhǎng)時(shí),UPS電源仍可“無(wú)縫接軌”(圖2);除了增加電源模塊,UPS也必須滿足多機(jī)并聯(lián)的需求,以因應(yīng)機(jī)房規(guī)模擴(kuò)大的可能性。
圖2:模塊化UPS滿足機(jī)房無(wú)縫擴(kuò)容的需求
2. 輕載高效:一般數(shù)據(jù)中心為了確保可靠度,會(huì)配置電源冗余N+X,甚至配置2N雙母線,導(dǎo)致負(fù)載率大約在30-40%甚至更低,因此UPS所標(biāo)榜的“滿載”高效率實(shí)際上是不太可能實(shí)現(xiàn)的。有鑒于此,市場(chǎng)調(diào)查機(jī)構(gòu)Gartner在2013年的報(bào)告就指出,除了追求UPS滿載效率之外,也要關(guān)注20-100%負(fù)載率區(qū)間的效率曲線(如圖3),設(shè)法達(dá)到“輕載高效”的理想境界。以一臺(tái)容量200kVA的高效率模塊化UPS為例,考慮數(shù)據(jù)中心日間和夜間負(fù)載率的差異,相較于一般傳統(tǒng)UPS,高效率UPS可以省電5%左右(表1)。
圖3:UPS效率曲線
表1:高效率模塊化UPS與傳統(tǒng)UPS效率比
以UPS容量200kVA為例 | 高效率模塊化UPS | 傳統(tǒng)UPS | 單位 |
日間供應(yīng)的電源,負(fù)載率50% | 100 | 100 | kVA |
效率差異 | 0% | 4% | |
總能耗 | 100 | 104 | kVA |
日間能耗,假設(shè)有14小時(shí) | 1400 | 1456 | kVAh |
夜間供應(yīng)的電源,負(fù)載率30% | 60 | 60 | kVA |
效率差異 | 0% | 7% | |
總能耗 | 60 | 64.2 | kVA |
夜間能耗,假設(shè)有10小時(shí) | 600 | 642 | kVAh |
每天的能耗(日間+夜間) | 2000 | 2098 | kVAh |
年度能耗,365天 | 730000 | 765770 | kVAh |
策略二:例行測(cè)量PUE值
如前所述,PUE是量化能源效率的主要業(yè)界標(biāo)準(zhǔn),大部分原因是其具有簡(jiǎn)單性及可行性,但是在觀察的幾個(gè)行業(yè)中卻很少實(shí)施。不定期的紀(jì)錄并無(wú)法確實(shí)了解實(shí)際的能源使用狀況,所以業(yè)內(nèi)人士不斷建議執(zhí)行例行性的PUE檢測(cè),以便監(jiān)測(cè)數(shù)據(jù)中心PUE隨季節(jié)變化及其他因素而波動(dòng)。此外,為了能實(shí)時(shí)精確量測(cè)總電力,并紀(jì)錄實(shí)際的PUE,必須在關(guān)鍵測(cè)量點(diǎn)安裝傳感器,并記錄實(shí)際電力(kW及kVA),并且應(yīng)該要記錄一段時(shí)期之內(nèi)的能源使用狀況,才能做出最佳的分析(圖4)。
圖4:PUE值監(jiān)測(cè)儀表板
策略三:更新硬件,提升服務(wù)器效率
服務(wù)器效率與PUE直接相關(guān),而且是提升PUE的關(guān)鍵要素,但是想要正確估計(jì)服務(wù)器效率,還必須考慮幾個(gè)因素。我們可以從CPU利用率出發(fā),針對(duì)能效不佳的CPU,虛擬化技術(shù)(virtualization)可以大幅提升CPU能效及服務(wù)器的效率,而不需要更新服務(wù)器;此外,也應(yīng)該將每一只機(jī)柜的負(fù)載能力與消耗電力,列入效率的計(jì)算中。采用刀片服務(wù)器(blade servers)是提高機(jī)柜密度的一種手法(每一機(jī)柜最多可容納1,024 CPU核心),也可以降低設(shè)施的冷卻及電力需求。
將實(shí)體服務(wù)器合并與虛擬化,將可提高數(shù)據(jù)中心效率,IT管理人員應(yīng)該在硬件升級(jí)時(shí)將此列入考慮。根據(jù)研究指出,合并服務(wù)器的好處有:
平均每年每一服務(wù)器最多可節(jié)省美金560元
減少熱量的產(chǎn)生及相關(guān)的冷卻成本
釋出多余空間并擴(kuò)大運(yùn)算能力
值得注意的是,虛擬化技術(shù)及刀片服務(wù)器會(huì)產(chǎn)生一個(gè)負(fù)面影響,亦即會(huì)產(chǎn)生額外的熱量及冷卻需求。目前有數(shù)種解決方案,例如“冷熱通道封閉”或是“機(jī)柜式空調(diào)(列間空調(diào))”等氣流管理手段,就是為了處理機(jī)房高密度負(fù)載的問(wèn)題,請(qǐng)看以下策略四。
策略四:提升機(jī)房冷卻效率
冷卻是僅次于IT負(fù)載之外,最大的耗電來(lái)源,因此,安裝能源監(jiān)控及測(cè)量機(jī)制非常重要,可以了解冷卻對(duì)于PUE的整體影響與改善的方法。
谷歌已是數(shù)據(jù)中心節(jié)能領(lǐng)域的佼佼者,具有令人稱羨的PUE 1.12。在最新的Android Emotions報(bào)導(dǎo)中指出,最新的谷歌AI產(chǎn)品正在嘗試找出能進(jìn)一步降低PUE的方法。谷歌更在網(wǎng)志《Efficiency: How others can do it》中,分享了數(shù)據(jù)中心經(jīng)理人及經(jīng)營(yíng)者可用來(lái)降低PUE的五大手法,其中三項(xiàng)與提升機(jī)房冷卻效率有關(guān)的做法是:
1、 優(yōu)化氣流管理
設(shè)計(jì)良好的冷熱通道封閉,可避免熱空氣和冷空氣混合,以提升冷卻系統(tǒng)的效率。為了有效排除機(jī)房熱點(diǎn),建立理想的熱能分布狀態(tài),可以借由適當(dāng)?shù)胤胖脺囟葌鞲衅鳎糜?jì)算機(jī)仿真工具找出熱點(diǎn)并加以排除。根據(jù)EPA的研究,有效的冷熱信道封閉系統(tǒng),可減少25%的風(fēng)扇能耗,以及20%的冰水主機(jī)能耗。
圖5:熱信道封閉技術(shù)實(shí)例
2、 提高機(jī)房環(huán)境溫度
谷歌已打破了數(shù)據(jù)中心必須保持約攝氏21℃的迷思,確認(rèn)了冷通道可以在約攝氏27℃的溫度下運(yùn)轉(zhuǎn),因此在提高溫度的同時(shí),關(guān)閉再熱器和除濕機(jī),便可以有效節(jié)約能源。
3、 采用自然冷卻技術(shù)(Free Cooling)
空調(diào)系統(tǒng)的冰水主機(jī)會(huì)消耗大量的能源,可以視天候條件,選用自然冷卻系統(tǒng),將外面的冷空氣吸進(jìn)來(lái),加以利用后再排放到外面去。其他自然冷卻的來(lái)源包括:引入外界的空氣、水蒸氣或設(shè)置大型的熱儲(chǔ)存器。
策略五:提高機(jī)房溫度
長(zhǎng)久以來(lái),機(jī)房IT人員受限于傳統(tǒng)機(jī)房溫度的迷思,不太愿意提高機(jī)房溫度,然而,美國(guó)空調(diào)冷凍工程師學(xué)會(huì)(ASHRAE)最新發(fā)布的機(jī)房工作溫度建議,范圍修訂為18℃至27℃(64.4°F至80.6°F);除了溫度,ASHRAE也提高了濕度建議范圍。受惠于這樣的修訂,數(shù)據(jù)中心將可以創(chuàng)造更多冷卻成本的節(jié)約,也更能符合自然冷卻的條件。
就機(jī)房溫度而言,如果太過(guò)保守,維持機(jī)房低溫,將會(huì)使?fàn)I運(yùn)成本居高不下,造成PUE值較差或冷卻成本較高;此外,根據(jù)英特爾一項(xiàng)研究數(shù)據(jù)顯示,機(jī)房環(huán)境溫度每提升1℃可以帶來(lái)4%的制冷成本節(jié)約。有鑒于此,一些高溫節(jié)能產(chǎn)品就應(yīng)運(yùn)而生,舉例如下:
§ 高溫節(jié)能服務(wù)器:“高溫”是指服務(wù)器耐高溫能夠在5℃至47℃環(huán)境溫度下,無(wú)需空調(diào)制冷,能穩(wěn)定運(yùn)行,由于服務(wù)器能適應(yīng)更高的機(jī)房溫度,而帶來(lái)制冷能耗的減少,相對(duì)傳統(tǒng)服務(wù)器而言,高溫節(jié)能服務(wù)器具有耐高溫、低能耗、易部署等特點(diǎn),對(duì)于機(jī)房節(jié)能也是一大功臣。
§ 高溫冰水空調(diào):一般機(jī)房?jī)?nèi)大多是屬于顯熱,只有很少數(shù)的潛熱,因此除濕的需求非常少,機(jī)房精密空調(diào)的入水溫度便可以從一般的7℃往上調(diào)升,在此情況下,冰水主機(jī)的制冷量增加,能效比改善,也就爭(zhēng)取更多空調(diào)節(jié)能的機(jī)會(huì)。
策略六:導(dǎo)入數(shù)據(jù)中心管理系統(tǒng)(DCIM)
為了協(xié)助數(shù)據(jù)中心經(jīng)營(yíng)者更有效、全面地管理數(shù)據(jù)中心,數(shù)據(jù)中心基礎(chǔ)設(shè)施管理系統(tǒng)(Date Center Infrastructure Management, DCIM)就應(yīng)運(yùn)而生。DCIM可通過(guò)機(jī)房鳥(niǎo)瞰圖,協(xié)助IT經(jīng)理人實(shí)時(shí)應(yīng)對(duì)、事先規(guī)劃、管理可能的風(fēng)險(xiǎn),并減少停機(jī)時(shí)間。如前所述,個(gè)別服務(wù)器利用率低是數(shù)據(jù)中心普遍存在的問(wèn)題,DCIM可協(xié)助數(shù)據(jù)中心人員找出長(zhǎng)期閑置的服務(wù)器,加以重新配置,以提升效率,并準(zhǔn)確測(cè)量數(shù)據(jù)中心資產(chǎn)及能源的使用狀況。
圖6:數(shù)據(jù)中心管理系統(tǒng)(DCIM)電視墻與機(jī)柜管理接口
策略七:利用純凈的再生能源
百分百純凈的能源是遙不可及的夢(mèng)想,然而還是有許多企業(yè)用的是“混搭”策略來(lái)接近此理想目標(biāo)。舉例來(lái)說(shuō),包括利用再生能源、就地發(fā)電以及遠(yuǎn)距電網(wǎng)等等。IT巨擘如蘋果所安裝的55,000片太陽(yáng)能板、eBay在猶他州Quicksilver工廠利用燃料電池,以及微軟利用風(fēng)力和太陽(yáng)能。中小企業(yè)或許可以與當(dāng)?shù)毓檬聵I(yè)合作,取得干凈的電力或再生能源,也可在新數(shù)據(jù)中心選址時(shí),考慮設(shè)置在純凈能源公用事業(yè)的周邊地區(qū)。
三、結(jié)論
數(shù)據(jù)中心綠色節(jié)能需要發(fā)揮相當(dāng)?shù)膭?chuàng)意,不應(yīng)受到傳統(tǒng)思維的局限。業(yè)界有許多案例均顯示機(jī)房節(jié)能可以帶來(lái)許多實(shí)質(zhì)的好處,而PUE值可以作為一個(gè)能效指標(biāo)的基礎(chǔ),對(duì)于創(chuàng)造永續(xù)的綠色數(shù)據(jù)中心而言是非常重要的。谷歌、Facebook、蘋果及微軟等IT大廠,皆已投資數(shù)百萬(wàn)元進(jìn)行綠色數(shù)據(jù)中心的研發(fā),且通過(guò)驗(yàn)證提出綠色數(shù)據(jù)中心最佳解決方案,能使數(shù)據(jù)中心的PUE接近理想值。業(yè)界一致認(rèn)為必須全面稽核IT基礎(chǔ)設(shè)施以提升數(shù)據(jù)中心的效率,同時(shí),一般企業(yè)可以透過(guò)例行測(cè)量PUE,以及善用管理工具(如DCIM)找出并修正IT低效率的部分,減少碳排放,提高個(gè)別服務(wù)器的使用率,最終達(dá)到PUE及ROI優(yōu)化的目標(biāo)。