面對近年來各種新興應用的高效運算(HPC)需求、人工智慧(AI)技術的快速發展,以及淨零碳排放的ESG(環境、社會和企業治理)要求,關鍵數位基礎架構與連續性解決方案全球供應商Vertiv 維諦也在今(21)日發佈與NVIDIA專家團隊,針對Vertiv液冷機組搭配氣冷資料中心,進行高密度氣液混合冷卻實機效能測試的合作成果。
|
Vertiv 與 NVIDIA 專家團隊在配置Vertiv Liebert PCW 和 Vertiv Liebert XDU 液冷裝置的機房中進行能耗分析。 |
Vertiv表示,目前促使資料中心液冷技術從利基解決方案進階,發展成為主流解決方案,進而推動液冷實機測試的原因,主要來自2大趨勢:
1. 已有越來越多企業將AI和機器學習(ML)應用到各個領域,舉凡從供應鏈最佳化到醫學研究等,預估生成式AI的市場規模將從2022年底約110億美元,成長到2032年的1,520億美元。
2. 晶片製造商紛紛推出新一代大功率的中央處理器(CPU)和圖形處理器(GPU),例如NVIDIA H100資料中心的單一GPU,熱設計功耗便高達700W。
然而,目前資料中心的設計和營運人員一直缺少可用來預測液冷對資料中心效率的影響,以及可協助規劃液冷解決方案的參考實績。Vertiv和NVIDIA的專家團隊則為此,針對液冷對資料中心PUE和用電量的影響進行了首次的重要分析。
其中考量到現今許多企業資料中心仍處於氣冷、液冷混合轉型的需求,此次實驗環境的設計係針對較常見的中型(1~2MW)二級機房進行分析。該機房內含呈兩行排列的50個高密度機櫃(racks),除了原有的氣冷裝置外,液冷系統則由Vertiv Liebert AFC 冷水機,以及兩個配備液體對液體熱交換器的Vertiv Liebert XDU冷卻液體分配器系列支援。
該實測結果證明了當IT負載從100%氣冷轉換到75%液冷的環境時,其伺服器風扇用電量降低了高達80%,使之總體使用效率(Total Usage Effectiveness, TUE)提高15%以上。同時發現在比較液冷和氣冷系統效率、或評估液冷設計的效率時,倘若採用TUE指標將非直接支援IT流程的風扇,與其他輔助設備的用電量、儲存和運算所需的IT用電量分開,會是比PUE更準確、有價值的指標,能讓企業更精確評量資料中心的液冷效率。
在今年五月Vertiv還參與了NVIDIA一項重要的美國能源部COOLERCHIPS計畫,由NVIDIA與7大夥伴共同提出,針對未來晶片液冷及浸沒式冷卻系統的建置方案,並獲得COOLERCHIPS計畫中最高的500萬美元資助金額,Vertiv則是NVIDIA指定唯一的散熱系統合作夥伴,共同實機建置單櫃超高密度液氣混和冷卻系統測試中心。
此由NVIDIA與Vertiv共同提出的貨櫃式混合冷卻系統專案將歷時3年,為業界首次將直接液體和浸沒式兩種液冷技術結合到單一系統,以協助解決未來資料中心的效率和冷卻挑戰。
預計可冷卻在高達40℃環境下的貨櫃式行動資料中心、單機櫃耗電量約200kW,既是目前伺服器機櫃的25倍,且比起傳統氣冷式冷卻的成本更低、運作效率可提升20%,且更安靜、碳足跡更少。
Vertiv台灣區總經理侯建州表示:「與NVIDIA合作進行的實機測試和系統建置計畫,不但與Vertiv 自身解決方案開發願景一致,更凸顯出我們始終致力於研發創新產品,以適應冷卻產業趨勢,和確立顛覆性且革新的技術領導地位。未來我們仍將擴展資料中心冷卻技術的生態體系,與NVIDIA等一流合作夥伴共同開發降低資料中心能耗、達成淨零碳排放的創新方案。」