2024年,被不少業(yè)內(nèi)人士稱為“液冷元年”。伴隨AI訓練集群的指數(shù)級擴張,服務器功耗迅速逼近千瓦級,機柜功率密度從7kW一路飆升至50kW、甚至150kW。傳統(tǒng)風冷技術已觸及散熱能力的物理極限,而液冷則被推到產(chǎn)業(yè)舞臺中央,成為智算中心升級的關鍵詞。
但液冷遠不是“換一種散熱方式”這么簡單。它橫跨材料兼容性、系統(tǒng)集成、運維與回收的全鏈路,任何環(huán)節(jié)的缺口都可能演變?yōu)橄到y(tǒng)性風險。產(chǎn)業(yè)正在迎來一次“不得不變”的臨界時刻。
9月10日,在北京開放數(shù)據(jù)中心大會上,嘉實多熱管理事業(yè)部大中華區(qū)業(yè)務總監(jiān)仇圓圓在接受采訪時直言:“液冷是一個必選項,而不是可選項。”這個有著125年歷史的潤滑油品牌,首次面向中國市場發(fā)布端到端液冷解決方案。
嘉實多熱管理事業(yè)部大中華區(qū)業(yè)務總監(jiān)仇圓圓
在他看來,液冷技術從可選項變成必選項,背后有兩個關鍵驅(qū)動力。一方面,芯片熱密度正急劇攀升,傳統(tǒng)風冷已無力承載;另一方面,政策紅線收緊,新建數(shù)據(jù)中心PUE普遍要求低于1.25甚至1.2,而風冷方案往往停留在1.5左右,幾乎無解。“從現(xiàn)實角度看,若不部署液冷系統(tǒng),數(shù)據(jù)中心將很難達到這些指標。”仇圓圓說。
從潤滑油到冷卻液的“向前”策略
2024年,嘉實多在125周年之際發(fā)布全新戰(zhàn)略“Onward,Upward,F(xiàn)orward”,將液冷與儲能列為重點突破方向。其中,“Forward”(向前)策略明確提出:要把數(shù)據(jù)中心浸沒式冷卻和電池熱管理列為重點舉措,從“邊緣探索”推向“核心路徑”。
嘉實多進入液冷賽道,并非心血來潮。“我們本身在材料兼容性、液冷科技上面其實有非常多的技術儲備。”仇圓圓表示,這些技術稟賦讓公司對市場前景保持篤定。
具體而言,嘉實多在液冷技術上具備三大優(yōu)勢:
第一,冷卻液視角。“我們的出發(fā)點并非硬件,而是冷卻液。”冷卻液是唯一能貫穿整個數(shù)據(jù)中心基礎設施的介質(zhì),從室外機、冷卻塔,經(jīng)由管道流向CDU,再進入服務器內(nèi)部。在這個循環(huán)中,它要面對材料兼容性、腐蝕、壽命等多重挑戰(zhàn),而這正是嘉實多百年來的專業(yè)積累所在。
第二,系統(tǒng)化團隊。“我們的團隊幾乎全部來自數(shù)據(jù)中心或熱管理行業(yè),包括我自己。”仇圓圓說。他舉例:在華南,一個5兆瓦的數(shù)據(jù)中心往往需要兩到三臺冷水機組;而在東北,依靠閉式循環(huán)與外界冷風即可實現(xiàn)冷卻。因此,對于不同區(qū)域的差異化場景,他們不僅關注冷卻液本身,更注重整個系統(tǒng)層面的整合。
第三,產(chǎn)業(yè)鏈協(xié)同。液冷真正大規(guī)模發(fā)展不過一兩年,整個產(chǎn)業(yè)仍在探索。嘉實多投入大量資源,聯(lián)合上游芯片和服務器廠商開展兼容性測試,覆蓋冷板、浸沒、噴淋等多種技術路徑。這種跨界協(xié)同,為液冷的規(guī)?;涞卮蛳铝嘶A。
打造“端到端”:從產(chǎn)品到生態(tài)
單純的產(chǎn)品供應顯然不夠,嘉實多通過“端到端”液冷解決方案,貫穿部署、運維到退役的全生命周期,覆蓋四個關鍵階段:
嘉實多熱管理事業(yè)部全球總裁黃建棠表示,“我們通過端到端解決方案,把液冷從單一組件轉(zhuǎn)化為客戶運營的核心動力。”
嘉實多熱管理事業(yè)部全球總裁黃建棠
在產(chǎn)品層面,嘉實多已形成覆蓋不同應用的冷卻液矩陣:冷板式冷卻液PG 25 C與EG 25,以及浸沒式冷卻液DC 15/20。“我們把選擇權交到客戶手里,”仇圓圓說,“客戶可以根據(jù)自己的路線圖來選擇合適的產(chǎn)品。”
無論是端到端服務還是產(chǎn)品研發(fā),都需要強大的生態(tài)支撐。過去一年,嘉實多在中國不斷拓展合作版圖,與浪潮信息就服務器與液冷液的兼容性等方面簽署了戰(zhàn)略合作協(xié)議;與施耐德電氣聯(lián)合打造了液冷實驗室和客戶體驗中心,既用于向客戶展示液冷系統(tǒng)的實際應用,也為雙方研究液體冷卻系統(tǒng)的長期穩(wěn)定性提供了實驗基礎。此外,嘉實多還參與了英特爾在中國的“液冷加速計劃”,與英特爾、北京奕信通一起搭建測試環(huán)路。
在不確定中前行
趨勢已定,但現(xiàn)實并不輕松。液冷產(chǎn)業(yè)仍處在“爆發(fā)前期”,與風冷相比,液冷領域的專業(yè)廠商有限,行業(yè)整體處在學習與摸索階段。成本也是繞不過去的課題:冷板液冷初始投入仍高于風冷,不過依靠更優(yōu)的PUE效率,長期運營可逐漸回本;浸沒式技術則更前沿,但因投入和運維復雜,眼下多停留在標桿項目。
對于改造型項目,不確定性要更為突出。既有機房的制冷設備能否復用,高架地板是否需要改造,這些變量都可能成為額外負擔。“很難直接給出標準化報價。”仇圓圓坦言,“根本原因在于每個機房的基礎條件不一,需結(jié)合實際情況進行設計。在可控的初期投入與長期效益之間找到平衡,是關鍵。”
從潤滑油到液冷,嘉實多的戰(zhàn)略轉(zhuǎn)身并非業(yè)務延伸,而是對算力基礎設施未來的深度押注。雖然技術路線尚未完全明晰,行業(yè)標準仍在制定,但趨勢已經(jīng)足夠清晰。嘉實多的百年積累與端到端方案,疊加全產(chǎn)業(yè)鏈協(xié)同,或許正是它在液冷革命中占據(jù)先機的關鍵。
當然,從戰(zhàn)略制定到市場驗證,中間還有很長的路要走。但至少在當下,嘉實多已經(jīng)給出了自己的答案。
好文章,需要你的鼓勵
浙江大學團隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學、編程等任務上顯著提升推理準確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學研究團隊提出SIRI方法,通過"壓縮-擴張"交替訓練策略,成功解決了大型推理模型"話多且準確率低"的問題。實驗顯示,該方法在數(shù)學競賽題上將模型準確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓練提供了新思路。
南洋理工大學與騰訊聯(lián)合研究團隊開發(fā)出Rolling Forcing技術,實現(xiàn)AI視頻實時流式生成的重大突破。該技術通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學研究團隊發(fā)現(xiàn),通過讓AI模型學習解決幾何問題,能夠顯著提升其空間理解能力。他們構建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強化學習方法訓練多個AI模型。實驗結(jié)果顯示,幾何訓練在四個空間智能測試基準上都帶來顯著提升,其中最佳模型達到49.6%準確率,超越此前最好成績。這項研究揭示了基礎幾何知識對培養(yǎng)AI空間智能的重要價值。