下周一,兩年一度的美國超級計算大會即將開幕。
在此次大會開幕前夕,IBM與美國能源部周五達(dá)成一項價值為3.25億美元合作協(xié)議:未來IBM將為美政府機(jī)構(gòu)制造兩款名為“Sierra”和“Summit”的超級計算機(jī)。
據(jù)悉,IBM所制造的“Sierra”和“Summit”超級計算機(jī),將采用新的超級計算方法,同時搭載Nvidia公司處理加速器,并運(yùn)行于Mellanox公司提供的高速網(wǎng)絡(luò)。
美國超級計算大會所關(guān)注的高端系統(tǒng),占地十分龐大——有些系統(tǒng)占地跟籃球場大小一樣,這些設(shè)備通常被美國政府機(jī)構(gòu)用于汽車空氣動力學(xué)研究,檢測飛機(jī)設(shè)計機(jī)構(gòu)弱點(diǎn),以及預(yù)測新藥物性能等等。
據(jù)悉,由IBM制造的這兩臺巨型計算機(jī),一臺將用于民用領(lǐng)域,部署在田納西州的橡樹嶺國家實驗室;另一臺則用于國家核武器模式測試,部署在加州勞倫斯利弗莫爾國家實驗室。Nvidia估測,如果這些設(shè)備的計算工作量由人工操作,需要300萬人同時在筆記本電腦使展開。
好文章,需要你的鼓勵
浙江大學(xué)團(tuán)隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團(tuán)隊提出SIRI方法,通過"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實驗顯示,該方法在數(shù)學(xué)競賽題上將模型準(zhǔn)確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊開發(fā)出Rolling Forcing技術(shù),實現(xiàn)AI視頻實時流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團(tuán)隊發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個AI模型。實驗結(jié)果顯示,幾何訓(xùn)練在四個空間智能測試基準(zhǔn)上都帶來顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績。這項研究揭示了基礎(chǔ)幾何知識對培養(yǎng)AI空間智能的重要價值。