科學(xué)家已經(jīng)習(xí)慣于使用超級(jí)計(jì)算機(jī)處理宇宙學(xué)領(lǐng)域的海量數(shù)據(jù),最近卡耐基梅隆大學(xué)的研究團(tuán)隊(duì)找到一種新方法,可以使用常規(guī)的機(jī)器學(xué)習(xí)技術(shù)(與AI繪畫或作曲擁有同樣的底層設(shè)計(jì)),在圖形處理單元(GPU)上實(shí)現(xiàn)高級(jí)模擬能力。
這個(gè)名為“無(wú)人在此”(This Person Does Not Exist)的研究項(xiàng)目,嘗試使用大家熟知的硬件與神經(jīng)網(wǎng)絡(luò)技術(shù)以高分辨率形式模擬我們的現(xiàn)實(shí)宇宙。這項(xiàng)極具前瞻性的研究,也許會(huì)徹底改變我們認(rèn)識(shí)宇宙與理解物理定律的方式。
根據(jù)研究小組的說法,使用傳統(tǒng)方法在單一處理核心上運(yùn)行宇宙學(xué)模擬大約需要23天。因此,研究人員傾向于使用超級(jí)計(jì)算機(jī)完成此類仿真任務(wù)。之所以如此困難,是因?yàn)槲锢韺W(xué)中仍充斥著種種懸而未決的根本問題。我們找不到一套能夠解釋整個(gè)宇宙的統(tǒng)一規(guī)則,科學(xué)家們也不清楚如何將經(jīng)典物理學(xué)定律同量子領(lǐng)域中觀察到的現(xiàn)象聯(lián)系起來(lái)。
為此,我們必須努力探索。在涉及到預(yù)測(cè)宇宙中暗物質(zhì)數(shù)量等難題時(shí),科學(xué)家必須嘗試不同的預(yù)設(shè)數(shù)值。只有這樣反復(fù)試錯(cuò),才能最終得出更接近真實(shí)情況的結(jié)果。科學(xué)家們開始著手模擬,并將發(fā)現(xiàn)與太空望遠(yuǎn)鏡及其他觀測(cè)結(jié)果數(shù)據(jù)源進(jìn)行核對(duì),之后再模擬、再核對(duì),如此反復(fù)。
問題所在
超級(jí)計(jì)算機(jī)的運(yùn)行成功率極高,租用一個(gè)小時(shí)往往就要花掉數(shù)千美元。與單一GPU的低功耗水平相比,超級(jí)計(jì)算機(jī)簡(jiǎn)直就像是個(gè)熊熊燃燒的大火爐。
所以對(duì)于這類需要反復(fù)試驗(yàn)的問題,超級(jí)計(jì)算機(jī)顯然不是最好的解決方案。
路在何方
研究人員將問題歸結(jié)為:目前,我們可以先對(duì)宇宙中的小塊圖像進(jìn)行高分辨率模擬,并在大型模擬區(qū)域內(nèi)轉(zhuǎn)為低分辨率圖像模擬。至于大型區(qū)域的高分辨率圖像處理必須慎而又慎,因?yàn)檫@會(huì)耗費(fèi)掉大量時(shí)間、精力與能源。
但這樣的現(xiàn)狀,相當(dāng)于在模擬整個(gè)宇宙時(shí)設(shè)下一道不可逾越的鴻溝。貫通天塹的橋梁,就是AI。
卡耐基梅隆大學(xué)團(tuán)隊(duì)選擇的方案并非教導(dǎo)AI以程序化方式模擬整個(gè)宇宙(這仍然可能設(shè)定無(wú)窮多個(gè)變量),而是直接以高分辨率形式進(jìn)行圖像模擬。
這大大提升了模擬效率。具體提升了多少?卡耐基梅隆大學(xué)的Jocelyn Duffy表示:經(jīng)過訓(xùn)練的代碼能夠獲取完整的低分辨率模型并執(zhí)行超高分辨率模擬,將其中包含的粒子數(shù)量擴(kuò)展達(dá)512倍。對(duì)于宇宙當(dāng)中直徑約5億光年、包含1.34億個(gè)粒子的區(qū)域,原有方法需要560個(gè)小時(shí)才能在單一處理核心上完成高分辨率模擬;而使用新方法后,研究人員僅僅需要36分鐘。在向模擬流程中添加更多粒子后,效果變得更為顯著。對(duì)于包含1340億個(gè)粒子的“千億”(相較于上一用例)宇宙,研究人員的新方法在單一圖形處理單元中只需要16個(gè)小時(shí)即可處理完成。如果使用原有方法,這種大小及分辨率的模擬必須配合專用的超級(jí)計(jì)算機(jī),處理時(shí)長(zhǎng)也將達(dá)到數(shù)月之久。
這不是說AI真能“理解”我們所無(wú)法企及的宇宙空間。相反,它只是在以令人信服的方式將低分辨率模擬圖像擴(kuò)充為高分辨率形式,幫助科學(xué)家以更少的時(shí)間、精力與能源投入獲得可靠的模擬結(jié)果。
從本質(zhì)上講,這就像是為AI提供電影的分鏡草稿,再由它輸出實(shí)拍影片的具體樣貌。雖然還不夠完善,但已經(jīng)可以在一定的保真水平下省去真實(shí)拍攝的麻煩。
實(shí)際過程當(dāng)然要比本文的描述復(fù)雜得多。但好在模擬出的宇宙圖像比較容易驗(yàn)證,我們可以直接把結(jié)果跟觀測(cè)數(shù)據(jù)進(jìn)行比較。唯一的謎團(tuán),是我們并不知道AI模型是如何完成填充的。
這項(xiàng)最新成果,讓宇宙學(xué)模擬從超級(jí)計(jì)算機(jī)的專利變成了完全可以運(yùn)行在游戲PC上的“小case”,研究人員也可以借此快速測(cè)試自己的靈感、推動(dòng)模擬能力的大眾化轉(zhuǎn)型。
從樂觀的角度來(lái)說,這項(xiàng)研究有望徹底改變我們對(duì)現(xiàn)實(shí)宇宙的觀察方式。如果運(yùn)氣好,我們也許能更好地對(duì)暗物質(zhì)、引力效應(yīng)甚至是宇宙起源作出原理性解釋。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來(lái)顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。