“解好電力行業(yè)的關(guān)鍵問題,有可能會引領(lǐng)下一波AI浪潮。”中國工程院院士、阿里云創(chuàng)始人王堅2月17日在南方電網(wǎng)總部參加第四屆電力調(diào)度AI應(yīng)用大賽時表示。該大賽由南方電網(wǎng)、中國電機(jī)工程學(xué)會電力系統(tǒng)自動化專委會主辦,阿里云承辦、阿里達(dá)摩院協(xié)辦。
圖:中國工程院院士、阿里云創(chuàng)始人 王堅
王堅認(rèn)為,縱觀AI的發(fā)展歷程,從Alpha Go、ImageNet到Alpha Fold、ChatGPT,都是通過對某一個問題的攻克,從而帶動了人工智能的巨大進(jìn)步。相信電力行業(yè)、工業(yè)領(lǐng)域也能找到這樣一個問題,這將對社會發(fā)展、人類生活帶來更大、更切實的影響。
王堅介紹,在1950年代,人類可以想象AI最了不起的事情就是“下棋”。直到深藍(lán)、AlphaGo的出現(xiàn),AI打敗了國際象棋大師,人工智能技術(shù)有了很大進(jìn)步。
幾年后,針對“圖像識別”這一問題,在AI界又出現(xiàn)了基于深度學(xué)習(xí)的ImageNet,使得機(jī)器對人臉的識別率超過了人類。這又將人工智能帶到了新的高度。
近年來出現(xiàn)的Alpha fold,在發(fā)現(xiàn)蛋白質(zhì)結(jié)構(gòu)方面的能力已經(jīng)超過了一流的科學(xué)家,挑戰(zhàn)著他們畢生的專業(yè)經(jīng)驗。ChatGPT則通過聊天這一場景,為自然語言處理帶來了全新的變革。
“人工智能的每次跨越,都是圍繞著對某一個問題的攻堅,”王堅說,問題定義得好,可以反過來帶動人工智能學(xué)科的發(fā)展。
王堅指出,工業(yè)是用新技術(shù)最好的地方。在電力行業(yè)、工業(yè)領(lǐng)域,我們可以找到比“下棋”更有高度的問題,引領(lǐng)下一波AI浪潮。如果能找到、解好這樣一個問題,對推動社會經(jīng)濟(jì)發(fā)展、人類生活變化,會產(chǎn)生更巨大、更積極的影響。
好文章,需要你的鼓勵
浙江大學(xué)團(tuán)隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團(tuán)隊提出SIRI方法,通過"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實驗顯示,該方法在數(shù)學(xué)競賽題上將模型準(zhǔn)確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊開發(fā)出Rolling Forcing技術(shù),實現(xiàn)AI視頻實時流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點機(jī)制和高效訓(xùn)練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團(tuán)隊發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個AI模型。實驗結(jié)果顯示,幾何訓(xùn)練在四個空間智能測試基準(zhǔn)上都帶來顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績。這項研究揭示了基礎(chǔ)幾何知識對培養(yǎng)AI空間智能的重要價值。