北京時間1月5日消息,谷歌DeepMind開發(fā)的AI在圍棋棋盤上戰(zhàn)勝韓國世界冠軍之后再度重返,這一次AlphaGo在網(wǎng)上戰(zhàn)勝了頂尖棋手,而且是悄悄進(jìn)行的。
DeepMind創(chuàng)始人哈撒比斯(左一)與李世石握手
今天早些時候,谷歌DeepMind創(chuàng)始人丹米斯·哈撒比斯(Demis Hassabis)在Twitter發(fā)布消息,證實升級版AlphaGo在網(wǎng)上與真人對決。
哈撒比斯寫道:“在過去幾天里,我們在網(wǎng)上進(jìn)行了一些非正式圍棋比賽,對局以快棋的形式進(jìn)行……我們的目的只是為了查看系統(tǒng)是否如預(yù)期一樣好。”他還說:“感謝那些在弈城圍棋網(wǎng)和野狐圍棋網(wǎng)與我們對弈的棋手,我們的賬號是Magister(P) 和Master(P),我們還要感謝那些觀戰(zhàn)的人。”
之前許多人都在猜測這位圍棋高手是誰,大家都不確定,有人懷疑它是電腦。中國棋手古力懸賞10萬元,尋找可以打敗“Master”的棋手。
DeepMind發(fā)布的消息顯示,非正式測試可能已經(jīng)結(jié)束,今年晚些時候,AlphaGo將會參加一些正式比賽。
附哈撒比斯發(fā)布的最新聲明:
一直以來,我們都在努力改進(jìn)AlphaGo,在過去幾天里,我們進(jìn)行了一些非正式網(wǎng)上比賽,對局以快棋的形式進(jìn)行,參加比賽的是最新開發(fā)的原型版系統(tǒng),進(jìn)行網(wǎng)上對決只是為了檢查系統(tǒng),看它是不是和預(yù)料的一樣好。感謝那些在弈城圍棋網(wǎng)和野狐圍棋網(wǎng)與我們對弈的棋手,我們的賬號是Magister(P) 和Master(P),我們還要感謝那些觀戰(zhàn)的人。
新版AlphaGo在比賽中下出了一些富有創(chuàng)意、非常漂亮的棋步,我們和圍棋社區(qū)從中學(xué)到了許多東西,對此我們感到很興奮,結(jié)果讓人滿意。
與AlphaGo對弈之后,棋手古力發(fā)帖稱:“人類與AI攜手合作,很快將會揭開圍棋的深層秘密。”現(xiàn)在我們的非正式測試已經(jīng)結(jié)束,今年我們準(zhǔn)備與圍棋組織、專家合作,舉辦正式、完整的比賽,進(jìn)一步探索圍棋的秘密,讓人類與AI互相啟迪,共同進(jìn)步。很快我們就會公布更多消息。
好文章,需要你的鼓勵
浙江大學(xué)團(tuán)隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團(tuán)隊提出SIRI方法,通過"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實驗顯示,該方法在數(shù)學(xué)競賽題上將模型準(zhǔn)確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊開發(fā)出Rolling Forcing技術(shù),實現(xiàn)AI視頻實時流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點機(jī)制和高效訓(xùn)練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團(tuán)隊發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個AI模型。實驗結(jié)果顯示,幾何訓(xùn)練在四個空間智能測試基準(zhǔn)上都帶來顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績。這項研究揭示了基礎(chǔ)幾何知識對培養(yǎng)AI空間智能的重要價值。