CNET科技資訊網(wǎng) 3月15日 北京消息(文/周雅):韓國棋手李世石和谷歌AlphaGo大戰(zhàn)圍棋五回合持續(xù)了一周,最終在北京時(shí)間3月15號(hào)拉下帷幕,李世石以1:4落敗?;仡欉@場(chǎng)人機(jī)大戰(zhàn),AlphaGo表現(xiàn)出超強(qiáng)實(shí)力。
比賽采用5局3勝制,規(guī)定用時(shí)每方2小時(shí),1分鐘讀秒三次。比賽采用中國規(guī)則(是因?yàn)锳lphaGo以中國規(guī)則為基礎(chǔ)開發(fā)),黑貼3又3/4子(黑貼7目半)。
最終比賽獲勝方將獲得獎(jiǎng)金100萬美元。如果AlphaGo獲勝,獎(jiǎng)金將捐贈(zèng)給聯(lián)合國兒童基金會(huì)(UNICEF)、STEM教育以及圍棋慈善機(jī)構(gòu)(Go Charity)。雙方5次對(duì)決分別在北京時(shí)間3月9日、10日、12日、13日、15日進(jìn)行。
第一局棋是最大的懸念,誰都不知道AlphaGo的棋技有多少進(jìn)展,然而結(jié)果讓人吃驚,AlphaGo竟然在局勢(shì)不利的情況下贏局,李世石投子認(rèn)輸,用時(shí)三個(gè)半小時(shí)。
李世石執(zhí)黑先行,黑棋布局走出了一個(gè)新型,AlphaGo的應(yīng)對(duì)不佳,有些吃虧。
中盤階段,AlphaGo似乎意識(shí)到了弱勢(shì)局面,之后的下法選擇得非常強(qiáng)硬,雙方早早就展開了接觸戰(zhàn)。過剛易折,李世石抓住機(jī)會(huì),圍住一塊大空。
取得優(yōu)勢(shì)后,李世石的心態(tài)似乎發(fā)生了變化,結(jié)果幾個(gè)失誤的發(fā)生,讓此前的優(yōu)勢(shì)消失殆盡。
雙方在較量3個(gè)半小時(shí)后,李世石最終投子認(rèn)負(fù)。
業(yè)界一片嘩然。
李世石則在賽后表示,“比賽中有兩件事讓我吃驚,一個(gè)是AlphaGo開局下得非常好,第二個(gè)是在比賽過程中不斷有一些令我想不到的下法。”
第二場(chǎng)AlphaGo再贏一局。李世石初期下棋謹(jǐn)慎,選擇相對(duì)經(jīng)典和保守打法,穩(wěn)打穩(wěn)扎。雙方較量的前3個(gè)小時(shí),一直是相互僵持,隨著比賽進(jìn)入第四個(gè)小時(shí),AlphaGo的時(shí)間也已耗盡,開始60秒的讀秒。比賽的節(jié)奏再次提速。然而在幾分鐘之后,李世石就宣布認(rèn)輸。
此次對(duì)決,雙方互換黑白,AlphaGo執(zhí)黑對(duì)戰(zhàn)李世石。李世石明顯調(diào)整了部署,下得比較平穩(wěn),AlphaGo黑棋在開局形成中國流布局。
在比賽中盤,白棋下出一步罕見的尖沖,讓專家費(fèi)解,李世石似乎也被自己這一手驚到,陷入“長(zhǎng)考”。李世石在應(yīng)對(duì)AlphaGo這一步時(shí)花費(fèi)了十多分鐘。
AlphaGo下法很積極,一直在四處求戰(zhàn),李世石一直在避戰(zhàn)。雙方戰(zhàn)斗進(jìn)入膠著狀態(tài)。
在比賽進(jìn)行到三個(gè)半小時(shí)后,李世石的2個(gè)小時(shí)計(jì)時(shí)全部用完,進(jìn)入讀秒階段,每一手需要在1分鐘內(nèi)落子。
最終在比賽進(jìn)行到四個(gè)半小時(shí)后,211手AlphaGo執(zhí)黑中盤勝,李世石宣布認(rèn)輸。
業(yè)界甚至開始出現(xiàn)“人工智能威脅人類”的聲音。
在前兩場(chǎng)比賽中,李世石沒有選擇“打劫”引起外界巨大爭(zhēng)議,甚至懷疑李世石和谷歌簽訂了某些秘密協(xié)議。谷歌官方進(jìn)行了辟謠,而李世石的連續(xù)兩次“打劫”相當(dāng)于作出回應(yīng),甚至一度打出一個(gè)小高潮。但是到當(dāng)天16時(shí)13分,李世石投子認(rèn)輸。
李世石執(zhí)黑先行。布局階段,李世石左下掛角后走高中國流,和上盤AlphaGo使用的低中國流針鋒相對(duì),隨后李世石主動(dòng)在自己勢(shì)力范圍挑起主動(dòng)戰(zhàn)斗。
AlphaGo第12子打入左上角,率先挑起戰(zhàn)斗。
下到白32子,李世石局面落入下風(fēng),頻頻長(zhǎng)考,時(shí)間消耗巨大。
到了白98子,白棋大空收口,柯潔提前宣告李世石失利。
落下第131手,隨后的進(jìn)程中李世石擺出了一個(gè)賴皮劫,隨后還出現(xiàn)了疑似連環(huán)劫,但最終變成了緊氣劫。
第154手,AlphaGo出現(xiàn)首次主動(dòng)打劫的舉動(dòng),讓此前關(guān)于不許劫爭(zhēng)的猜測(cè)不攻自破。開劫之后,AlphaGo連續(xù)尋找劫材,表現(xiàn)得中規(guī)中矩。李世石無力回天,最終中盤認(rèn)輸。
李世石的三連敗,預(yù)示著100萬美元獎(jiǎng)金成一場(chǎng)空。
之前AlphaGo已經(jīng)取得3場(chǎng)比賽的勝利,因此卸下勝負(fù)包袱的李世石顯得比之前輕松。李世石在第78手下出“神之一手”戰(zhàn)勝AlphaGo,首次獲勝。
AlphaGo執(zhí)黑先手,開局階段雙方就形成星小目對(duì)星小目的局面。
和前幾局對(duì)決相比,李世石今天更多次陷入“長(zhǎng)考”,耗時(shí)太多,在比賽進(jìn)行到2個(gè)半小時(shí)后,僅剩下17分鐘,比AlphGo剩余時(shí)間足足少了1個(gè)小時(shí)。
隨后,李世石白78挖,下出一招妙手,成為本場(chǎng)比賽的轉(zhuǎn)折點(diǎn)。AlphaGo黑93立,下出一步常理上的廢棋,令所有人大惑不解。
圖中1為白78,9為白86。(李世石執(zhí)白)
雖然AlphaGo出現(xiàn)了一次“bug”,但李世石在打吃右側(cè)黑子時(shí)還是非常謹(jǐn)慎。在比賽進(jìn)行到3小時(shí)20分鐘時(shí)。李世石計(jì)時(shí)全部用完,進(jìn)入讀秒落子階段。
此后AlphaGo由于判斷局面對(duì)自己不利,每步耗時(shí)明顯增長(zhǎng),都超出了3分鐘。到3小時(shí)40分鐘時(shí),比賽大局已定,AlphaGo投子認(rèn)輸只剩時(shí)間問題,李世石只需要冷靜收官即可獲得勝利。
收官階段,左下角AlphaGo黑159扳再次出現(xiàn)漏洞,黑子沒有繼續(xù)在此處落子,而是到左邊立,導(dǎo)致上一步棋成為“無用功”。
最終,李世石在收官階段發(fā)揮穩(wěn)定,沒有讓AlphaGo占到便宜。李世石獲得對(duì)AlphaGo的第一場(chǎng)勝利,雙方總比分變?yōu)?:1。
對(duì)于AlphaGo在本次比賽中的79步犯了錯(cuò)誤,AlphaGo之父、人工智能公司DeepMind創(chuàng)始人哈薩比斯隨后發(fā)布Twitter指出:“李世石下出白78后,AlphaGo自我感覺良好,在程序的“值網(wǎng)絡(luò)”(用于評(píng)估電腦勝率)中,誤以為勝率達(dá)到70%,直到第87步才反應(yīng)過來。”
“AlphaGo之父”哈薩比斯twitter
在贏了第四盤棋后,李世石信心大增,他甚至提出自己在最后一盤比賽中要執(zhí)黑與AlphaGo過招,“我這次執(zhí)白贏的,我想執(zhí)黑也贏AlphaGo一次。因?yàn)锳lphaGo執(zhí)白時(shí)表現(xiàn)更出色。我希望最后一場(chǎng)執(zhí)黑對(duì)陣AlphaGo。”
在3月14日,世界職業(yè)圍棋排名網(wǎng)站GoRatings.org上,中國柯潔位列第一,韓國樸永訓(xùn)、日本井山裕太分列第二、第三,AlphaGo位列第四,李世石排名第五。
最終回合,與之前的4場(chǎng)比賽不同,這次對(duì)決沒有出現(xiàn)一方中盤取勝的情況,雙方一直殺到收官階段。比賽在進(jìn)行到5小時(shí)后,李世石180手投子認(rèn)輸,AlphaGo以4比1贏得比賽。
李世石執(zhí)黑先行,谷歌AlphaGo執(zhí)白。雙方在棋盤中腹展開廝殺。
當(dāng)比賽進(jìn)行到3小時(shí)40分時(shí),李世石的耗時(shí)全部用完,比賽進(jìn)入讀秒階段。不過,雙方用時(shí)的差距并不大,AlphaGo此時(shí)也僅剩余20分鐘。
比賽5小時(shí)后,李世石180手投子認(rèn)輸。
谷歌想做的并不只是一個(gè)棋類程序,而是一個(gè)通用的智能計(jì)算系統(tǒng)。由于圍棋的可能性較多,且無套路可言,就可以強(qiáng)度鍛煉機(jī)器的深度學(xué)習(xí)能力,而非死記硬背。所謂深度學(xué)習(xí),簡(jiǎn)單來說就是指機(jī)器通過深度神經(jīng)網(wǎng)絡(luò),模擬人腦的機(jī)制來學(xué)習(xí)、判斷、決策。如果解決了圍棋問題,谷歌希望能把這套人工智能算法用于災(zāi)害預(yù)測(cè)、風(fēng)險(xiǎn)控制、醫(yī)療健康和機(jī)器人等復(fù)雜領(lǐng)域。
在跟李世石下棋之前,AlphaGo已經(jīng)集中學(xué)習(xí)了半年,比如谷歌給其輸入了3000萬步人類圍棋大師的走法,讓其自我對(duì)弈3000萬局,積累勝負(fù)經(jīng)驗(yàn),同時(shí)它還要在自我對(duì)弈的訓(xùn)練中形成全局觀,并對(duì)局面做出評(píng)估。
進(jìn)過上述深度學(xué)習(xí)后,AlphaGo展示出強(qiáng)大的騾子選擇能力,更可怕的是,隨著訓(xùn)練的增加,AlphaGo還在進(jìn)步。
不管最終的結(jié)果如何,AlphaGo的學(xué)習(xí)能力,都給未來創(chuàng)造了更多可能性,無關(guān)勝負(fù),這都是一次了不起的挑戰(zhàn),或許,這場(chǎng)“人機(jī)圍棋大戰(zhàn)”的最大贏家是人類。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。