1996年2月16日,IBM公司的計(jì)算機(jī)程序員在紐約阿蒙克IBM總部拍下“深藍(lán)”與卡斯帕羅夫之間著名的國(guó)際象棋世紀(jì)之戰(zhàn)
隨著AI逐步進(jìn)軍策略游戲領(lǐng)域,人類玩家還有必要繼續(xù)“負(fù)隅頑抗”嗎?考慮到AI能夠不斷從錯(cuò)誤中吸取教訓(xùn)、借助一場(chǎng)場(chǎng)比賽提升自身水平,答案恐怕是否定的。更恐怖的是,計(jì)算機(jī)的對(duì)戰(zhàn)速度遠(yuǎn)遠(yuǎn)超過人類——玩得快、學(xué)得更快,這還比什么?
很多人要玩一輩子才能成為撲克高手,但AI沒準(zhǔn)一晚上就能傲視群雄。這樣的基本現(xiàn)實(shí),也給策略游戲世界帶來種種變數(shù)。
作為一個(gè)不斷發(fā)展的新興領(lǐng)域,不少朋友對(duì)于AI并沒有很直觀的感受。非技術(shù)人員接觸AI的一種常見方式就是在線撲克游戲,人類玩家會(huì)在其中與AI相對(duì)抗。這就引出了新問題:到什么時(shí)候,我們才分不清是在跟人玩、還是跟AI玩?
近年來,AI取得了長(zhǎng)足進(jìn)步,并在多款策略游戲中表現(xiàn)亮眼:國(guó)際象棋、拼字游戲、圍棋以及撲克等等。其戰(zhàn)線之輝煌,甚至讓人類幾乎提不起與之對(duì)抗的念頭。
例如,微軟最新發(fā)布的“Libratus”就在比賽中一舉擊敗四位頂尖德州撲克高手,自己連汗都沒出。
Libratus是由卡耐基梅隆大學(xué)開發(fā)的AI程序,在為期20天的匹茲堡Rivers Casino德州撲克比賽中力壓四位人類高手。而這一結(jié)果,也開啟了AI策略游戲探索之路的新方向。
在本文中,我們將探討如何將AI應(yīng)用于撲克游戲、AI又會(huì)表現(xiàn)出怎樣的發(fā)展前景。
一項(xiàng)最新研究發(fā)現(xiàn),最出色的電腦撲克選手跟人類一樣很擅長(zhǎng)虛張聲勢(shì),Liberatus則用實(shí)際行動(dòng)證明不是一樣、而是更擅長(zhǎng)。那么是不是在可預(yù)見的未來,計(jì)算機(jī)會(huì)在一切策略游戲中都?jí)旱谷祟悾?/p>
根據(jù)職業(yè)撲克選手Jeff Gross的說法,這種可能性確實(shí)存在。Gross曾在18年前以50美元作底,一路過關(guān)斬將拿下超過500萬(wàn)美元的職業(yè)錦標(biāo)賽收入。Gross對(duì)各種賭注極高的游戲都很精通,最近又開始轉(zhuǎn)向內(nèi)容創(chuàng)作。他在自己的Twitch頻道上向80000多名粉絲講解撲克技巧,播客節(jié)目也已經(jīng)制作了150多集。
作為最頂尖的撲克高手,Gross對(duì)這波來勢(shì)洶洶的AI入侵也有點(diǎn)迷茫。他解釋道:“我們可以從兩個(gè)角度理解這個(gè)問題。如果AI能力可以持續(xù)增長(zhǎng),那么撲克游戲中最精妙的部分、也就是誤導(dǎo)對(duì)手的能力,很可能被計(jì)算機(jī)所超越。但另一方面,由于騙倒機(jī)器特別困難,所以跟AI對(duì)抗反而非常有趣,甚至未來?yè)淇擞螒虻膶?duì)手就可以全都換成AI技術(shù)了。以后的巨額資金很可能被交給那些能擊敗AI的選手,我個(gè)人對(duì)人類的學(xué)習(xí)力和潛能充滿信心。”
回顧AI技術(shù)在策略游戲中的發(fā)展歷程,我們很容易理解Gross的復(fù)雜情緒。上世紀(jì)八十年代初,國(guó)際象棋世界冠軍、也是有史以來最成功的棋手之一加里·卡斯帕羅夫曾經(jīng)做出一個(gè)大膽的預(yù)測(cè),即沒有任何國(guó)際象棋程序能夠打敗他。加里在1989年兩度擊敗了IBM的國(guó)際象棋AI“深思”(Deep Thought)。幾年之后,卡斯帕羅夫又在多局賽中擊敗了深思的繼任者深藍(lán)。但很遺憾,他在與深藍(lán)的復(fù)賽中創(chuàng)下另一項(xiàng)紀(jì)錄——成為第一個(gè)被國(guó)際象棋AI擊敗的世界冠軍。
圖:Jeff Gross
從那時(shí)開始,AI逐漸在策略游戲中占據(jù)了主導(dǎo)地位。快進(jìn)到2019年,當(dāng)時(shí)的世界衛(wèi)冕冠軍Magnus Carlsen在與最強(qiáng)國(guó)際象棋程序的100場(chǎng)對(duì)弈中一場(chǎng)未勝??梢哉f從1946年的圖靈到現(xiàn)在,人類終于創(chuàng)造出了接近完美、甚至可以說已臻完美的國(guó)際象棋AI。
而撲克游戲的攻克,代表這段旅程又前進(jìn)了一步。自1984年以來,AI開發(fā)者一直高度關(guān)注德州撲克游戲。那一年,Mike Caro開發(fā)出一款名為Orac的基礎(chǔ)撲克AI軟件,并帶著它參加了世界撲克大賽。
根據(jù)最近公布的信息圖來看,從Caro的Orac到卡耐基梅隆大學(xué)的Liberatus,撲克AI實(shí)現(xiàn)了長(zhǎng)足發(fā)展。Gross則對(duì)撲克AI的強(qiáng)勁發(fā)展勢(shì)頭毫不意外。
“AI能這么強(qiáng)并不奇怪。這些程序已經(jīng)通過分析數(shù)百萬(wàn)甚至數(shù)萬(wàn)億手牌識(shí)別出幾百萬(wàn)種不同的策略。在與人類對(duì)手打牌時(shí),AI可以輕松識(shí)別出對(duì)方的策略并建立起能夠勝出的機(jī)制。雙方都可以虛張聲勢(shì)、也都可以用梭哈震懾對(duì)手,但人類的誘導(dǎo)能力仍然有限,因?yàn)殄X對(duì)我們來說有意義。但AI會(huì)對(duì)每個(gè)人都采取威壓策略,并通過混合策略讓對(duì)手更難摸清它的真實(shí)意圖。”
而且事實(shí)上,AI并不懂得如何虛張聲勢(shì)、至少跟人類選手的虛張聲勢(shì)并不相同。AI只是在訓(xùn)練中逐漸意識(shí)到,即使自己手頭的牌不怎么強(qiáng)、仍然可以通過持續(xù)跟注賺取回報(bào)。它會(huì)不斷遇到類似的情況、持續(xù)加深自己的這種認(rèn)識(shí),這樣的可能性也讓AI在撲克游戲中占據(jù)了對(duì)人類的比較優(yōu)勢(shì)。于是,AI相對(duì)不易受到虛張聲勢(shì)的影響、而且并不害怕過度跟注。
Gross認(rèn)為,未來的撲克游戲會(huì)迎來幾條演變分支:跟AI國(guó)際象棋程序類似,未來的撲克游戲也會(huì)發(fā)展出AI對(duì)AI的比賽,人類選手則繼續(xù)跟自己的同類對(duì)抗;或者,也可能出現(xiàn)某些混合賽事,由最高水平的人類在撲克等策略游戲中嘗試挑戰(zhàn)AI。
如今,Gross預(yù)測(cè)的第一部分已經(jīng)在國(guó)際象棋領(lǐng)域成為現(xiàn)實(shí)。國(guó)際象棋已經(jīng)發(fā)展出一套強(qiáng)大的AI儲(chǔ)備池,其平均棋力等級(jí)已經(jīng)遠(yuǎn)遠(yuǎn)超過人類選手。目前AI世界冠軍Stockfish 9的棋力ELO評(píng)分為3438,遠(yuǎn)遠(yuǎn)高于人類世界冠軍Magnus Carlsen的2845。
Gross也很能理解AI開發(fā)者為什么會(huì)對(duì)撲克及其他策略類游戲充滿興趣。用他的話說:“據(jù)我了解,AI的終極目標(biāo)就是幫助人們解決日常生活中經(jīng)常出現(xiàn)的問題。類似撲克游戲,我們能看到的只有一些不夠全面的信息。AI需要解決的問題,都在撲克游戲中有所映射。所以從樂觀的角度出發(fā),撲克游戲正在訓(xùn)練AI、讓它的智能水平持續(xù)提升。這也側(cè)面證明了撲克游戲自身的精妙與復(fù)雜。”
Gross的觀察完全正確,AI開發(fā)者確實(shí)希望達(dá)成這樣的目標(biāo)。策略游戲并不是目的,只是一種手段。世界冠軍們也不必介意輸給AI程序,畢竟只要這樣能推進(jìn)AI技術(shù)的發(fā)展,那么他們自己也能在手機(jī)上享受到AI帶來的便利功能——例如幫他們快速試探出對(duì)方能接受的底價(jià)。
可以說,AI技術(shù)的志向要宏大得多。我們正邁進(jìn)一個(gè)嶄新的AI世界,為了讓這個(gè)世界真正如想象般美好,每個(gè)人都需要忍耐路途上的一點(diǎn)顛簸。你說呢?
好文章,需要你的鼓勵(lì)
這項(xiàng)研究提出了"高效探測(cè)"方法,解決了掩碼圖像建模AI難以有效評(píng)估的問題。通過創(chuàng)新的多查詢交叉注意力機(jī)制,該方法在減少90%參數(shù)的同時(shí)實(shí)現(xiàn)10倍速度提升,在七個(gè)基準(zhǔn)測(cè)試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質(zhì)量與分類性能的強(qiáng)相關(guān)性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應(yīng)性。團(tuán)隊(duì)承諾開源全部代碼,推動(dòng)技術(shù)普及應(yīng)用。
伊利諾伊大學(xué)研究團(tuán)隊(duì)開發(fā)了CLAIMSPECT系統(tǒng),通過層次化分解復(fù)雜爭(zhēng)議、智能檢索相關(guān)文獻(xiàn)、多角度收集觀點(diǎn)的方法,將傳統(tǒng)的"真假"判斷轉(zhuǎn)變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動(dòng)構(gòu)建爭(zhēng)議話題的分析框架,識(shí)別不同觀點(diǎn)及其支撐證據(jù),為科學(xué)和政治爭(zhēng)議提供更全面客觀的分析,已在生物醫(yī)學(xué)和國(guó)際關(guān)系領(lǐng)域驗(yàn)證有效性。
清華大學(xué)研究團(tuán)隊(duì)首次提出情感認(rèn)知融合網(wǎng)絡(luò)(ECFN),讓AI能像人類一樣理解和表達(dá)情感。該系統(tǒng)通過多層次情感處理架構(gòu),在情感識(shí)別準(zhǔn)確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達(dá)自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實(shí)現(xiàn)了跨模態(tài)情感融合、動(dòng)態(tài)情感追蹤和個(gè)性化情感建模,為醫(yī)療、教育、客服等領(lǐng)域帶來革命性應(yīng)用前景。
哈佛大學(xué)研究團(tuán)隊(duì)通過創(chuàng)新的多智能體強(qiáng)化學(xué)習(xí)方法,讓AI在戰(zhàn)略游戲中學(xué)會(huì)復(fù)雜推理。研究發(fā)現(xiàn)AI通過游戲競(jìng)爭(zhēng)能發(fā)展出類人思維能力,在邏輯推理、創(chuàng)造性解決問題等方面表現(xiàn)顯著提升。這項(xiàng)突破性成果為未來AI在醫(yī)療、教育、城市管理等領(lǐng)域的應(yīng)用奠定基礎(chǔ),展現(xiàn)了通過模擬人類學(xué)習(xí)過程培養(yǎng)真正智能AI的新路徑。