今年是美國人工智能協(xié)會(AAAI – the Association for the Advance of Artificial Intelligence)組織首次在冬天舉辦旗幟性年會:AAAI 2015大會。大會總共收到超過2000篇投稿,最終收錄了500余篇論文,又從中選取200余篇分為十余個方向在現(xiàn)場報告。會議期間,除了這些主流技術(shù)報告外,主辦方還組織了一系列活動,包括各類AI競賽,機(jī)器人展示,公眾開放日,主題辯論,專題研討會等等。這里我簡單談?wù)勀切┙o我個人印象較深的部分。
人工智能研究的道德問題
與人工智能有關(guān)的職業(yè)和社會道德問題是主題演講中最熱門的話題。最近一段時間這個問題似乎確實受到了整個社會的廣泛關(guān)注。一些為大眾所熟知的科技明星,如Stephen Hawking和Elon Musk,表達(dá)了人工智能技術(shù)的突破會對人類自身構(gòu)成威脅的擔(dān)憂。而加州大學(xué)伯克利分校計算機(jī)系教授Stuart Russell(目前最權(quán)威的人工智能專著的作者)則在他的主題演講中表示:現(xiàn)有人工智能技術(shù)水平距離引發(fā)“機(jī)器人統(tǒng)治人類”之類的風(fēng)險還為時尚早。不過,他也認(rèn)為人工智能技術(shù)的研究和應(yīng)用與核武器、生化技術(shù)、基因技術(shù)等其他影響巨大的技術(shù)一樣,應(yīng)該受到規(guī)范化約束。“ACM通訊”雜志的主編Moshe Vardi教授做了一個關(guān)于人工智能技術(shù)進(jìn)步引發(fā)的失業(yè)問題的主題演講。他提到以往的幾次技術(shù)革命在導(dǎo)致失業(yè)的同時也創(chuàng)造了大量新型工作。但人工智能技術(shù)的發(fā)展有可能從本質(zhì)上對創(chuàng)造新工種貢獻(xiàn)有限,從而在整體上對就業(yè)產(chǎn)生負(fù)面影響。另外,大會還組織了一個關(guān)于自治武器的倫理問題的公開辯論也相當(dāng)有趣。
個人覺得,對人工智能技術(shù)的這一波“擔(dān)憂”浪潮實際上反映了外界對人工智能技術(shù)近年來進(jìn)步的認(rèn)可(我猜一些人工智能領(lǐng)域的學(xué)者在聽到這些“質(zhì)疑”時其實是欣慰遠(yuǎn)大于困擾吧)。也許與“機(jī)器是否會過于聰明”相比,“機(jī)器是否已經(jīng)真如公眾想象的那樣聰明”才是更值得人工智能學(xué)界擔(dān)心的問題。從歷史上看,人們對機(jī)器智能水平的理解似乎極易產(chǎn)生偏差,往往一開始過于高估,覺得它們無所不能,然而在發(fā)現(xiàn)機(jī)器能力達(dá)不到他們的想象之后又轉(zhuǎn)向過于低估,覺得現(xiàn)有的技術(shù)什么都不是。這兩種看法又經(jīng)常在媒體的推波助瀾下走向極端化,長期來看無論是哪種極端化看法都會對正常嚴(yán)謹(jǐn)?shù)娜斯ぶ悄苎芯吭斐韶?fù)面影響。
人工智能與機(jī)器人技術(shù)
“人工智能與機(jī)器人技術(shù)”是AAAI 2015大會的一個主題。從學(xué)科基礎(chǔ)看,人工智能學(xué)科從“什么是智能”的哲學(xué)問題出發(fā),從原理上研究在“智能行為機(jī)械化”過程中的一些根本限制和技術(shù)原則。另一方面機(jī)器人學(xué)科則從工程應(yīng)用的角度出發(fā),考慮如何實際制造滿足特定“智能化”要求的機(jī)器。兩個領(lǐng)域本應(yīng)是相輔相成的關(guān)系,機(jī)器人領(lǐng)域為人工智能領(lǐng)域提供實驗和實踐的機(jī)會,而人工智能領(lǐng)域為機(jī)器人領(lǐng)域提供知識儲備和技術(shù)工具。”但事實上兩個領(lǐng)域的研究在很大程度上是相互脫節(jié)獨立發(fā)展的。所以現(xiàn)在人們開始考慮如何加強這兩個領(lǐng)域的合作和相互滲透”,本次大會的學(xué)術(shù)委員會主席Sven Koenig教授在一次交談中提到。事實上美國國家科學(xué)基金會(NSF-National Science Foundation)專門就這個問題在會議期間組織了一個專題研討會(只有受邀的領(lǐng)域?qū)<也拍軈⒓?。
在公開活動中,大會隆重舉行了一個對機(jī)器人項目“Shakey, the robot”的紀(jì)念活動。上世紀(jì)60年代末到70年代中期,幾個研究員為設(shè)計制造一個名為Shakey的機(jī)器人發(fā)明了一系列后來影響廣泛的人工智能技術(shù),包括啟發(fā)式搜索中的A*算法,自動規(guī)劃中的STRIP模型,計算機(jī)視覺中的霍夫變換,以及如今幾乎已成為標(biāo)準(zhǔn)的機(jī)器人系統(tǒng)框架。在紀(jì)念活動中領(lǐng)銜發(fā)言的是人工智能領(lǐng)域元老級人物Edward Feigenbaum教授,他以一篇極具感染力的演講高度評價了Shakey項目的巨大影響。有趣的是,以他的名字命名的Feigenbaum獎也同時在紀(jì)念活動中頒發(fā),而今年獲獎?wù)呤俏④浝椎旅裳芯吭旱脑洪LEric Horvitz。Feigenbaum獎是當(dāng)今人工智能界的一個主要獎項,用來獎勵對人工智能的實驗方面研究做出突出貢獻(xiàn)的個人和團(tuán)體。
此外,會議期間還有一個Robocup參賽隊的表演賽。下面是我在現(xiàn)場錄的一小段機(jī)器人足球比賽的視頻(視頻見附件)。
從視頻來看,現(xiàn)在參加Robocup的機(jī)器人在基本運動能力方面還比較有限。個人覺得,雙足機(jī)器人應(yīng)該先在競技場景下“跑起來”,再考慮踢足球之類的復(fù)雜任務(wù)。因此,現(xiàn)階段我們或許可以先考慮一些諸如“機(jī)器人田徑”之類的比賽…
圖靈測試的改進(jìn)方案
去年關(guān)于Eugene Goostman通過圖靈測試的新聞似乎讓一些研究者們看到一個“推翻”圖靈測試的好機(jī)會。他們先后組織了一個專題研討會和一個正式會議,主題都叫“Beyond Turing Test”。會議期間,研究者們提出了一些新的機(jī)器智能的測試標(biāo)準(zhǔn),試圖代替圖靈測試。其中有兩個標(biāo)準(zhǔn)是比較有影響力的:
自動游戲博弈的新突破
最近該領(lǐng)域的一個階段性成果是,德州撲克的一個最基本的版本被近似完美解決了,具體就是說研究員們顯式地找到一個博弈策略,其平均收益與(這個游戲的一個)納什均衡策略的差距比連續(xù)玩這個游戲70年之后結(jié)果的隨機(jī)波動還要小。這個結(jié)果發(fā)表在一月份的一期《科學(xué)》雜志上,而項目的主要負(fù)責(zé)人Michael Bowling教授在會議期間就這項成果做了一個主題演講。
會議期間同時舉行了General Game Playing比賽。這項比賽要求計算機(jī)在沒有人類手工輸入領(lǐng)域知識的情況下進(jìn)行棋類游戲博弈。為了保證這一點,比賽組織方會維護(hù)一個包括各種不同游戲的列表,每項游戲的基本規(guī)則都用一套通用語言進(jìn)行形式化表述,并且只在比賽當(dāng)時才輸入給計算機(jī)。另外組織者還進(jìn)行了一場有趣的“碳硅大戰(zhàn)“,也就是讓人跟比賽中優(yōu)勝的計算機(jī)在這個比賽規(guī)則下比賽,結(jié)果是機(jī)器取得勝利。
深度學(xué)習(xí)
深度學(xué)習(xí)的主將之一Jeff Hinton教授在會議期間做了一個主題演講,題目就叫“深度學(xué)習(xí)”。這個演講毫不意外地成為了整個會議參加人數(shù)最多的活動。Hinton的演講內(nèi)容主要是對到目前為止的深度學(xué)習(xí)運動的總結(jié)性回顧。值得一提的是,Hinton教授對微軟研究院在整個深度學(xué)習(xí)運動中的先驅(qū)性貢獻(xiàn)給予了很大肯定。確實,他的團(tuán)隊與微軟研究院合作完成的基于深度學(xué)習(xí)的語音識別研究完全稱得上是直接點燃深度學(xué)習(xí)熱潮的第一批成功案例。
規(guī)劃、決策、約束補償、優(yōu)化、與搜索算法
這些都是人工智能的傳統(tǒng)領(lǐng)域。讓我其實有一點意外的是,這次會上相當(dāng)多這些領(lǐng)域里的論文是關(guān)于蒙特卡洛樹搜索法(Monte Carlo Tree Search)的內(nèi)容——一個從計算機(jī)圍棋領(lǐng)域發(fā)展而來的技術(shù)。而我這次在會議中做的論文報告正是關(guān)于如何結(jié)合Monte Carlo Tree Search與傳統(tǒng)的搜索算法,從而設(shè)計更為通用的人工智能算法。盡管論文主要討論在假設(shè)最差情況下如何規(guī)劃(adversarial planning),我相信論文的主要結(jié)果同樣適用于更為一般的情況,例如基于概率的規(guī)劃問題。
另外有些關(guān)于算法選擇(Algorithm Selection)的論文,討論如何通過增強學(xué)習(xí)等技術(shù)解決組合優(yōu)化問題。基本思想是說,一般而言每一個單獨的算法在解決這類問題時都有自己的“盲點”,也就是在最差情況下性能很差(所謂的“NP困難”問題)。但是不同的算法盲點往往不同,因此如果在實際應(yīng)用中能通過學(xué)習(xí)技術(shù)了解正在面對的是“哪些”具體問題類型,也就有可能有的放矢地選擇合適的算法。個人認(rèn)為這是一個有趣的研究方向。
知識表示與推理
我一直認(rèn)為找到“合適”的知識模型是實現(xiàn)人工智能的主要難點所在。個人對這個領(lǐng)域三方面的研究比較感興趣:(1)致力于將抽象模糊的術(shù)語(如知識、本體、表達(dá)力)賦予具體和形式化語義的工作,例如Judea Pearl教授提出的“因果模型(causal model)“;(2)在學(xué)習(xí)、決策和規(guī)劃等語境下討論知識表示和推理的工作,例如Leslie Valiant教授提出的”知識灌輸模型 (Knowledge Infusion)”;(3)從中立獨立的角度對已有模型和理論的實驗性或?qū)嵺`性研究。
機(jī)器學(xué)習(xí)及其應(yīng)用
機(jī)器學(xué)習(xí)是這次會議中最重要的話題,總共占據(jù)了9個會議,同時還有大量論文安排在海報會議里。不過遺憾的是這次會議我不得不“策略性地”選擇放棄了全部機(jī)器學(xué)習(xí)有關(guān)的內(nèi)容,以換取時間和精力參加上面所列的所有其他話題的會議。
作者介紹:
黃鉑鈞,現(xiàn)任微軟亞洲研究院應(yīng)用算法組副研究員,研究興趣包括對人工智能、計算機(jī)系統(tǒng)、和抽象計算模型的理論分析,以及相關(guān)的算法應(yīng)用。
好文章,需要你的鼓勵
這項研究提出了"高效探測"方法,解決了掩碼圖像建模AI難以有效評估的問題。通過創(chuàng)新的多查詢交叉注意力機(jī)制,該方法在減少90%參數(shù)的同時實現(xiàn)10倍速度提升,在七個基準(zhǔn)測試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質(zhì)量與分類性能的強相關(guān)性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應(yīng)性。團(tuán)隊承諾開源全部代碼,推動技術(shù)普及應(yīng)用。
伊利諾伊大學(xué)研究團(tuán)隊開發(fā)了CLAIMSPECT系統(tǒng),通過層次化分解復(fù)雜爭議、智能檢索相關(guān)文獻(xiàn)、多角度收集觀點的方法,將傳統(tǒng)的"真假"判斷轉(zhuǎn)變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動構(gòu)建爭議話題的分析框架,識別不同觀點及其支撐證據(jù),為科學(xué)和政治爭議提供更全面客觀的分析,已在生物醫(yī)學(xué)和國際關(guān)系領(lǐng)域驗證有效性。
清華大學(xué)研究團(tuán)隊首次提出情感認(rèn)知融合網(wǎng)絡(luò)(ECFN),讓AI能像人類一樣理解和表達(dá)情感。該系統(tǒng)通過多層次情感處理架構(gòu),在情感識別準(zhǔn)確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達(dá)自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實現(xiàn)了跨模態(tài)情感融合、動態(tài)情感追蹤和個性化情感建模,為醫(yī)療、教育、客服等領(lǐng)域帶來革命性應(yīng)用前景。
哈佛大學(xué)研究團(tuán)隊通過創(chuàng)新的多智能體強化學(xué)習(xí)方法,讓AI在戰(zhàn)略游戲中學(xué)會復(fù)雜推理。研究發(fā)現(xiàn)AI通過游戲競爭能發(fā)展出類人思維能力,在邏輯推理、創(chuàng)造性解決問題等方面表現(xiàn)顯著提升。這項突破性成果為未來AI在醫(yī)療、教育、城市管理等領(lǐng)域的應(yīng)用奠定基礎(chǔ),展現(xiàn)了通過模擬人類學(xué)習(xí)過程培養(yǎng)真正智能AI的新路徑。