作者 | 金旺
欄目 | 機器人新紀元
2024年1月,騰訊發(fā)布《2024數(shù)字科技前沿應(yīng)用趨勢》報告,在這份報告中,“AI加速人形機器人‘手、腦’進化”排在十大前沿應(yīng)用趨勢第三位。
于是,我們看到,3月30日,在上海舉辦的首屆中國具身智能大會上,騰訊Robotics X實驗室成了大會四大鉆石贊助商之一,騰訊首席科學(xué)家、Robotics X實驗室主任張正友在大會上也做了具身智能主題演講。
張正友在大會上指出,AGI的終極形態(tài),會是一個機器人形態(tài)。
在人形機器人最熱鬧的這一年里,騰訊做了靈巧手、機械臂(相當于人形機器人上半身的手臂控制能力),也做了各種四足機器人(相當于人形機器人的下半身的運動能力)。
科技行者在騰訊關(guān)于機器人的未來規(guī)劃中,已經(jīng)看到了人形機器人的身影。
現(xiàn)在,我們可以再期待一下騰訊的人形機器人了。
01 智能,是否需要具身?
什么是具身智能?
張正友指出,所謂具身智能,是指有物理載體的智能體(也就是智能機器人)在與物理世界的交互過程中,通過感知、控制和自主學(xué)習(xí)來積累知識和技能,形成智能,并由此影響物理世界的能力。
實際上,具身智能并不是什么新鮮事物,早在1950年,人工智能之父艾倫·圖靈發(fā)表的那篇大名鼎鼎的論文《Computing Machinery and Intelligence》中,就已經(jīng)提出了這一概念。
OpenAI CEO奧特曼也曾指出,“如果我們有了通用人工智能,而在物理世界中完成一件事唯一的方法還是讓人類自己去做,那就太令人沮喪了。”
“我們會在某個時候以某種方式重返機器人領(lǐng)域。”
奧特曼最初構(gòu)建OpenAI時,就是想基于機器人來實現(xiàn)通用人工智能,只不過,命運多舛,才有了后來的ChatGPT和Sora。
實際上,OpenAI在過去兩年里已經(jīng)相繼投資了兩家人形機器人公司,一家是1X Technologies、另一家是Figure AI。
那么,智能,到底是否需要具身呢?
這一問題在產(chǎn)業(yè)界其實依然有兩種聲音:
一種聲音認為,智能并不一定與物理形態(tài)有關(guān),智能主要關(guān)乎信息處理、問題解決和決策制定,這些都可以通過軟件或算法實現(xiàn)。
另一種聲音則認為,身體對于智能至關(guān)重要,智能源于生物體與周圍環(huán)境之間的互動,這需要物理形態(tài)。
張正友在大會上指出,“我相信大家都認為智能是需要具身的,否則就不會來參加這場具身智能大會了。”
贊同這一觀點的人,當然也包括張正友本人。
實際上,張正友在演講中也指出,AGI的終極形態(tài),是一個機器人形態(tài)。
02 騰訊造機器人的A2G
2018年,張正友正式加入騰訊,并在這一年組建了騰訊機器人實驗室,Robotics X實驗室。
張正友說,騰訊這一實驗室成立之初定了,團隊內(nèi)部定下了一個指導(dǎo)方針——A2G。
具體而言,是用ABCDEFG代指了幾個技術(shù)要素的英文縮寫,翻譯過來,這幾個要素分別為:人工智能、機器人本體、精準控制、發(fā)育學(xué)習(xí)、情感理解、靈巧操控、守護天使。
其中,人工智能、機器人本體、精準控制為底層基礎(chǔ)能力,發(fā)育學(xué)習(xí)、情感理解、靈巧控制構(gòu)成了更上層的中間層能力。
最上層的G,具體是指通過部署在環(huán)境中的傳感器,讓環(huán)境和機器人信息共通,通過云與家人和世界互聯(lián),讓機器人成為守護天使。
這是一個相當宏大的愿望,一個宏大到很難說這個實驗室還要經(jīng)歷幾代科學(xué)家的努力,才能達成夙愿。
不過,就這樣,騰訊在這一年開始了機器人的技術(shù)研發(fā),各類機器人在之后幾年里也陸續(xù)面世:
2019年12月,騰訊發(fā)布了自平衡自行車;
2020年10月,騰訊發(fā)布了的四足機器人Jamaca學(xué)會了走梅花樁;
2021年2月,騰訊發(fā)布了多模態(tài)四足機器人Max;
2021年11月,騰訊發(fā)布了IDC運維機器人;
……
到2023年,騰訊又發(fā)布了擁有靈巧手和機械臂的機器人,這款機器人還學(xué)會了調(diào)酒。
就在大家覺得機器人離走進人類生活已經(jīng)近在咫尺時,實際上,AGI+機器人的模式創(chuàng)新才剛剛開始。
03 再造一個新范式
也是在本次大會上,張正友重提了一個概念“SLAP范式”。
每個科學(xué)家要想自成一派,就要創(chuàng)造一套自己的理論。
早在2018年,Robotics X實驗室成立后,張正友就提出了SLAP范式。
這一范式的提出,其實基于張正友對智能控制的理解。
張正友說,“我們感興趣的機器人要能應(yīng)對不同環(huán)境,即使在不確定性很大的環(huán)境中,仍然能夠有自主調(diào)整和規(guī)劃的系統(tǒng)。”
這就要求機器人有兩類自主能力:
一類是反應(yīng)式的自主能力,另一類是有意識的自主能力。
反應(yīng)式的自主能力是說,在遇到被人踢了一腳這樣意想不到的情況后,機器人能夠很快適應(yīng)變化,并調(diào)整自己的姿態(tài);
有意識的自主能力則是說,機器人要有自主規(guī)劃能力。
要實現(xiàn)這樣的具身智能,顯然已經(jīng)無法依賴傳統(tǒng)的“感知-計劃-行動”的控制范式,于是,張正友提出了SLAP范式。
SLAP范式同樣是幾個英文單詞的所系,具體而言是,感知、行動、學(xué)習(xí)、計劃。
這套范式與傳統(tǒng)控制范式最主要的區(qū)別在于,張正友將感知與行動連系到了一起,并將學(xué)習(xí)滲透到了各個模塊。
“只有感知與行動緊密相連,才能夠把反應(yīng)是怎樣實現(xiàn)的搞清楚。”
張正友提出的這一范式,其實也參考了人類大腦的思考范式,并參考人類大腦,提出了具身智能的三層系統(tǒng):
第一層是原始控制層(Primitive Level Control),通過運動數(shù)據(jù),對機器人進行訓(xùn)練。
第二層是環(huán)境感知控制層(Environmental Level Control),通過對環(huán)境的感知,實現(xiàn)機器人在不同環(huán)境中的平穩(wěn)運動。
第三層是策略控制層(Strategic Level Control),通過給定相關(guān)任務(wù),機器人進行自行推理,然后在環(huán)境中實現(xiàn)類似人類大腦的控制決策。
實際上,騰訊的四足機器人的控制系統(tǒng)就是這樣一步一步構(gòu)建出來的。
不過,這些都是騰訊過去幾年做的工作。
現(xiàn)在,騰訊Robotics X實驗室正在將多模態(tài)大模型融合到機器人系統(tǒng)中,增強機器人環(huán)境感知和視覺能力,讓他們的機器人能夠聽懂人話,能夠和人類在語言和動作上進行簡單的交互。
至于未來規(guī)劃,科技行者在現(xiàn)場也了解到,騰訊Robotics X實驗室至少已經(jīng)有了兩方面考慮:
首先,騰訊將就三維感知數(shù)據(jù)和騰訊的混元大模型或開源大模型LLAMA2-7B優(yōu)化策略控制層;
其次,騰訊也已經(jīng)將人形機器人寫到了未來計劃中。
接下來,我們可以期待一下騰訊的人形機器人了。
好文章,需要你的鼓勵
這項研究提出了"高效探測"方法,解決了掩碼圖像建模AI難以有效評估的問題。通過創(chuàng)新的多查詢交叉注意力機制,該方法在減少90%參數(shù)的同時實現(xiàn)10倍速度提升,在七個基準測試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質(zhì)量與分類性能的強相關(guān)性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應(yīng)性。團隊承諾開源全部代碼,推動技術(shù)普及應(yīng)用。
伊利諾伊大學(xué)研究團隊開發(fā)了CLAIMSPECT系統(tǒng),通過層次化分解復(fù)雜爭議、智能檢索相關(guān)文獻、多角度收集觀點的方法,將傳統(tǒng)的"真假"判斷轉(zhuǎn)變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動構(gòu)建爭議話題的分析框架,識別不同觀點及其支撐證據(jù),為科學(xué)和政治爭議提供更全面客觀的分析,已在生物醫(yī)學(xué)和國際關(guān)系領(lǐng)域驗證有效性。
清華大學(xué)研究團隊首次提出情感認知融合網(wǎng)絡(luò)(ECFN),讓AI能像人類一樣理解和表達情感。該系統(tǒng)通過多層次情感處理架構(gòu),在情感識別準確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實現(xiàn)了跨模態(tài)情感融合、動態(tài)情感追蹤和個性化情感建模,為醫(yī)療、教育、客服等領(lǐng)域帶來革命性應(yīng)用前景。
哈佛大學(xué)研究團隊通過創(chuàng)新的多智能體強化學(xué)習(xí)方法,讓AI在戰(zhàn)略游戲中學(xué)會復(fù)雜推理。研究發(fā)現(xiàn)AI通過游戲競爭能發(fā)展出類人思維能力,在邏輯推理、創(chuàng)造性解決問題等方面表現(xiàn)顯著提升。這項突破性成果為未來AI在醫(yī)療、教育、城市管理等領(lǐng)域的應(yīng)用奠定基礎(chǔ),展現(xiàn)了通過模擬人類學(xué)習(xí)過程培養(yǎng)真正智能AI的新路徑。
關(guān)注智造、硬件、機器人。