從早稻田大學(xué)1972年研發(fā)的WABOT,到特斯拉2022年首秀的Optimus,人類科學(xué)家對人形機器人的研發(fā)走過了半個世紀。在這半個世紀里,人形機器人的發(fā)展已經(jīng)從本田ASIMO、波士頓動力Atlas代表的技術(shù)驗證期,過渡到了以特斯拉Optimus為代表的商業(yè)試水期,一個新的機器人時代正在開啟。
為此,至頂科技特別策劃推出《機器人新紀元》專題報道,旨在探尋全球機器人團隊的技術(shù)變遷和創(chuàng)新故事。
本篇為《機器人新紀元》專題報道第三篇深度文章。
作者| 金旺
欄目| 機器人新紀元
2007年,回到國內(nèi)的黃曉慶進入中國移動,開始接手中國移動研究院的工作。
對于他來說,這是一個新的開始,對于中國通信產(chǎn)業(yè)來說,這同樣是一個不可多得的黃金發(fā)展時期。
2008年,中國正式迎來了3G時代,讓不少人興奮的移動互聯(lián)網(wǎng)大門在這一年緩緩打開,然而3G在網(wǎng)絡(luò)制式上存在的缺陷,讓全世界的運營商為之頭疼。
作為中國通信產(chǎn)業(yè)三大運營商之一,中國移動有著絕對大佬的江湖地位,身為中國移動研究院院長的黃曉慶,他的團隊又剛好是中國移動制定標(biāo)準的那群人。
在那個特殊位置、在那個關(guān)鍵時間節(jié)點上,黃曉慶做了一個大膽的假設(shè)——將3G和4G兩代移動通信技術(shù)一起干。
后來,中國移動成了全球唯一一個同時開展3G、4G網(wǎng)絡(luò)技術(shù)研究、標(biāo)準制定的運營商,并在2014年率先實現(xiàn)了4G網(wǎng)絡(luò)的規(guī)?;逃茫袊ㄐ偶夹g(shù)自此開始趕超世界。
也是在這時,黃曉慶有了一個新的計劃,一個新的十年計劃——做一家機器人運營商。
01 兩個第一性原理,一個機器人公司
黃曉慶創(chuàng)立達闥機器人,是在2015年,這一年,他辭去了中國移動研究院院長一職,對于在通信行業(yè)堅守了30多年的他來說,這次辭職創(chuàng)業(yè)被不少朋友視為是一次跨界。
不過,黃曉慶并不這么認為,“實際上我并沒有跨界。”
在通信行業(yè)那30多年里,黃曉慶見證了通信產(chǎn)業(yè)的大繁榮,也親身參與并主導(dǎo)了諸多通信技術(shù)、重大專項研發(fā)和標(biāo)準制定工作。
不過,黃曉慶認為,在通信行業(yè)這些年里,他最重要的工作其實是創(chuàng)造需求,通過新需求、新應(yīng)用驅(qū)動通信產(chǎn)業(yè)高速發(fā)展。
智能手機之后,誰會是推動通信產(chǎn)業(yè)爆發(fā)式增長的下一個需求?
這是黃曉慶2012年在中國移動研究院思考的一個問題。
這一年,4G網(wǎng)絡(luò)趨于成熟,一些機器人團隊開始嘗試將4G技術(shù)應(yīng)用到機器人上,在中國移動為通信產(chǎn)業(yè)“制造需求”的黃曉慶很快注意到了這件事,深入研究后,他發(fā)現(xiàn),原來機器人真的需要互聯(lián)網(wǎng),尤其是移動互聯(lián)網(wǎng)。
與此同時,他還有了另一個發(fā)現(xiàn),大多數(shù)機器人團隊的技術(shù)路線都是以機器人本體為基礎(chǔ),通過在本地改進算法、增加算力來增強機器人能力,而這種模式,在未來很可能會行不通。
這樣的判斷,源自于黃曉慶當(dāng)時發(fā)現(xiàn)的兩個第一性原理:
第一,集成電路比神經(jīng)元耗電1億倍。
集成電路是一個電子系統(tǒng),神經(jīng)元是一個生物系統(tǒng),這兩個系統(tǒng)的功耗相差1億倍,這意味著如果你想造一個智能水平和人一樣的計算機,它的功耗要比人腦功耗大1億倍,它的腦袋至少也要比人腦大1萬倍,如果用傳統(tǒng)設(shè)計方法,這樣的機器人顯然是無法造出來的。
第二,無線網(wǎng)絡(luò)比人的神經(jīng)網(wǎng)絡(luò)傳遞信息的速度要快10億倍。
神經(jīng)網(wǎng)絡(luò)傳遞信號的速度是300m/s,無線網(wǎng)絡(luò)傳遞信號的速度是光速,也就是30萬公里/s,這意味著,如果可以將機器人的大腦放到1000公里以外,信號傳輸延時可以控制在3ms以內(nèi),這樣的延時幾乎可以忽略不計。
“馬斯克曾說過,發(fā)現(xiàn)一個第一性原理就可以創(chuàng)業(yè)了,而我發(fā)現(xiàn)了兩個。”
基于這兩個第一性原理,他認為,未來的機器人肯定是云端機器人。于是,做云端機器人的念頭開始在他的心底生根發(fā)芽,他也開始等待一個絕佳時機。
這一等,就是兩年。
2014年,中國移動率先在全世界實現(xiàn)了4G網(wǎng)絡(luò)的規(guī)?;逃茫⒃谶@一年完成了100萬個基站的部署,4G網(wǎng)絡(luò)用戶增至1億。
基于此,黃曉慶又有了兩個新的判斷:
第一,中國會在5-6年內(nèi)部署5G網(wǎng)絡(luò),而5G網(wǎng)絡(luò)會是云端機器人構(gòu)想成立的關(guān)鍵;
第二,人工智能在十年內(nèi)會有重大突破。
這讓黃曉慶意識到,他等待的絕佳時機已經(jīng)到來。
于是,達闥機器人在2015年正式成立,也是在達闥成立的這一年,黃曉慶定下了一個十年目標(biāo)——10年內(nèi)做出家庭保姆機器人。
02 將云端大腦賣給孫正義
和大多數(shù)機器人創(chuàng)業(yè)團隊不同,希望做機器人領(lǐng)域運營商的達闥,并沒有從造機器人本體入手,而是從造腦計劃開始。
達闥公司創(chuàng)立之初,黃曉慶為公司制定了兩個研究方向:
一個是云端大腦,另一個是網(wǎng)絡(luò)安全。
前者是基于5G、云計算技術(shù)的云端機器人大腦,是黃曉慶通過兩個第一性原理推導(dǎo)出的未來機器人產(chǎn)業(yè)的核心,也是基于此,達闥后來研發(fā)了海睿云端機器人操作系統(tǒng)。
后者則是實現(xiàn)達闥云端機器人運營商這一構(gòu)想的重要保障,達闥由此也研發(fā)了自己的移動內(nèi)聯(lián)網(wǎng)。
然而,即便有了云端大腦和移動內(nèi)聯(lián)網(wǎng),機器人本體依然必不可少,最快、最有效的方法是找有機器人本體的團隊合作。
早在達闥開始造云端大腦時,黃曉慶就開始在全世界找“靠譜”的機器人團隊。
2015年,全世界有三個人形機器人明星團隊最為閃耀,一個是波士頓動力的Atlas、一個是本田的ASIMO,還有一個是軟銀孫正義2012年1億美元收購的法國公司Aldebaran。
不過,這三個團隊中,只有后者一直在花大量的資金和資源,嘗試將造出的人形機器人Pepper推向市場。
由于有軟銀在資金和資源上的支持,2015年,Pepper在全球拿到了5萬臺整機訂單,孫正義眼看自己的Pepper開始走向全世界,更是大手筆向富士康下了50萬臺設(shè)備的訂單,這樣一個龐大的數(shù)量已經(jīng)超過了2015年全球服務(wù)機器人市場的整體體量。
由于在通信技術(shù)領(lǐng)域與孫正義有過深度合作,在黃曉慶創(chuàng)業(yè)達闥時,他也將自己的兩個第一性原理和云端機器人理念告訴了當(dāng)時對機器人頗為癡迷的孫正義,孫正義聽后不僅十分認同黃曉慶云端機器人的理念,還成為了達闥的主要投資人。
隨后在軟銀正式立項Pepper,并計劃將Pepper機器人賣到全球時,黃曉慶看到了Pepper機器人的潛力,并向?qū)O正義提議,達闥可以為Pepper造一個云端大腦。
彼時,Pepper雖然在全球擁有不錯的聲量,也拿下了不少訂單,但故障率高、智能性差也讓這一機器人備受詬病。 云端大腦,確實值得一試。 于是,達闥團隊開始為Pepper裝上新的RCU和控制器、4G模塊,研發(fā)了云端大腦。
“如果當(dāng)時我們這次合作能順利進行下去的話,Pepper將會是第一個擁有云端大腦的機器人,我們也會借助Pepper將云端大腦帶到全世界,”黃曉慶告訴科技行者。
然而,現(xiàn)實往往不會讓新舊技術(shù)理念交替來得這么快。
和軟銀的合作最終由于種種原因未能如愿進行下去,但達闥最終還是將Pepper這款黃曉慶認為“世界上最好的人形機器人”帶到了國內(nèi)。
2017年8月,在第三屆世界機器人大會上,一款名為Cloud Pepper出現(xiàn)在了達闥的展臺上,可愛的外表,外加炫酷的表演,引得現(xiàn)場不少觀眾圍觀。
Cloud Pepper作為達闥第一款產(chǎn)品,這一年也在國內(nèi)開啟了商業(yè)化之旅。
03 像造手機一樣造機器人
Cloud Pepper在國內(nèi)面世后,國內(nèi)服務(wù)機器人市場難得出現(xiàn)了一些變化。
“我們當(dāng)時賣出了不少產(chǎn)品,而且大家都很喜歡這款機器人,”回憶起當(dāng)時Cloud Pepper進入各大線下門店時的場景,黃曉慶依然很是興奮。
不過,由于Pepper團隊在技術(shù)和產(chǎn)品上長期沒有迭代更新,黃曉慶不得不考慮重新找一家合作廠商,或者收購一家機器人團隊。
2017年,已經(jīng)在機器人領(lǐng)域闖蕩了兩年的黃曉慶已經(jīng)意識到,模塊化關(guān)節(jié)對于機器人,尤其是人形機器人極為重要,并開始在國內(nèi)外尋找潛力團隊,也就在這一年,幾經(jīng)輾轉(zhuǎn),黃曉慶遇到了前沿驅(qū)動。
在收購前沿驅(qū)動時,黃曉慶對于人形機器人已經(jīng)有了更深入的思考和規(guī)劃。 他認為,達闥未來幾年需要造四臺機器人:XR1、XR2、XR3、XR4,而所有機器人都需要的一項關(guān)鍵技術(shù),正是智能柔性關(guān)節(jié)。
智能柔性關(guān)節(jié)和傳統(tǒng)機器人關(guān)節(jié)有什么本質(zhì)差異?
黃曉慶告訴我們,傳統(tǒng)控制器控制電機、傳感器的模式類似于上個世紀八十年代的電腦,一個主機需要控制多個外設(shè),在這樣的機器人控制系統(tǒng)中,控制器控制8個、10個關(guān)節(jié)都還OK,但一個人形機器人可能會有60多個關(guān)節(jié), 傳統(tǒng)機器人控制系統(tǒng)很難很好地控制一個這樣的復(fù)雜系統(tǒng)。
在黃曉慶的設(shè)想中,每個智能柔性關(guān)節(jié)相當(dāng)于移動互聯(lián)網(wǎng)中的一部手機,有獨立的授權(quán)和通信網(wǎng)絡(luò),有獨立的操作系統(tǒng)和執(zhí)行能力。 而這其中的關(guān)鍵,是讓所有關(guān)節(jié)都具備獨立的計算能力和通信能力。
2019年2月,在經(jīng)歷了16個月的研發(fā)后,達闥第一代搭載智能柔性關(guān)節(jié)的智能柔性服務(wù)機器人Ginger在MWC 2019上正式亮相。
這個首次采用了智能柔性關(guān)節(jié)設(shè)計理念的Ginger,正是達闥最初規(guī)劃的四類機器人中的人形輪式機器人XR1。
這一年,XR1開啟的,是達闥云端大腦產(chǎn)品化的新階段。
04 機器人的終極形態(tài)
作為達闥一款重要的機器人產(chǎn)品,Ginger看起來有點像最初的Cloud Pepper,實際上,這也是達闥用自己的思路,自研了一個全新的Cloud Pepper。
正是這款機器人,讓達闥在2021年迎賓機器人迎來高潮時,迅速在市場上出貨上千臺,不過,黃曉慶也坦言,Ginger不是機器人的終極形態(tài)。
在黃曉慶的構(gòu)想中,機器人肯定是通用的,這和大部分基于一個垂直場景進行產(chǎn)品優(yōu)化的機器人研發(fā)理念有著不小的差異。
“優(yōu)化講的是場景定制,通用的結(jié)果則是量產(chǎn),是‘手機理論’,”黃曉慶這樣解釋二者的區(qū)別。
此外,黃曉慶在2017年仔細思考機器人未來形態(tài)時,他發(fā)現(xiàn),我們無法用一個機器人完成當(dāng)下所有工作,但是可以用4個。
人形機器人是大多數(shù)機器人團隊研發(fā)機器人的終極目標(biāo)形態(tài),但在2017年思考這一產(chǎn)品形態(tài)時,黃曉慶發(fā)現(xiàn),足式人形機器人不僅技術(shù)難度高,而且制造成本昂貴。
實際上,人類大部分工作空間都是平整地面,人形輪式機器人不僅可行,而且比足式機器人省電30倍。
這也就有了達闥第一代人形機器人Ginger的最初構(gòu)想。
在深入了解機器人產(chǎn)業(yè)后,黃曉慶的另一個發(fā)現(xiàn)是,人形機器人抗不了重物,因而他又構(gòu)想出了“四輪車+雙臂”和“四足機器人+雙臂”的XR2、XR3機器人形態(tài)。
而就人形機器人終極形態(tài),達闥在今年WRC 2023上展示的 “小紫”正是黃曉慶構(gòu)想的XR4。
黃曉慶希望未來進入千家萬戶的保姆機器人,正是這款名為“小紫”的人形機器人。
值得注意的是,這臺名為“小紫”的人形足式機器人,不僅采用了柔性關(guān)節(jié)設(shè)計,還應(yīng)用了并聯(lián)關(guān)節(jié)設(shè)計。
并聯(lián)關(guān)節(jié)設(shè)計有什么好處呢?
由于相較人體的動力系統(tǒng),人形機器人的電驅(qū)系統(tǒng)并不是一個理想電動驅(qū)動系統(tǒng),伺服電機的能量密度要比人類肌肉小10倍。
如何用伺服電機很好地驅(qū)動機器人的大腿,就成了業(yè)界一個普遍難題。
達闥在設(shè)計“小紫”時,是將四個伺服電機進行了并聯(lián),以此提供更充足的動能,支撐后續(xù)更強勁的運動能力。
黃曉慶認為,雖然人形雙足XR4是機器人的終極形態(tài),但XR2或XR3這類機器人仍會長期存在。 “這有點像現(xiàn)在的人和汽車的關(guān)系,汽車無法取代人類雙腿,但作為出行和載物的一種便捷的交通工具仍會長期存在。”
實際上,達闥的XR2已經(jīng)找到了一個新場景——農(nóng)業(yè)采摘,黃曉慶認為,這是一個擁有巨大潛力的機器人應(yīng)用場景。
而對于什么是符合機器人的應(yīng)用場景,黃曉慶有著一套自己的衡量標(biāo)準——機器人幫人干活兒是否能夠只“收”一半的錢。
也是基于這個標(biāo)準,黃曉慶告訴科技行者,現(xiàn)在大家都在講人形機器人進工廠,但實際上,工廠中的地面也都是平整的地面,因而并不需要雙足,除去汽車總裝這樣特殊的環(huán)境,輪式人形機器人就能完全勝任,工廠環(huán)境更需要的應(yīng)該是靈巧手和機器視覺。
真正的雙足人形機器人,更應(yīng)該成為的是家庭保姆。
只不過,這在2021年來看,依然有些遙遠,那時,沒人能想到,變化很快將會發(fā)生。
05 大模型讓奇點到來
2022年11月30日,總部位于舊金山的OpenAI面向全球發(fā)布了ChatGPT,人工智能自此被推向了大模型時代。
對于今年人形機器人熱潮背后的真正原因,黃曉慶認為毫無疑問是AI大模型的突破,對于人形機器人這些年產(chǎn)業(yè)化的艱難歷程,他認為主要原因正是“人工智能不到位”。
“過去很多人做人形足式機器人,直到現(xiàn)在也沒能實現(xiàn)產(chǎn)業(yè)化,原因是人工智能沒有到位,現(xiàn)在人工智能到位了,帶來的直接結(jié)果是,我們能造出和人一樣聰明的機器人了。”
實際上,在今年上半年,硅谷的不少投資人已經(jīng)開始關(guān)注大模型應(yīng)用類的創(chuàng)業(yè)項目,例如用大模型解決管理問題,用大模型解決營銷問題,甚至用大模型做人類助手,而用大模型最終來解決機器人的問題,實際上是多模態(tài)大模型。
達闥早在2020年就開始接觸深度學(xué)習(xí),到2021年,達闥的團隊已經(jīng)在用深度學(xué)習(xí)訓(xùn)練機器人。
黃曉慶認為,“在用深度學(xué)習(xí)訓(xùn)練機器人這方面,中國的團隊一點都不落后于國外,由于一上來我們就是結(jié)合4G技術(shù)開展的研究,我們其實少走了很多彎路。”
2023年6月,達闥海睿操作系統(tǒng)更新到5.5版本,在這一版本中,達闥融入了自主研發(fā)的RobotGPT,“大模型+柔性關(guān)節(jié)控制”這兩項被黃曉慶視為未來機器人的重要技術(shù)支柱,成了海睿OS 5.5的獨特技能。
這也是黃曉慶眼中具身智能該有的樣子。
對于大模型在人工智能領(lǐng)域帶來的技術(shù)突破,黃曉慶還有另一個更為樂觀的看法:
“很多人沒有意識到一點——ChatGPT發(fā)布后,我們就已經(jīng)突破了人工智能的奇點,不是奇點已近,而是奇點已來,奇點之后,機器人保姆很快就會出現(xiàn)。”
黃曉慶認為,2023年必將會是載入史冊的一年,而他更愿意將這一年稱之為“機器人覺醒之年”。
好文章,需要你的鼓勵
這項研究提出了"高效探測"方法,解決了掩碼圖像建模AI難以有效評估的問題。通過創(chuàng)新的多查詢交叉注意力機制,該方法在減少90%參數(shù)的同時實現(xiàn)10倍速度提升,在七個基準測試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質(zhì)量與分類性能的強相關(guān)性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應(yīng)性。團隊承諾開源全部代碼,推動技術(shù)普及應(yīng)用。
伊利諾伊大學(xué)研究團隊開發(fā)了CLAIMSPECT系統(tǒng),通過層次化分解復(fù)雜爭議、智能檢索相關(guān)文獻、多角度收集觀點的方法,將傳統(tǒng)的"真假"判斷轉(zhuǎn)變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動構(gòu)建爭議話題的分析框架,識別不同觀點及其支撐證據(jù),為科學(xué)和政治爭議提供更全面客觀的分析,已在生物醫(yī)學(xué)和國際關(guān)系領(lǐng)域驗證有效性。
清華大學(xué)研究團隊首次提出情感認知融合網(wǎng)絡(luò)(ECFN),讓AI能像人類一樣理解和表達情感。該系統(tǒng)通過多層次情感處理架構(gòu),在情感識別準確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實現(xiàn)了跨模態(tài)情感融合、動態(tài)情感追蹤和個性化情感建模,為醫(yī)療、教育、客服等領(lǐng)域帶來革命性應(yīng)用前景。
哈佛大學(xué)研究團隊通過創(chuàng)新的多智能體強化學(xué)習(xí)方法,讓AI在戰(zhàn)略游戲中學(xué)會復(fù)雜推理。研究發(fā)現(xiàn)AI通過游戲競爭能發(fā)展出類人思維能力,在邏輯推理、創(chuàng)造性解決問題等方面表現(xiàn)顯著提升。這項突破性成果為未來AI在醫(yī)療、教育、城市管理等領(lǐng)域的應(yīng)用奠定基礎(chǔ),展現(xiàn)了通過模擬人類學(xué)習(xí)過程培養(yǎng)真正智能AI的新路徑。
關(guān)注智造、硬件、機器人。