作者| 金旺
欄目| 機器人新紀(jì)元
我們到上海拜訪開普勒是今年4月的一個陰雨天。
走進(jìn)開普勒位于浦東新區(qū)的辦公室,在不算長的走廊里,一側(cè)掛滿了開普勒人形機器人的畫像,穿過走廊,是一個空曠的空間,停放著一臺先行者K1,開普勒CEO胡德波就是在這里為我們做的人形機器人演示。
就在我們到訪開普勒的這一天,還發(fā)生了另一件對整個機器人行業(yè)影響深遠(yuǎn)的事兒——波士頓動力在這天上午宣布了液壓版Atlas正式退役,晚上就發(fā)布了電驅(qū)版的Atlas。
我們是這天下午到訪的開普勒,聊起波士頓動力退役的Atlas時,胡德波并沒有感到驚訝,他告訴科技行者:
“在前不久GTC 2024上,我碰到波士頓動力創(chuàng)始人Marc時問過他一個問題——波士頓動力Atlas做得這么好,為什么沒有讓它進(jìn)廠干活兒;Marc說,他從來沒想過這事兒。”
波士頓動力做Atlas的初衷是進(jìn)行技術(shù)研究,思考的問題一直都是如何將機器人的性能做到極致,為此甚至不計成本,這樣的研發(fā)思路,注定了它很難進(jìn)行商業(yè)化。
與之不同的是,開普勒的人形機器人自發(fā)布之初,就將成本作為最重要的衡量指標(biāo)之一,胡德波說,“我們要將開普勒機器人做到3萬美元以內(nèi),然后賣到全世界,做擎天柱的平替。”
01 “船小好掉頭”
開普勒進(jìn)入大眾視野,是在今年拉斯維加斯的CES 2024上,當(dāng)時一則微軟CEO薩提亞·納德拉參觀中國人形機器人的視頻在網(wǎng)上一經(jīng)傳播,引起了不小的關(guān)注。
于是,大家開始好奇:這會是一個怎樣的機器人團(tuán)隊?
實際上, 彼時的開普勒(全稱:上海開普勒探索機器人有限公司)剛剛成立不到6個月,被帶到CES 2024上的人形機器人產(chǎn)品兩個月前才在國內(nèi)正式發(fā)布。
在中國人形機器人產(chǎn)業(yè)最瘋狂的這一年里,開普勒只是眾多初創(chuàng)團(tuán)隊中的一員,沒有傳奇人物帶隊、沒有明星資本加持,自然也沒掀起什么風(fēng)浪。
胡德波告訴科技行者,“公司成立之時,其實是開普勒團(tuán)隊成立的第三年,CES 2024上展出的先行者D1也已經(jīng)是我們進(jìn)化到第四代的人形機器人。”
和很多中國創(chuàng)業(yè)故事不同,開普勒走的是美國硅谷車庫創(chuàng)業(yè)模式,創(chuàng)始團(tuán)隊中的幾位工程師在2021年憑著對人形機器人的一腔熱情,在工作之余聚在一起開始做人形機器人。
人形機器人這個看上去很酷的產(chǎn)品是智能硬件的終極形態(tài),也是很多硬件工程師的夢想。
和大多數(shù)人形機器人項目研發(fā)路徑類似的是,開普勒團(tuán)隊最初幾人也是從下肢開始做起。
2021年,他們基于舵機和行星減速器,快速搭建了第一代腿足式人形機器人,之后又基于絲杠直線電機和行星減速器研發(fā)了第二代腿足式人形機器人。
“絲杠方案的優(yōu)勢是功耗低、負(fù)載能力強,但卻不如旋轉(zhuǎn)式執(zhí)行器響應(yīng)速度快、易調(diào)校,如果想要快速讓人形機器人展現(xiàn)出一定效果,讓它直立行走起來,旋轉(zhuǎn)式執(zhí)行器就是一個更好的方案,”回憶起最初研發(fā)人形機器人時團(tuán)隊內(nèi)部的考慮,胡德波如是說。
由于想要快點看到自己研發(fā)的人形機器人動起來的樣子,在做第三代、也是正式研發(fā)擁有上半身的完整人形機器人時,開普勒團(tuán)隊最終還是選擇了旋轉(zhuǎn)式執(zhí)行器這條路徑——先后用內(nèi)外轉(zhuǎn)子電機輔以蝸輪蝸桿結(jié)構(gòu)、諧波減速器,搭建起了第一個完整的人形機器人。
2022年底,開普勒團(tuán)隊如愿讓自己的人形機器人走了起來,據(jù)胡德波透露,開普勒內(nèi)部研發(fā)的3.5版本的人形機器人當(dāng)時已經(jīng)可以行走、練瑜伽,甚至用手操作家用電器,“作為一個創(chuàng)業(yè)團(tuán)隊,當(dāng)時如果能拿出這樣一款人形機器人Demo,融資已經(jīng)不是問題了。”
然而,在這一年特斯拉的AI Day上,馬斯克使用行星滾柱絲杠方案的人形機器人Optimus(擎天柱)的亮相讓他們意識到,“真正要能干活兒,還是要回到絲杠結(jié)構(gòu)上。”
“當(dāng)時我們基于旋轉(zhuǎn)執(zhí)行器研發(fā)出的人形機器人連續(xù)工作兩三個小時就需要充電,功耗太高,負(fù)載能力也不夠強,特斯拉Optimus正式發(fā)布后,我們就想將我們的架構(gòu)做一次徹底的改造,而且我們之前在研發(fā)第二代原型機時就已經(jīng)研發(fā)過絲杠方案,有一定的技術(shù)積累。”
回想起當(dāng)時特斯拉Optimus發(fā)布時對團(tuán)隊的影響,胡德波如是說。
他告訴科技行者,團(tuán)隊當(dāng)時對特斯拉Optimus做了仔細(xì)研究,發(fā)現(xiàn)使用行星滾柱絲杠方案確實很好,再加上對馬斯克對技術(shù)趨勢判斷的信任,最終決定研發(fā)自己的人形機器人滾柱絲杠方案。
“馬斯克對技術(shù)趨勢的判斷,以及他本人的影響力對人形機器人這波熱潮起到了很大的推動作用,實際上,人形機器人賽道也確實因為馬斯克和Optimus進(jìn)場才火起來的。”
02 “做擎天柱的平替”
自2022年正式發(fā)布Optimus后,馬斯克就成了人形機器人產(chǎn)業(yè)的代言人,全球人形機器人團(tuán)隊都在盯著馬斯克和他的Optimus。
馬斯克對人形機器人產(chǎn)業(yè)的預(yù)判相當(dāng)激進(jìn),他認(rèn)為,未來人形機器人數(shù)量將會超過人類,甚至達(dá)到100億臺。
如果只是觀念激進(jìn),或許也難掀起什么浪,然而,馬斯克是一個超強的行動派,在過去兩年里,他的人形機器人Optimus越來越靈巧,在最新的演示視頻中,已經(jīng)進(jìn)入工廠做起了分揀工作。
作為全球最接地氣的人形機器人,Optimus采用的方案也自然備受關(guān)注,開普勒正是借鑒了Optimus的行星滾柱絲杠方案。
雖然大家都知道Optimus采用的是滾柱絲杠方案,但要想自研一套同樣的方案用到自己的人形機器人上,遠(yuǎn)沒有想象的那樣簡單。
胡德波告訴科技行者,“國內(nèi)此前供應(yīng)鏈沒有行星滾柱絲杠執(zhí)行器的制造基礎(chǔ),如何研發(fā)一套用在人形機器人上的滾柱絲杠執(zhí)行器方案是當(dāng)時擺在團(tuán)隊面前的難題。”
實際上,就在距離上海300多公里外南京的某個研究所,很早就開始研究滾柱絲杠方案,在滾柱絲杠工件的機械加工方面,國內(nèi)供應(yīng)鏈有著一定的技術(shù)和工藝積累。
不過,此前這些工件普遍應(yīng)用于工業(yè)機床制造場景中,要造出一套用于人形機器人上的滾柱絲杠方案,就存在兩個難題:
第一個難題是規(guī)格問題,此前用于工業(yè)場景的滾柱絲杠工件并不適用于人形機器人執(zhí)行器制造,如何造出人形機器人需要的滾柱絲杠就成了開普勒團(tuán)隊當(dāng)時面臨的首要難題;
第二個問題是結(jié)構(gòu)問題,最終用到人形機器人上的執(zhí)行器包括行星滾柱絲杠、電機、電控、編碼器、傳感器、通訊模塊等在內(nèi)的復(fù)雜機電系統(tǒng),如何將這些集成到一起,做出一個穩(wěn)定可靠的解決方案,這也是此前國內(nèi)供應(yīng)鏈沒有做過的嘗試。
全球?qū)θ诵螜C器人的研究至今有半個世紀(jì)之久,由于有大量公開資料可供參考,開普勒前三代人形機器人的研發(fā)并沒有遇到太多困難,前三代人形機器人研發(fā)僅僅用了兩年的時間,2022年年底,開普勒3.5版本的人形機器人就已經(jīng)研發(fā)完成。
到了考慮量產(chǎn)、開始研究行星滾柱絲杠方案、做4.0版本時,真正的挑戰(zhàn)才正式開始。
胡德波告訴科技行者,“滾柱絲杠這一機械結(jié)構(gòu)是幾十年前就開始應(yīng)用的一項傳統(tǒng)技術(shù),歐洲在這方面的加工工藝一直非常領(lǐng)先,這也是為什么馬斯克會去歐洲找代工廠的主要原因。”
胡德波說,和馬斯克造火箭的經(jīng)歷類似,開普勒團(tuán)隊研究行星滾柱絲杠方案同樣是從研究相關(guān)文獻(xiàn)和技術(shù)資料開始。
“此前國內(nèi)更關(guān)注的是滾柱絲杠的機械設(shè)計,沒有完整的執(zhí)行器設(shè)計方案,我們參考國外資料,從0到1設(shè)計了整個執(zhí)行器和加工工藝,之后是打樣、組裝、測試、改進(jìn),在應(yīng)用到人形機器人身上之前,我們這一方案來來回回改了很多版。”
2023年11月17日,開普勒先行者系列人形機器人正式對外發(fā)布,其搭載的行星滾柱絲杠執(zhí)行器和旋轉(zhuǎn)型執(zhí)行器分別用于控制機器人的肌肉群和關(guān)節(jié),前者峰值推力達(dá)到了8000N,后者峰值扭矩達(dá)到了200N.m。
在外界看來,開普勒只是這一年眾多快速拉起團(tuán)隊、立項出產(chǎn)品的創(chuàng)業(yè)公司中的一員,實際上,這時面世的開普勒人形機器人已經(jīng)經(jīng)歷了三年研發(fā)、四次迭代,是一款被寄予量產(chǎn)希望的人形機器人產(chǎn)品。
更重要的是,這款將在今年年底量產(chǎn)的人形機器人,對外售價預(yù)計在3萬美元左右。
一個對比數(shù)據(jù)是,特斯拉預(yù)計2025年年底前開售的Optimus,售價預(yù)計在2萬美元左右。
胡德波說,“很多人對特斯拉的人形機器人感興趣,但特斯拉的人形機器人不對外開放,我們機器人和其上搭載的開普勒星云軟件平臺秉持對外開放戰(zhàn)略,玩不到特斯拉擎天柱的人可以玩我們的人形機器人。”
不過,胡德波也坦言,“現(xiàn)在的人形機器人離人類期望,仍有一定的距離。”
03 造船業(yè)亟需人形機器人
2011年3月11日,日本發(fā)生了有史以來最強地震,在這場9級地震中,福島第一核電站發(fā)生泄漏,這場震驚全球的核泄漏事故發(fā)生后,一些人形機器人陸續(xù)被派往福島執(zhí)行救災(zāi)任務(wù)。
然而,在這場災(zāi)難中,人形機器人并沒能如眾人期望那樣起到作用。
這讓人形機器人產(chǎn)業(yè)遭遇到一次廣泛的質(zhì)疑。
胡德波告訴科技行者,“實際上,即便是現(xiàn)在再遇到這樣的情況,也沒有哪一款人形機器人能真正派上用場,依然需要靠無人機或小車+機械臂這樣的專用機器人來解決問題。”
“人形機器人的干活能力還處于逐漸落地階段,今年會有一些機器人團(tuán)隊能夠進(jìn)入到實驗室測試階段,開始在實驗室搭建的測試場景中進(jìn)行早期測試(還不是真正的POC)。”
在這個階段中,人形機器人產(chǎn)業(yè)缺的不是場景,而是能力,是替代人類干活的能力。
據(jù)胡德波透露,“現(xiàn)在開普勒陸續(xù)接到了來自各行各業(yè)的各種需求,很多企業(yè)恨不得立刻就能將我們的人形機器人部署到他們的崗位上去用。”
這其中,令胡德波印象深刻的一個應(yīng)用需求來自船舶制造業(yè)。
船舶制造業(yè)是一個歷史久遠(yuǎn)的傳統(tǒng)行業(yè),也是一個工作環(huán)境相當(dāng)惡劣的行業(yè),在大型船舶制造過程中,需要工人對船體進(jìn)行焊接、打磨,在這個環(huán)境中,工人需要穿上特制的工作服、戴上面具,工作兩個小時就渾身是汗、需要換人輪班,如果換用自動化設(shè)備,動輒數(shù)千萬的設(shè)備定制投入又遠(yuǎn)沒有人工劃算。
在這一場景中,2-3萬美元的人形機器人就變得很劃算。
實際上,開普勒的人形機器人將在今年與全球客戶進(jìn)行聯(lián)合測試,胡德波告訴科技行者,“我們會在今年8月與一家日本物流企業(yè)進(jìn)行聯(lián)合測試,屆時,我們的人形機器人會在他們參照實際物流場景搭建的幾百平方米的實地模擬場景中進(jìn)行現(xiàn)場測試。”
開普勒的人形機器人如果能夠順利通過這個模擬環(huán)境測試,雙方將會進(jìn)一步規(guī)劃在真實倉儲環(huán)境中的測試、部署的計劃,進(jìn)入到真正的POC階段。屆時,將會有百臺人形機器人進(jìn)行集中部署,會測試出一臺人形機器人究竟能替代幾個人,算出人形機器人在這一場景中真正的ROI是多少。
不過,胡德波也坦言,“真正的POC階段,至少要到明年才能做。”
在此之前,胡德波為自己的人形機器人規(guī)劃好了四大應(yīng)用場景,分別是智能制造、倉儲物流、特種行業(yè)和科研教育。
開普勒的目標(biāo)是先在全球與一些頂級大客戶進(jìn)行合作,在典型應(yīng)用場景中,針對客戶實際應(yīng)用場景需求做端到端的方案落地,之后再在全球與自動化方案集成商合作,通過這些集成商將人形機器人做到自動化解決方案中,實現(xiàn)全球規(guī)模化部署。
這是胡德波為開普勒規(guī)劃的發(fā)展路線,他告訴我們,“歐美和中國的自動化方案集成商模式都已經(jīng)很成熟,工廠通常不會直接買一臺機械臂,而是通過自動化方案集成商買一整套自動化解決方案,在工廠中進(jìn)行完整的產(chǎn)線部署。”
當(dāng)然,這是開普勒的一條長期發(fā)展路線,據(jù)胡德波估算,如果一切順利的話,開普勒預(yù)計會在2025年開始嘗試與一些技術(shù)能力較強的自動化方案集成商合作。
04 讓人形機器人先“跑起來”
2023年,就在生成式AI技術(shù)發(fā)展如火如荼時,斯坦福在一篇論文中構(gòu)建了一個名為Smallville的虛擬小鎮(zhèn),在這個小鎮(zhèn)上,生活著25個AI智能體,這些AI智能體可以有自己的工作、生活、社交,是基于虛擬世界的一個完全自治的烏托邦。
斯坦福的虛擬小鎮(zhèn)將關(guān)于AI智能體的研究推上了一個高潮。
關(guān)于人形機器人的發(fā)展,同樣需要類似的“機器人小鎮(zhèn)”的構(gòu)想,與研究AI智能體的虛擬小鎮(zhèn)不同的是,“機器人小鎮(zhèn)”是進(jìn)行數(shù)據(jù)采集的一個絕佳場景。
人形機器人這波熱潮,除了馬斯克的入局外,另一個重要推動因素是人工智能技術(shù)的進(jìn)步,尤其是生成式AI技術(shù)的突破,讓通用人形機器人的研發(fā)成為了可能。
各種AI模型構(gòu)成了人形機器人的大腦,而對于生成式AI模型、大模型而言,數(shù)據(jù)至關(guān)重要。
胡德波認(rèn)為,通用人工智能技術(shù)與人形機器人必然會走向融合,而通用人工智能技術(shù)企業(yè)與人形機器人企業(yè)未來也會走向更廣泛的合作。
他指出,目前OpenAI與Figure的合作可以讓他們自己訓(xùn)練出的機器人大模型能夠有人形機器人可用,通過Figure進(jìn)行大模型的技術(shù)測試和落地,但要想做真正的具身智能,OpenAI的機器人大模型就需要適配所有主流人形機器人架構(gòu),通過這些不同架構(gòu)的人形機器人采集數(shù)據(jù),測試和訓(xùn)練他們的大模型。
“只有本體構(gòu)型越多樣,采集的數(shù)據(jù)越多,訓(xùn)練出的機器人大模型效果才會越好。”
胡德波告訴科技行者,“我們目前正在和幾家主流大模型廠商洽談合作,希望可以盡早地參與到全球具身智能這一戰(zhàn)場中。”
不過,胡德波更強調(diào)的依然是人形機器人商用落地,而開普勒人形機器人早期落地,更依賴的是端側(cè)小模型。
在人形機器人本體趨于穩(wěn)定后,今年下半年,開普勒人形機器人將會進(jìn)行小批量量產(chǎn),屆時,開普勒將會有幾百臺人形機器人陸續(xù)進(jìn)入全球市場。
至于人形機器人的ChatGPT時刻何時到來,胡德波認(rèn)為,“這只是時間和數(shù)據(jù)的問題。”
當(dāng)人形機器人相關(guān)數(shù)據(jù)積累得足夠多,具身智能大模型將會迎來ChatGPT時刻,那時,人形機器人的泛化能力和通用性將會得到一次巨大的提升。
好文章,需要你的鼓勵
這項研究提出了"高效探測"方法,解決了掩碼圖像建模AI難以有效評估的問題。通過創(chuàng)新的多查詢交叉注意力機制,該方法在減少90%參數(shù)的同時實現(xiàn)10倍速度提升,在七個基準(zhǔn)測試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質(zhì)量與分類性能的強相關(guān)性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應(yīng)性。團(tuán)隊承諾開源全部代碼,推動技術(shù)普及應(yīng)用。
伊利諾伊大學(xué)研究團(tuán)隊開發(fā)了CLAIMSPECT系統(tǒng),通過層次化分解復(fù)雜爭議、智能檢索相關(guān)文獻(xiàn)、多角度收集觀點的方法,將傳統(tǒng)的"真假"判斷轉(zhuǎn)變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動構(gòu)建爭議話題的分析框架,識別不同觀點及其支撐證據(jù),為科學(xué)和政治爭議提供更全面客觀的分析,已在生物醫(yī)學(xué)和國際關(guān)系領(lǐng)域驗證有效性。
清華大學(xué)研究團(tuán)隊首次提出情感認(rèn)知融合網(wǎng)絡(luò)(ECFN),讓AI能像人類一樣理解和表達(dá)情感。該系統(tǒng)通過多層次情感處理架構(gòu),在情感識別準(zhǔn)確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達(dá)自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實現(xiàn)了跨模態(tài)情感融合、動態(tài)情感追蹤和個性化情感建模,為醫(yī)療、教育、客服等領(lǐng)域帶來革命性應(yīng)用前景。
哈佛大學(xué)研究團(tuán)隊通過創(chuàng)新的多智能體強化學(xué)習(xí)方法,讓AI在戰(zhàn)略游戲中學(xué)會復(fù)雜推理。研究發(fā)現(xiàn)AI通過游戲競爭能發(fā)展出類人思維能力,在邏輯推理、創(chuàng)造性解決問題等方面表現(xiàn)顯著提升。這項突破性成果為未來AI在醫(yī)療、教育、城市管理等領(lǐng)域的應(yīng)用奠定基礎(chǔ),展現(xiàn)了通過模擬人類學(xué)習(xí)過程培養(yǎng)真正智能AI的新路徑。
關(guān)注智造、硬件、機器人。