作者 | 金旺
欄目 | 機器人新紀元
2024年7月,上海發(fā)布《上海市促進工業(yè)服務(wù)業(yè)賦能產(chǎn)業(yè)升級行動方案(2024-2027年)》,大模型、人形機器人、低空經(jīng)濟成了這次《行動方案》中的關(guān)鍵詞。
僅僅兩個月后,浦東新區(qū)印發(fā)《浦東新區(qū)人形機器人產(chǎn)業(yè)高質(zhì)量發(fā)展三年行動計劃(2024-2026年)》,本就早早打造了張江機器人谷的上海浦東新區(qū),在人形機器人乘風(fēng)直上的這兩年,再次錨定人形機器人這一賽道。
實際上,張江不僅有傅利葉、智元等機器人明星企業(yè),國地共建人形機器人創(chuàng)新中心也在2024年落戶在了張江。
5月29日,在2025張江具身智能開發(fā)者大會暨國際人形機器人技能大賽上,浦東新區(qū)再次發(fā)聲,對外發(fā)布了“具身智能產(chǎn)業(yè)政策16條”。
在三大母基金的百億基金加持下,浦東新區(qū)進一步將基金支持細分到了企業(yè)成長、人才保障、模型應(yīng)用、場景示范、應(yīng)用推廣、技術(shù)創(chuàng)新等具體環(huán)節(jié)。
大會現(xiàn)場還成立了具身智能生態(tài)聯(lián)盟,發(fā)布了人形機器人產(chǎn)業(yè)標準互認計劃,這些也都是浦東新區(qū)推動人形機器人產(chǎn)業(yè)生態(tài)構(gòu)建的重要一環(huán)。
此外,大會現(xiàn)場還邀請了不少人形機器人代表企業(yè),這些企業(yè)將他們的人形機器人產(chǎn)品也都帶到了現(xiàn)場。
就人形機器人數(shù)據(jù)、硬件、商業(yè)化等關(guān)鍵問題,我們現(xiàn)場從這些企業(yè)專家那里找到了些許答案。
01 智元機器人魏強:人形機器人需要開發(fā)生態(tài)
“預(yù)計明年底,靈犀X2交付量有望接近萬臺。”
這是前不久智元機器人在發(fā)布靈犀X2時釋放出的信號,萬臺預(yù)期出貨量,也成了這一年大家對人形機器人追捧最直觀的體現(xiàn)。
我們在這次大會現(xiàn)場也看到了被智元機器人寄予厚望的這款靈犀X2。
靈犀X2全身有28個自由度、體重33.8kg,小腦控制器、域控制器、智能電源管理系統(tǒng)、核心關(guān)節(jié)模組全部由智元團隊自研,可實現(xiàn)擬人步態(tài)、復(fù)雜舞蹈、點頭搖頭等動作。
作為智元開源人形機器人靈犀X1的延續(xù),在這次大會上,智元也正式對外發(fā)布了靈犀X2全球開發(fā)者生態(tài)。
據(jù)智元機器人靈犀業(yè)務(wù)線總裁魏強稱,“行業(yè)認為今年是人形機器人的元年,但是我們覺得,在人形機器人商業(yè)化初期,我們不僅需要各行各業(yè)的參與,還需要基于二次開發(fā)平臺構(gòu)建一個完整的生態(tài)。”
據(jù)悉,靈犀開發(fā)平臺可以提供原子能力、組合技能、附件配件,以及開發(fā)工具鏈,并輔以包括社區(qū)、集成商、應(yīng)用場景的生態(tài)。
據(jù)魏強透露,“這一生態(tài)目標是面向科研教育、文旅文娛、健康康養(yǎng)等場景培訓(xùn)新的人形機器人應(yīng)用,為此,智元還會將合作伙伴中做的比較好的優(yōu)秀案例,通過智元的營銷體系推動其商業(yè)化。”
02 傅利葉顧捷:做好機器人硬件,與AI公司“大腦”連接
2025年4月11日,傅利葉正式對外發(fā)布開源人形機器人Fourier N1。
Fourier N1是傅利葉對外發(fā)布的第三款人形機器人,在此之前,傅利葉已經(jīng)對外先后發(fā)布了GR-1、GR-2兩款通用人形機器人產(chǎn)品,傅利葉此次也將兩款不同尺寸的人形機器人帶到了大會上。
實際上,傅利葉做人形機器人時間要更早。
傅利葉創(chuàng)始人兼CEO顧捷指出,“傅利葉是在2020年立項開始做人形機器人,當(dāng)時并不是從商業(yè)角度出發(fā),而是基于原來在上海交大做機器人大賽時做一套完整的機器人系統(tǒng)的想法,在這一年開始搭建人形機器人。”
等到特斯拉做人形機器人的時候,傅利葉已經(jīng)做出了自己的人形機器人原型機。
不過,顧捷認為,傅利葉的人形機器人和市面上其他機器人不同的是,更聚焦“以人為中心”。
這樣的特點與傅利葉康復(fù)機器人的基因有關(guān),傅利葉在做上肢康復(fù)機器人時,需要考慮患者的握持力量夠不夠,上肢康復(fù)機器人如何調(diào)整, 顧捷指出,“我們看到在一些場景中,人形機器人也需要與人進行交互,這些就需要人形機器人圍繞人在工作。”
這就需要人形機器人有多模態(tài)智能體的加持,傅利葉現(xiàn)在做兩項工作:
第一,做好人形機器人的硬件接口,通過與大型AI公司合作,與這些公司提供的“大腦”連接起來,實現(xiàn)智能交互。
第二,實現(xiàn)更生動的理解,包括提升多模態(tài)感知、端到端計算能力。
第三,打造長期可靠的硬件,打造醫(yī)療級、可靠、安全的人形機器人。
03 銀河通用王鶴:訓(xùn)練人形機器人,合成數(shù)據(jù)效率很高
作為成立僅兩年,累計融資達到13億元的銀河通用,是人形機器人學(xué)術(shù)派的代表企業(yè),也是仿真數(shù)據(jù)訓(xùn)練人形機器人的代表團隊。
這次,銀河通用同樣將Galbot G1帶到了大會現(xiàn)場,展示的也依然是零售取貨場景。
銀河通用創(chuàng)始人王鶴認為,端到端的VLA模型是繼LLM、VLM之后,從數(shù)字世界跨入物理世界關(guān)鍵的具身大模型,然而,數(shù)據(jù)不足是現(xiàn)在具身大模型遇到的瓶頸。
相較于主要來源于互聯(lián)網(wǎng)的LLM用到的訓(xùn)練數(shù)據(jù),VLA模型用到的動作數(shù)據(jù)目前普遍來自于真機采集數(shù)據(jù),這將受限于當(dāng)下人形機器人數(shù)量和雇傭的遙操作人員的數(shù)量。
王鶴現(xiàn)場舉的一個例子是:
類比自動駕駛,頭部車廠每天回流數(shù)據(jù)超過1億條,相較而言,特斯拉有500臺人形機器人在做數(shù)據(jù)采集,斯坦福聯(lián)合谷歌等企業(yè)采集的人形機器人數(shù)據(jù)達到了100萬條。
因而,王鶴認為,“當(dāng)下通過人形機器人真機采集的數(shù)據(jù)量遠遠無法滿足人形機器人訓(xùn)練需求,要突破數(shù)據(jù)瓶頸,就需要借助合成數(shù)據(jù)來實現(xiàn)。”
據(jù)王鶴介紹稱,銀河通用今年基于10億級合成數(shù)據(jù)做了一個端到端基礎(chǔ)大模型,基于這一模型可以實現(xiàn)不同光線環(huán)境下的零樣本泛化,這樣的模型在真實世界部署只需要少量真實數(shù)據(jù)進行對齊就能實現(xiàn)。
王鶴為此舉了另一個例子:
面對一箱礦泉水,要想讓人形機器人從左到右、從前到后依次執(zhí)行抓取任務(wù),只需要200條數(shù)據(jù)進行對齊就能實現(xiàn),這相當(dāng)于一個遙操作人員半天的工作量。
而特斯拉人形機器人執(zhí)行抓取擺放電池任務(wù),是通過40人采集月余、采集了10萬條數(shù)據(jù)才能實現(xiàn)。
“這證明了合成數(shù)據(jù)的效率可以很高。”
04 卓益得李清都:半馬是個檢驗場,讓我們明確了轉(zhuǎn)型方向
成立于2021年的卓益得,同樣作為核心企業(yè)在此次大會上展出了他們的人形機器人,我們在卓益得展臺看到了他們展出的行者二號(X02),以及仿生表情機器人。
據(jù)悉,卓益得行者二號由于采用了獨特的肌腱仿生驅(qū)動方案,整機重量只有30kg,比大多數(shù)全尺寸人形機器人都要輕上許多,運動續(xù)航能力達到了6小時,目前已經(jīng)落地在工業(yè)場景。
針對卓益得目前商業(yè)化情況,卓益得機器人創(chuàng)始人李清都介紹稱,目前卓益得聚焦兩條產(chǎn)品線,一是面向生產(chǎn)工作的雙足系列,二是面向服務(wù)生活的仿生系列。
據(jù)悉,卓益得也在將兩條產(chǎn)品線結(jié)合,進一步推出能夠擁有仿真人臉的機器人——“孿生人”,這樣的“孿生人”既可以幫助人類工作,也能夠走進服務(wù)和居家場景干活和提供情緒價值。
目前,卓益得的人形機器人此前已經(jīng)在科研教育、文旅、迎賓、輕體力勞動上落地或測試,并在同步探索物流分揀、養(yǎng)老助老等場景應(yīng)用。
值得一提的是,在今年4月于北京舉辦的人形機器人半程馬拉松上,卓益得機器人在不換電池的情況下拿到了季軍的成績。
據(jù)李清都透露,賽后團隊內(nèi)部對行者二號進行了系統(tǒng)性復(fù)盤,圍繞結(jié)構(gòu)、控制、任務(wù)能力和交互體驗幾個方面進行了一系列優(yōu)化:
在結(jié)構(gòu)可靠性方面,針對比賽中暴露出的穩(wěn)定性問題,卓益得團隊重新設(shè)計了關(guān)鍵部件,強化運動關(guān)節(jié)結(jié)構(gòu),這也是卓益得后續(xù)能在張江全地形賽中奪冠的主要原因;
在運動控制方面,卓益得團隊通過算法優(yōu)化提升了機器人行走魯棒性與能量效率,在步態(tài)更擬人化、運動穩(wěn)定性和續(xù)航能力上進行了進一步提升,這也將為后續(xù)機器人在戶外巡邏、物流配送等長續(xù)航場景打下基礎(chǔ);
在任務(wù)執(zhí)行方面,卓益得團隊為機器人新增了靈巧手和多模態(tài)導(dǎo)航,由此實現(xiàn)抓握、取物等操作,并支持復(fù)雜環(huán)境自主移動,為巡邏場景物品攜帶、物流配送精準操作奠定基礎(chǔ);
在機器人擬人化方面,卓益得團隊優(yōu)化了仿生外觀和自然步態(tài),使機器人動作更貼近人類,提升人機交互親和度。
經(jīng)過這一系列優(yōu)化,不僅解決了賽事中人形機器人暴露出的問題,也讓卓益得更明確了向?qū)嵱没律诵螜C器人方向轉(zhuǎn)型。
據(jù)悉,卓益得的短期計劃通過建立訓(xùn)練中心采集數(shù)據(jù)、優(yōu)化算法,加速量產(chǎn)準備,今年預(yù)計實現(xiàn)銷售規(guī)模的規(guī)模性增長,中長期目標是將人形機器人應(yīng)用到巡檢、物流、家庭服務(wù)等場景場景中。
05 數(shù)字華夏劉迅:基于場景化,落地人形機器人
2025年4月28日,數(shù)字華夏對外發(fā)布人形機器人星行俠P01,在這次大會上,數(shù)字華夏將這款新品帶到了現(xiàn)場。
說起來,星行俠P01是數(shù)字華夏對外發(fā)布的第三款機器人,數(shù)華夏成立于2024年3月,曾先后對外發(fā)布了擁有仿生電子皮膚的夏瀾和夏起。
據(jù)數(shù)字華夏研發(fā)中心總經(jīng)理劉迅介紹,“星行俠和我們之前發(fā)布的等人身高人形機器人夏瀾、夏起是弟弟與姐姐、哥哥的關(guān)系,這款產(chǎn)品是我們IP系列產(chǎn)品,可以進行全方位定制,包括外觀、表情、語音音色、動作、人設(shè)和知識庫,適用于企業(yè) IP 形象、品牌聯(lián)名、展會互動等多個場景。 ”
這款產(chǎn)品另一個獨特之處是具備“本體”和“飛兵”兩種模式。
劉迅告訴我們,“目前還沒有哪家企業(yè)敢說自己的人形機器人在公開環(huán)境可以自由行走且不會摔倒,現(xiàn)在人形機器人僅憑雙足行走穩(wěn)定性在90%左右,這是我們做‘飛兵’模式的根本原因。”
此外,針對這一模式的研發(fā)設(shè)計,劉迅也告訴我們,數(shù)字華夏有如下兩點考慮:
第一,飛兵模式和星行俠整體酷酷的小孩外形契合度比較高,毫無違和感,且續(xù)航能力更長,最高可達到10小時續(xù)航;
第二,我們是面向B2C客戶,客戶買了這款產(chǎn)品可以根據(jù)不同場景選擇是采用雙足模式行走,還是通過飛兵模式運行。
例如針對巡展演示,如果是想炫技,就可以用本體雙足行走,如果是100%不能摔倒的演示場景,就需要用飛兵模式。
至于商業(yè)化,數(shù)字華夏將商業(yè)零售、展廳展覽、文體文娛、科研教育設(shè)定為星行俠率先落地的應(yīng)用場景,在落地過程中更關(guān)注的是星行俠場景化能力和為企業(yè)帶來的ROI。
例如在酒店場景,星行俠可以作為酒店前臺,也可以作為VIP客戶的專屬服務(wù)機器人。
相較于當(dāng)下酒店已有的服務(wù)機器人,劉迅告訴我們,“這款機器人擁有全自由度的靈巧手,可以為VIP客戶端茶倒水,也可以徒手按電梯來在商用辦公樓的不同樓層送東西,再加上端到端的大模型,場景化應(yīng)用會有更大的想象力。”
值得關(guān)注的是,當(dāng)下服務(wù)機器人已經(jīng)通過梯控模塊實現(xiàn)上下電梯,對此,劉迅告訴我們,“星行俠也實現(xiàn)了通過梯控模塊直接控制電梯,不過,這種方案更適合擁有一整棟辦公樓的大型企業(yè),但如果是一棟綜合商用辦公樓,如何和多個業(yè)主商談并達成一致會是一個現(xiàn)實問題難題,而通過靈巧手按電梯就不存在這個問題。”
據(jù)劉迅透露,“星行俠的靈巧手按電梯的識別率已經(jīng)做到了90%以上,雖然還沒達到兩個9(99%)、三個9(99.9%),但是在針對按電梯沒按中的情況,只需要再重新執(zhí)行一次任務(wù)操作就能完成。”
實際上,數(shù)字華夏也有考慮過通過指尖觸覺傳感器來靈巧手在類似場景的識別率,然而由于帶有觸覺傳感器的靈巧手普遍還在萬元左右,而數(shù)字華夏這款今年預(yù)期交付1000臺的星行俠P01目前預(yù)售價格是19.8萬元,最終是希望做到10萬元左右。
正是基于成本考慮,數(shù)字華夏目前還沒有在星行俠上采用指尖觸覺傳感器方案。
好文章,需要你的鼓勵
這項研究提出了"高效探測"方法,解決了掩碼圖像建模AI難以有效評估的問題。通過創(chuàng)新的多查詢交叉注意力機制,該方法在減少90%參數(shù)的同時實現(xiàn)10倍速度提升,在七個基準測試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質(zhì)量與分類性能的強相關(guān)性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應(yīng)性。團隊承諾開源全部代碼,推動技術(shù)普及應(yīng)用。
伊利諾伊大學(xué)研究團隊開發(fā)了CLAIMSPECT系統(tǒng),通過層次化分解復(fù)雜爭議、智能檢索相關(guān)文獻、多角度收集觀點的方法,將傳統(tǒng)的"真假"判斷轉(zhuǎn)變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動構(gòu)建爭議話題的分析框架,識別不同觀點及其支撐證據(jù),為科學(xué)和政治爭議提供更全面客觀的分析,已在生物醫(yī)學(xué)和國際關(guān)系領(lǐng)域驗證有效性。
清華大學(xué)研究團隊首次提出情感認知融合網(wǎng)絡(luò)(ECFN),讓AI能像人類一樣理解和表達情感。該系統(tǒng)通過多層次情感處理架構(gòu),在情感識別準確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實現(xiàn)了跨模態(tài)情感融合、動態(tài)情感追蹤和個性化情感建模,為醫(yī)療、教育、客服等領(lǐng)域帶來革命性應(yīng)用前景。
哈佛大學(xué)研究團隊通過創(chuàng)新的多智能體強化學(xué)習(xí)方法,讓AI在戰(zhàn)略游戲中學(xué)會復(fù)雜推理。研究發(fā)現(xiàn)AI通過游戲競爭能發(fā)展出類人思維能力,在邏輯推理、創(chuàng)造性解決問題等方面表現(xiàn)顯著提升。這項突破性成果為未來AI在醫(yī)療、教育、城市管理等領(lǐng)域的應(yīng)用奠定基礎(chǔ),展現(xiàn)了通過模擬人類學(xué)習(xí)過程培養(yǎng)真正智能AI的新路徑。
關(guān)注智造、硬件、機器人。