作者 | 金旺
欄目 | 機器人新紀元
IDC統(tǒng)計數(shù)據(jù)顯示, 2024年中國人形機器人商用銷售出貨量約為2000臺,預計到2030年達到6萬臺。
然而,在過去一年里,具身智能產(chǎn)業(yè)發(fā)展速度,已經(jīng)遠遠超出了各大市場調(diào)研機構(gòu)的預期,從國內(nèi)智元、宇樹、優(yōu)必選等明星機器人團隊官方公布的銷售情況來看,國內(nèi)人形機器人銷量已經(jīng)突破萬臺。
就在前不久,智元機器人與全球智能產(chǎn)品ODM頭部廠商龍旗科技官宣就具身機器人在工業(yè)場景應用展開深度合作,龍旗科技向智元機器人下達數(shù)億元金額的智元精靈G2機器人框架訂單。
彼時,智元機器人的精靈G2還未正式對外發(fā)布。
據(jù)悉,在這次合作中,雙方將會部署近千臺,這也成了目前國內(nèi)工業(yè)具身機器人領域應用熱潮的真實寫照。
10月16日,智元精靈G2正式對外發(fā)布,作為智元機器人面向工業(yè)場景落地應用打造的第二代具身機器人,這代產(chǎn)品的發(fā)布,也將具身機器人商業(yè)化進程再往前推進了一步。
01 工業(yè)級標準,打造具身機器人
2025年,全球具身機器人商業(yè)化進程被按下了加速鍵。
尤其是在汽車生產(chǎn)、工業(yè)制造等場景中,在制造業(yè)企業(yè)與具身機器人團隊共同關(guān)注下,一些明星機器人產(chǎn)品率先進入車間產(chǎn)線,開始直面產(chǎn)業(yè)難題。
智元機器人是在2024年8月對外發(fā)布了五款商用人形機器人產(chǎn)品,正式開啟了自己的商業(yè)化進程,彼時的智元機器人面向柔性制造應用場景發(fā)布的遠征A2-W已經(jīng)具備高效部署與柔性作業(yè)能力,并在發(fā)布會上展示了動態(tài)任務編排、復雜任務雙臂協(xié)作。
這是智元機器人成立的第二個年頭,關(guān)于具身機器人的商業(yè)化落地路徑,智元機器人已經(jīng)有了自己的思考。
我們能夠看到的是,智元機器人在這一年構(gòu)建起了占地3000平方米的數(shù)據(jù)采集工廠,并在這一年年底,正式面向全球開源了首個基于真實場景、全能硬件平臺、全程質(zhì)量把控的百萬真機數(shù)據(jù)集AgiBot World,彌補了具身模型訓練過程中真機數(shù)據(jù)不足的短板。
而在今年7月,智元機器人與安努智能在富臨精工綿陽工廠進行了全球首次的具身機器人工業(yè)場景常態(tài)化作業(yè)直播,在三小時的直播中,智元機器人的遠征A2-W完成了兩班制、單班0失誤搬運800余個周轉(zhuǎn)箱的任務,讓整個產(chǎn)業(yè)對具身機器人商業(yè)化落地能力有了直觀的認知。
在經(jīng)過過去這一年商業(yè)化實踐和技術(shù)產(chǎn)品迭代后,智元機器人在10月16日正式對外發(fā)布了智元精靈G2。
實際上,智元機器人早在2023年11月就發(fā)布了精靈系列第一代產(chǎn)品,相較于一代產(chǎn)品,精靈G2在產(chǎn)品設計上進行了諸多升級。
例如,新一代精靈G2腰部采用更擬人的3自由度設計,可實現(xiàn)近似人類的彎腰、轉(zhuǎn)腰和側(cè)向擺動身體的能力;
手臂采用7自由度的十字腕力控手臂,搭載高精度關(guān)節(jié)扭矩傳感器,通過關(guān)節(jié)阻抗控制,可以實現(xiàn)外力感知并做出柔順反應,也讓精靈G2可觸達的運動空間遠超人類;
自主回充和雙電熱插拔換電方案,更是能夠讓精靈G2滿足工廠產(chǎn)線24小時工作節(jié)拍。
智元機器人合伙人、高級副總裁、具身業(yè)務部總裁姚卯青在接受媒體采訪時透露,“這些都是我們圍繞一代產(chǎn)品落地后、在實際部署過程中發(fā)現(xiàn)的難點和局限性做的產(chǎn)品技術(shù)能力的升級,精靈G2也更是一款以工業(yè)標準打造的具身智能機器人。”
姚卯青這里提到的“工業(yè)標準”,既包括技術(shù)應用和產(chǎn)品設計上遵循工業(yè)標準,也包括具身機器人產(chǎn)線設計上遵循工業(yè)標準。
就產(chǎn)品設計而言,為了應對工業(yè)場景中諸如插接類需要柔順控制的工作,精靈G2在機械臂的每個關(guān)節(jié)中都加入了力控傳感器,從而實現(xiàn)關(guān)節(jié)的阻抗控制。
就更具挑戰(zhàn)性的具身機器人量產(chǎn)過程中的質(zhì)量和品控來看,智元機器人以工業(yè)級為底線,按照ISO標準搭建了精靈G2的生產(chǎn)線,其中諸多零部件的測試和下線,智元機器人甚至是按照車規(guī)級標準來搭建,從而保證具身機器人產(chǎn)品的穩(wěn)定性和一致性。
正是由于精靈G2在技術(shù)、品控和作業(yè)能力上都實現(xiàn)了“工業(yè)級標準”,這代產(chǎn)品在還未發(fā)布之前,就拿到了龍旗科技數(shù)億元訂單。
在精靈G2發(fā)布當天,智元機器人與均勝集團在寧波聯(lián)合舉辦了精靈G2線下全球首發(fā)暨擴產(chǎn)儀式,并同步開啟了與均勝集團過億元采購合同的首批交付商用。
這標志著智元機器人精靈G2在工業(yè)制造和汽車零部件制造場景,拉開了工業(yè)級具身機器人商用落地的帷幕。
02 通用具身智能,技術(shù)實現(xiàn)路徑
早在2023年具身智能熱潮興起之前,人形機器人就已經(jīng)是科技領域備受關(guān)注的話題,彼時人形機器人領域的明星團隊是波士頓動力,憑借超高的性能和各種復雜動作完成度,波士頓動力成了人形機器人領域的一代網(wǎng)紅。
然而,相較于線上的高活躍度,商業(yè)化卻始終是波士頓動力企業(yè)發(fā)展的瓶頸,這也使得它在過去十年里,先后輾轉(zhuǎn)被谷歌、軟銀、現(xiàn)代汽車收購。
隨著ChatGPT的問世,人工智能進入到大模型范式,人形機器人自此也被拉入到令人興奮的具身智能范式中,也是在這時,全球范圍內(nèi)迅速涌現(xiàn)出上百支具身智能團隊。
在過去這兩年,在這波具身智能浪潮中,我們看到了,人形機器人學會了唱歌跳舞、學會了后空翻,甚至跑完了半程馬拉松。
在這個過程中,人形機器人的性能得到了極大的提升。
就在前不久,美國人形機器人明星團隊Figure發(fā)布了他們的第三代人形機器人,在視頻演示中,這代機器人展示出了打掃衛(wèi)生、收拾房間、疊衣服、照看寵物等炫酷技能,在全球引發(fā)熱議。
姚卯青對此特別提到,“在今年機器人運動會上,人形機器人在奔跑速度上已經(jīng)達到了人類的水平,明年很有機會在奔跑速度上超過人類。”
實際上,在推動人形機器人商業(yè)落地的同時,智元機器人也在深入探索通用具身智能技術(shù)實現(xiàn)路徑。
一方面,智元機器人基于雙足人形機器人產(chǎn)品靈犀X2不斷挑戰(zhàn)人形機器人本體性能的極限,就在前不久,靈犀X2就曾因完成了高難度動作“韋伯斯特空翻”,在全網(wǎng)引發(fā)了高度關(guān)注。
另一方面,智元機器人團隊也就通用人形機器人,持續(xù)投入資源研發(fā)具身智能算法和模型。
在今年3月,智元機器人就曾對外發(fā)布通用具身基座大模型,智元啟元大模型GO-1。
這一基座大模型采用由VLM(多模態(tài)大模型)+MoE(混合專家)組成的ViLLA(Vision-Language-Latent-Action)架構(gòu),可以利用人類視頻學習,完成小樣本快速泛化,降低了具身智能門檻。
在這之后,智元機器人又在今年8月發(fā)布了首個面向真實世界機器人操控的世界模型GE-1。
不同于傳統(tǒng)采用“數(shù)據(jù)-訓練-評估”模式,GE-1將未來幀預測、策略學習與仿真評估整合到了以視頻生成為核心的閉環(huán)架構(gòu)中,使機器人在同一世界模型中完成了從看、想到動的端到端推理與執(zhí)行過程。
正是基于這樣的自研具身模型,智元機器人此次發(fā)布的精靈G2得以應對商業(yè)場景中的復雜、長程任務。
姚卯青在發(fā)布會上也對外透露,“智元機器人將會在今年晚些時候發(fā)布新一代圍繞精靈G2硬件開源的具身智能真機數(shù)據(jù)集。”
不過,姚卯青在接受媒體采訪時也特別指出,“人形機器人進化應該是從本體、數(shù)據(jù)、算法、應用,然后再回歸到本體的一個飛輪,人形機器人的發(fā)展還是要先在簡單、可控的單一作業(yè)環(huán)境中快速應用落地、不斷驗證,才能完成進化過程。”
具體到商業(yè)場景、尤其是工業(yè)場景中的應用來看,無論是從運行效率上來看,還是從實際應用價值上來看,能夠跑馬拉松、做后空翻的雙足人形機器人并不是多數(shù)環(huán)境下的最優(yōu)解,而輪式具身機器人正在成為人形機器人產(chǎn)業(yè)落地過程中的一個先行載體。
智元機器人的全新一代輪式具身機器人精靈G2,也在探索更廣泛的商業(yè)空間。
03 具身智能的中國領跑機會
近日,外媒《The Information》援引知情人士消息報道稱,由于技術(shù)問題,特斯拉已經(jīng)放棄了今年量產(chǎn)數(shù)千臺Optimus人形機器人的計劃。
與特斯拉量產(chǎn)計劃受阻形成鮮明對比的是,國內(nèi)各大人形機器人明星團隊紛紛官宣了百臺,甚至千臺人形機器人大額訂單或量產(chǎn)目標,智元機器人更是在精靈G2發(fā)布時,就已經(jīng)拿到了兩筆億級訂單。
之所以會有這樣的反差,一個主要原因是國外企業(yè)往往缺乏實際應用場景,在實驗室中進行真機驗證后的人形機器人再導入實際應用場景進行驗證時,往往在產(chǎn)品設計、控制、穩(wěn)定性上會出現(xiàn)偏差,這就造成了實際機器人產(chǎn)品無法滿足市場需求的問題。
相較而言,中國擁有廣闊的市場和海量應用場景,與此同時,在數(shù)字化進程中,正在覺醒的中國制造業(yè)也更愿意參與到前沿科技的技術(shù)投入中。
我們能夠看到的是,國內(nèi)不斷有互聯(lián)網(wǎng)、制造業(yè)企業(yè)與人形機器人團隊達成戰(zhàn)略合作,甚至親身下場用真金白銀參與到人形機器人團隊的投融資中。
作為全球智能產(chǎn)品ODM頭部廠商,龍旗科技就在今年上半年投資了智元機器人,并向智元機器人開放了平板生產(chǎn)場景,供智元機器人精靈G2做可行性驗證和產(chǎn)品的優(yōu)化改進。
正是在這樣的產(chǎn)業(yè)環(huán)境下,中國具身機器人團隊形成了自己獨有的競爭力,尤其是在具身機器人商業(yè)化落地上開始跑在全球前列。
相較于以往具身機器人新品發(fā)布會,我們也發(fā)現(xiàn),在智元機器人這次精靈G2發(fā)布會上,智元機器人并沒有過多地去講具身智能概念性話題,而是直接通過精靈G2在四類客戶場景中的實時連線,用精靈G2在汽車零部件生產(chǎn)、精密任務操作、物流包裹分揀、商業(yè)導覽和交互實際表現(xiàn),展示了精靈G2的商業(yè)應用前景。
這其中,針對精靈G2在工業(yè)場景中的應用,姚卯青為我們算了一筆經(jīng)濟賬:
“以長三角工廠中某個兩班倒的工序來看,每班次每位工人的工資在5-6K的話,外加五險一金、公司福利的話,兩班工人兩年的雇傭開支在30萬元左右,我們現(xiàn)在的精靈G2已經(jīng)完全能夠跑通這樣的ROI。”
姚卯青進一步補充道,“如此一來,就可以將人類從重復機械的工作中解放出來,投入到更有創(chuàng)造性的而工作中去。”
而如果是放在海外,無論是從用工成本,還是管理成本上來看,智元機器人的精靈G2將會有更大的成本優(yōu)勢。
實際上,據(jù)姚卯青透露,“智元機器人已經(jīng)在布局海外市場,預計明年海外市場收入占比將會達到30%左右。”
好文章,需要你的鼓勵
浙江大學團隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學、編程等任務上顯著提升推理準確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學研究團隊提出SIRI方法,通過"壓縮-擴張"交替訓練策略,成功解決了大型推理模型"話多且準確率低"的問題。實驗顯示,該方法在數(shù)學競賽題上將模型準確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓練提供了新思路。
南洋理工大學與騰訊聯(lián)合研究團隊開發(fā)出Rolling Forcing技術(shù),實現(xiàn)AI視頻實時流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學研究團隊發(fā)現(xiàn),通過讓AI模型學習解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強化學習方法訓練多個AI模型。實驗結(jié)果顯示,幾何訓練在四個空間智能測試基準上都帶來顯著提升,其中最佳模型達到49.6%準確率,超越此前最好成績。這項研究揭示了基礎幾何知識對培養(yǎng)AI空間智能的重要價值。
關(guān)注智造、硬件、機器人。