

作者| 金旺
欄目| 機器人新紀元
2024年世界機器人大會上,優(yōu)必選首次展示了“人形機器人工業(yè)場景解決方案”。這是優(yōu)必選研發(fā)人形機器人第12個年頭。
這一年,人形機器人火爆全球,作為人形機器人第一股,優(yōu)必選也動作頗多。
2024年4月27日,優(yōu)必選作為三大持股企業(yè)之一的北京具身智能機器人創(chuàng)新中心,發(fā)布了全球首個純電驅擬人奔跑的全尺寸人形機器人“天工”,能以6公里/小時的速度穩(wěn)定奔跑。
緊接著,優(yōu)必選在北京經開區(qū)成立了人形機器人總部。
這一年,人形機器人進工廠成為主流趨勢,優(yōu)必選與東風柳汽、吉利汽車、一汽紅旗、一汽-大眾青島分公司、奧迪一汽等多家車廠達成合作。面向工業(yè)場景的Walker S系列人形機器人開始進入到汽車工廠實訓,執(zhí)行分揀、搬運、質檢等任務。
據(jù)優(yōu)必選科技副總裁、研究院執(zhí)行院長焦繼超透露,“優(yōu)必選人形機器人現(xiàn)在已經在多個汽車工廠進入到了實訓驗證階段,其中,Walker S Lite已經在極氪5G智慧工廠連續(xù)21天協(xié)同員工執(zhí)行搬運任務。”
2024年,在全球供應鏈面臨再整合趨勢下,人形機器人進工廠實訓成了中國高端制造業(yè)的長期主義。
01 人形機器人“三步走”進工廠
過去一年是優(yōu)必選最忙碌的一年,也是優(yōu)必選工業(yè)人形機器人最為忙碌的一年。
2023年11月2日,工信部印發(fā)《人形機器人創(chuàng)新發(fā)展指導意見》,意見中指出:
“要聚焦3C、汽車等制造業(yè)重點領域,提升人形機器人工具操作與任務執(zhí)行能力,打造人形機器人示范產線和工廠,在典型制造場景實現(xiàn)深度應用。
面向結構化制造業(yè)環(huán)節(jié),推動人形機器人在裝配、轉運、檢測、維護等工序的應用和推廣,面向非結構化生產制造環(huán)節(jié),加強人形機器人與設備、人員、環(huán)境寫作交互能力,支持柔性化、定制化生產制造。”
這樣的指導意見,為人形機器人產業(yè)落地指明了方向。
實際上,在此之前,在人形機器人領域已經深耕十多年的優(yōu)必選,面對這波全球人形機器人熱潮,已經悄悄展開產業(yè)調研,在200多天調研了20多家新能源汽車、3C電子等智能制造企業(yè)后,他們看到了人形機器人在汽車工廠落地的確定性機會。

據(jù)焦繼超介紹,汽車制造業(yè)是自動化程度最高的產業(yè),但即便是這樣一個產業(yè),仍然需要大量的人力。
汽車工廠分為四大工藝流程,分別是沖壓、焊裝、涂裝、總裝,在前三個流程中,工業(yè)機械臂、AGV等工業(yè)機器人已經能夠從事大量重復性工作,但在汽車總裝線上,依然存在一些諸如物料分揀、線速組裝、氣體檢測等工作,或是高溫環(huán)境、或存在有害氣體,對人類存在一定的危害性。
一方面,汽車總裝工廠中存在亟需機器人的工作崗位,另一方面,汽車產業(yè)每年都面臨著大量用工缺口。
據(jù)人社部、工信部、教育部聯(lián)合發(fā)布的《制造業(yè)人工發(fā)展規(guī)劃指南》中給出的預測數(shù)據(jù)顯示,到2025年,中國制造業(yè)工業(yè)缺口將接近3000萬人,其中新能源汽車產業(yè)人才缺口將達到103萬人。
實際上,隨著國內新能源汽車產業(yè)逐漸成熟、產能持續(xù)攀升,不少新能源汽車企已經開始面臨缺工少工問題,由于工作環(huán)境惡劣,不少汽車工廠工人流失率高,長期處于不滿工狀態(tài)。
這些原本由工人操作的非結構化環(huán)境中的工作,又很難通過傳統(tǒng)工業(yè)機器人來滿足需求。
于是,汽車產業(yè)也成了最有動力接觸人形機器人的產業(yè)。
據(jù)焦繼超透露,早在2023年,就陸續(xù)有車企帶著真實需求找到優(yōu)必選,希望優(yōu)必選能為他們提供人形機器人解決方案。
實際上,優(yōu)必選工業(yè)版人形機器人Walker S也是在2023年開始陸續(xù)進入汽車產業(yè),與車企進行聯(lián)合實訓驗證。
通過在真實的工廠環(huán)境中進行實訓,人形機器人可以在實際任務環(huán)節(jié)收集數(shù)據(jù),了解企業(yè)的生產需求,完成自我迭代升級,為正式的工業(yè)應用做準備。
同時,實訓允許人形機器人面對實際生產中可能遇到的各種非標準情況,從而提高其適應性和泛化能力。在實訓過程中遇到的挑戰(zhàn),可以激發(fā)高動態(tài)運動控制技術、緊湊化一體化關節(jié)設計、智能化與自主化的場景感知與任務規(guī)劃等關鍵技術的突破。
例如針對工廠的分揀、零件安裝等任務,優(yōu)必選迭代了多模態(tài)大模型的模型架構,實現(xiàn)更強的多模態(tài)感知與認知能力,讓人形機器人可以識別場景與地圖并選擇導航的最優(yōu)路徑。
此外,通過深入整合運動控制技術,人形機器人可以更加準確的執(zhí)行抓取動作。

隨著汽車產業(yè)智能化、電動化轉型的加速,消費端對于汽車產品的個性化、定制化需求越來越高,行業(yè)競爭的不斷加劇,迫使整車功能越來越復雜,產品更新?lián)Q代越來越快,生命周期越來越短,而產品開發(fā)及生命周期的縮短,也要求更加快速敏捷的交付。
在汽車制造過程中應用人形機器人,不僅可以替代人機工程差的作業(yè),將工人從危險、重復、價值低的工作中解放出來,也能降低因為人工裝配對產品設計的限制,提高設計自由度,滿足市場端更加定制化、個性化的需求。
在真實造車環(huán)境中部署應用人形機器人,能夠不斷積累全要素生產數(shù)據(jù),利用AI技術感知、學習、迭代,實現(xiàn)智能化管理閉環(huán),基于人形機器人具身智能的自主學習能力,可以快速適應新任務要求,在制造場景中提供敏捷部署,助力實現(xiàn)整車產品的高質量、敏捷交付。
不過,優(yōu)必選科技首席品牌官譚旻解釋稱,“目前的人形機器人發(fā)展依然處于早期階段,尤其是在面對工業(yè)場景落地時,工廠中的實訓驗證往往需要12-24個月。”
為此,將工業(yè)作為人形機器人三大應用場景之一的優(yōu)必選,針對人形機器人在工業(yè)場景中的應用制定了三個階段發(fā)展戰(zhàn)略:
第一階段(2023年-2024年),以新能源汽車制造場景作為人形機器人在工業(yè)場景的切入點,實現(xiàn)人形機器人在搬運、物料分揀等工業(yè)場景中的測試,不斷完善硬件的穩(wěn)定性和可靠性;
第二階段(2025年-2027年),優(yōu)必選人形機器人將逐步拓展至中等難度任務,重點打造3-5個專用場景下的應用,隨著大規(guī)模的落地應用,不斷提升產品的性能,逐漸實現(xiàn)規(guī)模商業(yè)化,不斷降低人形機器人的成本,并橫向拓展至消費電子制造業(yè)等其它行業(yè)及應用場景;
第三階段(2028年-2033年),優(yōu)必選人形機器人將進一步拓展到較為復雜的任務場景,具備超過10+種技能,成為多任務通用型工業(yè)人形機器人。
在這個發(fā)展過程中,人工智能技術的發(fā)展和突破,同樣對優(yōu)必選人形機器人升級迭代起著關鍵作用。
02 10倍速培養(yǎng)工業(yè)人形機器人
在ChatGPT面世之前,優(yōu)必選曾有過這樣一個判斷:
人工智能技術的突破,對于人形機器人發(fā)展將會帶來10倍速的提速。
譚旻解釋稱,“原本在我們規(guī)劃中10年才能完成的事情,因為人工智能技術的突破,可能一年就完成了。”
當以ChatGPT為代表的新一代人工智能技術爆發(fā)后,具身智能熱潮隨之而來,優(yōu)必選在2023年也快速對具身智能技術體系框架進行了論證,并將具身智能拆分為大腦、小腦、肢體幾個維度。
焦繼超告訴我們,在這套技術框架中:
“大腦主要完成完成動態(tài)感知和任務規(guī)劃,小腦主要完成包括步態(tài)、靈巧操作在內的運動控制,更重要的是,優(yōu)必選早在2021年就打造了用于訓練人形機器人的仿真系統(tǒng),很早就實現(xiàn)了Real2Sim和Sim2Real的閉環(huán)。”

就大腦而言,工業(yè)場景中很少用到語音交互,大部分工業(yè)中的交互已經被寫入了流程自動化中,人形機器人進入工廠時,反而對機器人的決策能力有較高的需求。
現(xiàn)在的工業(yè)場景如果某個流程中間有一個環(huán)節(jié)缺失或中斷,基于傳統(tǒng)自動化的工廠解決方案中,后續(xù)流程就無法再向下進行。
基于多模態(tài)大模型的人形機器人,由于具備了一些基礎常識,在某個環(huán)節(jié)缺失或中斷后,人形機器人可以自主決策進入到上一個流程。
因而,在工業(yè)場景中,更需要的往往不是語言大模型,而是操作大模型。
正是基于這樣的思考,焦繼超告訴我們,“優(yōu)必選基于以往積累的大量數(shù)據(jù),通過組合微調形成的小模型,已經能夠在邊緣側為人形機器人提供一定的決策能力。”
針對不同工業(yè)場景任務需求,優(yōu)必選又融合了強化學習、模仿學習,開發(fā)訓練了具身小腦,通過學習型運動控制技術提高人形機器人控制的魯棒性。

此外,優(yōu)必選還自研了3D語義地圖,用以提升機器人的自主導航和場景理解能力。
據(jù)焦繼超透露,人形機器人在工業(yè)場景目前的典型操作任務分為六類:智能搬運、智能質檢、過程材料操作、螺絲擰緊、零件安裝、SPS分揀。
在WRC 2024現(xiàn)場,優(yōu)必選也首次展出了他們的人形機器人工業(yè)場景解決方案——通過現(xiàn)場布設了一條工廠流水線模擬環(huán)境,演示了優(yōu)必選Walker S系列工業(yè)人形機器人在智能搬運、智能分揀、智能質檢等任務實操能力。

據(jù)現(xiàn)場工作人員介紹,Walker S在執(zhí)行搬運任務時,會先構建周圍環(huán)境的3D語義地圖,以復雜環(huán)境中的精準導航與避障,通過視覺識別和模仿學習,機器人能識別并處理多種箱子,并通過變導納控制技術確保夾抱力穩(wěn)定精細。
在搬運過程中,Walker S能夠將零部件箱從倉庫地板搬運至傳送帶,并實時記錄數(shù)據(jù),與智慧工廠倉庫系統(tǒng)無縫對接,提升任務執(zhí)行透明度與效率。
03 優(yōu)必選沒有價格焦慮
隨著人形機器人、具身智能概念火爆全球,國內涌現(xiàn)出了諸多人形機器人團隊,僅僅是在WRC 2024上,就有27款人形機器人亮相。
也正是在越來越多人形機器人團隊涌入這一賽道時,人形機器人開始卷向價格。
當被問及如何看待當下人形機器人價格內卷時,譚旻告訴我們:
“從全球人形機器人行業(yè)來看,在發(fā)展的初期階段,成本一定不是科技公司的核心競爭力,人形機器人作為繼計算機、智能手機、新能源汽車后,又一個萬億級規(guī)模產業(yè),在還沒有實現(xiàn)全球規(guī)模性商業(yè)化之前,要比拼的一定不是價格。
真正能在工業(yè)場景中應用、能在工業(yè)場景中產生價值才是機器人公司的核心競爭力,這也是這么多車企會選擇與優(yōu)必選合作的原因。”
焦繼超說,“車廠有自己對硬件行業(yè)客觀規(guī)律的清醒認識,所以我們去聊合作的時候,他們不會要求一定要很低的價格才能買,因為既能滿足他的要求又價格很低,是無法實現(xiàn)的。”
據(jù)優(yōu)必選官方透露,優(yōu)必選已經在與包括東風柳汽、吉利汽車、一汽紅旗、一汽-大眾青島分公司、奧迪一汽等多家車企合作,優(yōu)必選的工業(yè)版人形機器人也正在陸續(xù)進入車企工廠,開始驗證物料分揀、貨物搬運、質量檢測任務的執(zhí)行能力。
譚旻認為,這些車企之所以會選擇和優(yōu)必選合作,是因為優(yōu)必選深耕人形機器人12年,不僅是全球人形機器人專利擁有數(shù)量最多的企業(yè),而且優(yōu)必選的人形機器人已經在多個場景中應用落地并持續(xù)提供服務。
“車企很重視機器人的穩(wěn)定性和可靠性。我們的人形機器人曾經在迪拜世博會中國館連續(xù)穩(wěn)定工作過6個月,在中國科技館也已經連續(xù)穩(wěn)定服務了有兩年之久,在這個過程中,優(yōu)必選人形機器人完成了從實驗室到商業(yè)化場景0到0.1階段,這在全球也是屈指可數(shù)的。
下一站是工業(yè)場景的商業(yè)化,要完成從0.1到1的部分。目前優(yōu)必選工業(yè)版人形機器人已經獲得車企超過500臺的意向訂單。”
實際上,當下全球供應鏈正在經歷著又一次整合和重塑,在這次全球供應鏈整合中,中國如何發(fā)展好高端制造業(yè)、在全球供應鏈中繼續(xù)發(fā)揮重要作用就成了。
焦繼超說,“現(xiàn)在人形機器人還處于早期發(fā)展階段,真正令我們感到焦慮的是,技術需要快速迭代,以滿足工業(yè)場景的真實需求。”
不過,在和諸多車企展開深入合作后,焦繼超發(fā)現(xiàn),優(yōu)必選和很多車企有了一個共識——人形機器人雖然不是現(xiàn)在工業(yè)場景唯一的選擇,但最終的形態(tài)將會是人形機器人。
好文章,需要你的鼓勵
浙江大學團隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調整內部專家配置。該方法在數(shù)學、編程等任務上顯著提升推理準確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學研究團隊提出SIRI方法,通過"壓縮-擴張"交替訓練策略,成功解決了大型推理模型"話多且準確率低"的問題。實驗顯示,該方法在數(shù)學競賽題上將模型準確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓練提供了新思路。
南洋理工大學與騰訊聯(lián)合研究團隊開發(fā)出Rolling Forcing技術,實現(xiàn)AI視頻實時流式生成的重大突破。該技術通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質量視頻,延遲僅0.76秒,質量漂移指標從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內容創(chuàng)作開辟新可能。
華中科技大學研究團隊發(fā)現(xiàn),通過讓AI模型學習解決幾何問題,能夠顯著提升其空間理解能力。他們構建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強化學習方法訓練多個AI模型。實驗結果顯示,幾何訓練在四個空間智能測試基準上都帶來顯著提升,其中最佳模型達到49.6%準確率,超越此前最好成績。這項研究揭示了基礎幾何知識對培養(yǎng)AI空間智能的重要價值。
關注智造、硬件、機器人。