作者 | 金旺
欄目 | 機(jī)器人新紀(jì)元
如果要問:人形機(jī)器人率先會(huì)在哪個(gè)場景落地應(yīng)用?
相信大部分人會(huì)給出同樣的答案:工業(yè)。
畢竟,作為人形機(jī)器人這波浪潮的始作俑者,特斯拉創(chuàng)始人馬斯克研發(fā)人形機(jī)器人的目標(biāo)就是要在特斯拉汽車工廠中應(yīng)用。
于是,在具身智能成為一個(gè)確定性趨勢后,上海工博會(huì)也成了人形機(jī)器人的練兵場,這當(dāng)然也包括英特爾的展臺。
我們在工博會(huì)英特爾展開上看到了人形機(jī)器人做搬運(yùn),也看到了人形機(jī)器人打螺絲,而當(dāng)我們向遠(yuǎn)道而來的英特爾邊緣計(jì)算事業(yè)部工業(yè)與機(jī)器人團(tuán)隊(duì)市場拓展總經(jīng)理Ricky Watts問及:具身機(jī)器人會(huì)否成為繼PC、手機(jī)后下一個(gè)個(gè)人計(jì)算時(shí)代的關(guān)鍵載體?
Ricky Watts告訴我們,“在這場技術(shù)旅程中,下一個(gè)時(shí)代將會(huì)屬于人形機(jī)器人。”
01 大小腦融合的具身思路
2025年4月,在2025英特爾具身智能解決方案推介會(huì)上,英特爾正式對外發(fā)布了具身智能大小腦融合方案。
大小腦融合方案是英特爾基于異構(gòu)算力在具身領(lǐng)域的一次嘗試,這次嘗試的關(guān)鍵是英特爾酷睿Ultra處理器。
和英特爾以往處理器不同的是,2023年首次面世的酷睿Ultra處理器,更應(yīng)該被視為一顆采用了混合集成架構(gòu)的SoC,內(nèi)置了CPU、GPU、NPU協(xié)同運(yùn)行,瞄準(zhǔn)的正是端側(cè)AI市場。
這里的端側(cè)AI,既包括英特爾過往擁有絕對霸主地位的AI PC市場,也包括與AI PC一同興起的具身智能市場。
據(jù)英特爾官方指出,在具身智能應(yīng)用中,酷睿Ultra內(nèi)置的不同處理器有著不同分工:
CPU適合運(yùn)行復(fù)雜的運(yùn)動(dòng)控制、運(yùn)動(dòng)規(guī)劃、傳感器數(shù)據(jù)處理、SLAM導(dǎo)航避障運(yùn)算;
GPU適合運(yùn)行大型AI模型的推理,例如具身機(jī)器人系統(tǒng)中的環(huán)境感知、任務(wù)識別、任務(wù)規(guī)劃,以及端到端大模型推理;
NPU則適合小型AI模型推理,例如具身機(jī)器人系統(tǒng)中的語音識別、實(shí)時(shí)視覺處理、傳感器數(shù)據(jù)分析等AI任務(wù)。
這樣的分工協(xié)作,正是英特爾提出的大小腦融合方案的基本思路。
具體到英特爾在具身智能領(lǐng)域的布局,在今年工博會(huì)期間的英特爾工業(yè)AI與具身智能生態(tài)大會(huì)上,我們看到了英特爾在硬件、軟件、標(biāo)準(zhǔn)三個(gè)方面的布局。
就硬件而言,英特爾酷睿Ultra第三代產(chǎn)品已經(jīng)在規(guī)劃中,據(jù)英特爾技術(shù)專家介紹:
2023年,英特爾推出酷睿Ultra 100系列處理器,提供至高36TOPS的AI算力;
2024年,英特爾又推出了酷睿Ultra 200系列處理器,提供至高111TOPS的AI算力;
預(yù)計(jì)今年年底或明年年初,英特爾將會(huì)推出酷睿Ultra 300系列處理器,提供至高180+TOPS的AI算力。
這是英特爾在硬件上的算力規(guī)劃。
據(jù)悉,目前具身機(jī)器人普遍配備的正是100TOPS左右的AI算力,與此同時(shí),具身機(jī)器人對端側(cè)AI算力正在提出更高的需求。
我們在工博會(huì)英特爾的展臺上,也看到了基于英特爾酷睿Ultra處理器的具身智能控制器,以及AI工控機(jī)產(chǎn)品。
軟件方面,英特爾構(gòu)建了一整套具身智能軟件開發(fā)套件。
既包括底層系統(tǒng)、驅(qū)動(dòng)、外設(shè)SDK配置、確保實(shí)時(shí)性的固件,也包括加速軟件庫和框架、英特爾oneAPI編譯器和函數(shù)庫、英特爾實(shí)時(shí)優(yōu)化工具,還包括視覺模組、操作類、運(yùn)動(dòng)類、SLAM、大模型在內(nèi)的算法和示例。
英特爾技術(shù)專家特別指出,就具身智能的控制而言,確定性實(shí)時(shí)尤為重要,而要將大腦AI部分與控制結(jié)合在一起,既能保證實(shí)時(shí)任務(wù)的確定性,又能保證非實(shí)時(shí)任務(wù)處理時(shí)最大化發(fā)揮GPU的推理能力,底層系統(tǒng)配置就極為關(guān)鍵。
此外,英特爾在此次生態(tài)大會(huì)上還對外介紹了英特爾在具身智能硬件標(biāo)準(zhǔn)上的摸索——開放式機(jī)器人系統(tǒng)《ORS規(guī)范》,包括電氣規(guī)范、接口規(guī)范、機(jī)械規(guī)范三部分。
值得一提的是,英特爾在機(jī)器人領(lǐng)域布局已久,早在工業(yè)機(jī)器人風(fēng)靡全球并在改進(jìn)工業(yè)生產(chǎn)流程時(shí),英特爾就深度參與到了工業(yè)機(jī)器人的控制流程中。
正因如此,英特爾中國邊緣計(jì)算事業(yè)部行業(yè)解決方案總經(jīng)理李巖就指出:
“基于英特爾X86計(jì)算平臺的運(yùn)動(dòng)控制方案在工業(yè)自動(dòng)化領(lǐng)域已經(jīng)做了幾十年了,英特爾和倍福這樣的大客戶在歷史上有過充分的合作,我們在軟PLC和運(yùn)動(dòng)控制效能表現(xiàn)上可以調(diào)整到很好的效果,現(xiàn)在最高可以達(dá)到20微秒的精度。
如果將這樣的控制精度放到機(jī)器人多軸控制上,我們就可以將在工業(yè)控制領(lǐng)域?qū)崟r(shí)性的優(yōu)勢延續(xù)到機(jī)器人運(yùn)動(dòng)控制中。”
這是英特爾的優(yōu)勢所在,也是具身智能在場景落地過程中,必須考慮的問題。
02 具身智能的最佳實(shí)踐場景
嚴(yán)格意義來說,英特爾工業(yè)AI與具身智能生態(tài)大會(huì)是英特爾在國內(nèi)公開舉辦的第二場具身智能發(fā)布會(huì)。
回憶起今年4月首次面向具身智能領(lǐng)域發(fā)布SDK的場景,英特爾中國行業(yè)與解決方案業(yè)務(wù)部總經(jīng)理王景佳稱,“當(dāng)時(shí)還是有點(diǎn)忐忑。”
因?yàn)楫?dāng)時(shí)不知道大家對于英特爾大小腦融合方案接受度會(huì)是怎樣。
在這次會(huì)后采訪環(huán)節(jié),王景佳則興奮地向我們表示,“在過去幾個(gè)月里,我們接觸了幾十家具身智能客戶,其中也有一些是主動(dòng)找到我們技術(shù)部門想要用我們的方案,現(xiàn)在已經(jīng)有十幾家企業(yè)開始做驗(yàn)證,甚至在做POC的開發(fā)。”
這其中自然也包括7月9日的全球首次通用具身機(jī)器人工業(yè)現(xiàn)場常態(tài)化直播。
據(jù)悉,在這場直播中,由智元機(jī)器人聯(lián)合富臨精工、安努智能發(fā)起,智元機(jī)器人提供此前面向工業(yè)場景發(fā)布的A2-W機(jī)器人,安努智能提供算法軟件和具體落地解決方案,富臨精工開放位于四川綿陽的工廠。
A2-W最終成功完成了兩班制、單班搬運(yùn)800多個(gè)周轉(zhuǎn)箱,直播作業(yè)3小時(shí)零失誤。
這是一場大型社會(huì)實(shí)踐,也是第一次通過“慢直播”的形式,讓大家看到了具身機(jī)器人在真實(shí)工業(yè)場景初步具備的能力。
在這場直播中,智元機(jī)器人A2-W具身機(jī)器人用到的處理器正是英特爾酷睿Ultra。
據(jù)富臨精工副董事長李鵬程透露,“當(dāng)時(shí)我們還是蠻意外的,驗(yàn)證效果超過了我們之前的預(yù)期,當(dāng)時(shí)直播3小時(shí)搬運(yùn)800多個(gè)周轉(zhuǎn)箱是做到了0失誤,到現(xiàn)在這些機(jī)器人已經(jīng)進(jìn)行了上萬次的搬運(yùn)任務(wù)。”
安努智能CEO文宏杰在發(fā)布會(huì)上也指出,“由于采用了英特爾酷睿Ultra處理器,機(jī)器人搬運(yùn)節(jié)拍很快從3分鐘降低到了35秒,基本達(dá)到了人類的水平,經(jīng)過測算,一臺具身機(jī)器人已經(jīng)可以達(dá)到0.7個(gè)人類的搬運(yùn)效率。”
此外,李鵬程也進(jìn)一步指出,“現(xiàn)在很多企業(yè)還處于工業(yè)自動(dòng)化階段,基于AGV完成搬運(yùn)任務(wù),但具身機(jī)器人在避障、定位導(dǎo)航、路線規(guī)劃上表現(xiàn)出來的能力,能更好地與我們產(chǎn)線柔性生產(chǎn)耦合,也才能更符合我們現(xiàn)在靈活快速響應(yīng)需要。”
值得注意的是,富臨精工、安努智能、智元機(jī)器人和英特爾四家企業(yè)在此次生態(tài)大會(huì)上,還正式對外發(fā)布了《基于具身智能的智慧工廠創(chuàng)新應(yīng)用白皮書(2025)》,將這次具身智能實(shí)踐經(jīng)驗(yàn)寫進(jìn)了白皮書里。
而作為英特爾工業(yè)和機(jī)器人事業(yè)部總經(jīng)理Ricky Watts,也特意從美國遠(yuǎn)道而來,參加了這場生態(tài)大會(huì),他同樣看好具身智能,尤其看好具身智能在工業(yè)領(lǐng)域的應(yīng)用。
當(dāng)被問道“中國機(jī)器人在哪些市場展現(xiàn)出了快速增長勢頭”時(shí),Ricky Watts給出的答案是:“industry(工業(yè))”。
03 中國是具身智能的前沿陣地
剛剛過去幾個(gè)月里的兩場具身智能發(fā)布會(huì),以及與浙江人形機(jī)器人創(chuàng)新中心、智元機(jī)器人等的合作,讓英特爾對具身智能的態(tài)度已經(jīng)不言而喻。
英特爾同樣相信人形機(jī)器人,相信具身智能,這樣的判斷既來自市場的熱情,也來自市場明確的調(diào)研數(shù)據(jù)。
英特爾技術(shù)專家在發(fā)布會(huì)上指出:
“2024年中國人形機(jī)器人出貨量只有兩三千臺,當(dāng)時(shí)三方調(diào)研機(jī)構(gòu)給出的預(yù)測數(shù)據(jù)是,2025年會(huì)達(dá)到七八千臺,相較而言會(huì)翻三倍;
但實(shí)際上根據(jù)我們與客戶了解到的數(shù)據(jù)和市場更新的預(yù)測數(shù)據(jù),今年人形機(jī)器人出貨量可能會(huì)突破3萬臺,甚至更多。”
李巖對此指出,“回到技術(shù)本身來看,具身智能的核心就是感知、分析,最終轉(zhuǎn)化為運(yùn)動(dòng),如果類比人類的話,人類看到的、處理的,轉(zhuǎn)化為行動(dòng)與物理世界產(chǎn)生連接,這樣的應(yīng)用場景會(huì)非常多,”“若干年以后,類比PC、手機(jī),以具身智能為基礎(chǔ)的機(jī)器人市場體量會(huì)給我們一個(gè)非常大的想象空間。”
王景佳也特別指出,“從英特爾來看,具身智能一定是一個(gè)值得大規(guī)模投入的領(lǐng)域,而如果具身智能的應(yīng)用場景真實(shí)存在,一定會(huì)先在中國市場最先落地,在這個(gè)過程中,英特爾愿意與我們的合作伙伴讓這一天早日到來。”
而談到富臨精工、安努智能、智元機(jī)器人、英特爾四方聯(lián)合推動(dòng)的具身智能在工廠中的應(yīng)用,李鵬程也透露,“這樣的具身機(jī)器人很快就會(huì)在富臨精工工廠中進(jìn)入到實(shí)際應(yīng)用階段。”
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長視頻生成中的錯(cuò)誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測試基準(zhǔn)上都帶來顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績。這項(xiàng)研究揭示了基礎(chǔ)幾何知識對培養(yǎng)AI空間智能的重要價(jià)值。
關(guān)注智造、硬件、機(jī)器人。