作者 | 金旺
欄目 | 機(jī)器人新紀(jì)元
8月8日,2025世界機(jī)器人大會(huì)(WRC 2025)在北京開(kāi)幕。
100余款新品發(fā)布,50家人形機(jī)器人整機(jī)企業(yè)參展,讓今年的大會(huì)變得更加“人形化”。
也是在這場(chǎng)大會(huì)上,北京經(jīng)信局正式對(duì)外發(fā)布了北京機(jī)器人“雙百”成果、具身智能社會(huì)實(shí)驗(yàn)計(jì)劃,為接下來(lái)具身智能、機(jī)器人產(chǎn)業(yè)化落地在政策上給出了更多資金、場(chǎng)景,以及利好情緒。
不過(guò),在這場(chǎng)人山人海的展會(huì)上,更吸睛的還是一眾機(jī)器人廠商展出的機(jī)器人產(chǎn)品和場(chǎng)景。
例如,宇樹(shù)將拳擊機(jī)器人搬到了現(xiàn)場(chǎng),優(yōu)必選展出了人形機(jī)器人的群體智能,傅利葉上新了“暖色調(diào)”的陪伴人形機(jī)器人GR-3……
值得一提的是,前不久在具身智能領(lǐng)域連投了七家機(jī)器人公司的京東,成了本屆大會(huì)的獨(dú)家全球戰(zhàn)略合作伙伴,也成了本次大會(huì)最大的贏家。
01 3.99萬(wàn)元起售,宇樹(shù)再“卷”人形機(jī)器人
如果說(shuō)展會(huì)上誰(shuí)家的機(jī)器人最吸引眼球,那一定是宇樹(shù)了。
這次展會(huì)上,宇樹(shù)再次將展臺(tái)布置成了拳擊機(jī)器人的格斗場(chǎng),在層層觀眾圍觀下,站在后排的人都難以看到格斗場(chǎng)上的拳擊機(jī)器人選手,只能站在后方通過(guò)大屏觀看。
不過(guò),這里要特別一提的是,宇樹(shù)格斗機(jī)器人其實(shí)還不是“主動(dòng)智能”,依然需要手動(dòng)遙控,更多是將本體性能挖掘到極限的一款產(chǎn)品。
宇樹(shù)科技創(chuàng)始人兼CEO王興興在大會(huì)上就此特別指出,“大家看到我們做了格斗機(jī)器人,認(rèn)為我們的機(jī)器人更多是在做表演,其實(shí)我們的核心目標(biāo)是讓機(jī)器人干活,希望可以做一款通用型的具身機(jī)器人,我們?cè)谶@方面就諸如數(shù)據(jù)采集上也做了很多工作。”
除了格斗機(jī)器人,宇樹(shù)此次在大會(huì)上還展出了兩款機(jī)器人新品:人形機(jī)器人Unitree R1和四足機(jī)器人Unitree A2。
其中,Unitree R1身高1.21m,整機(jī)重量為25kg,全身有24-26自由度,這代以“先運(yùn)動(dòng),再干活”理念研發(fā)的機(jī)器人,起售價(jià)被宇樹(shù)定到了3.99萬(wàn)元。
據(jù)悉,這款產(chǎn)品外觀為客戶(hù)留了定制空間,例如可以重新涂裝,定制機(jī)器人造型,不過(guò),王興興也指出,“目前這款機(jī)器人的量產(chǎn)還沒(méi)有搞定,會(huì)在稍晚些實(shí)現(xiàn)量產(chǎn)、進(jìn)行發(fā)貨。”
而這樣主打運(yùn)動(dòng)能力的小型人形機(jī)器人,也將對(duì)行業(yè)帶來(lái)一波沖擊,同時(shí)也將成為人形機(jī)器人量產(chǎn)之年的一款關(guān)鍵產(chǎn)品。
此外,我們?cè)谡桂^里也隨處可見(jiàn)四處遛彎的機(jī)器狗,這其中就不乏有宇樹(shù)的機(jī)器狗,我們能夠看到的是,宇樹(shù)四足機(jī)器人現(xiàn)在有了更好的靈活性。
對(duì)此,王興興也特別解釋稱(chēng),“這是因?yàn)橛顦?shù)將過(guò)去在人形機(jī)器人上開(kāi)發(fā)的靈活動(dòng)作應(yīng)用到了四足機(jī)器人上,這也讓宇樹(shù)的四足機(jī)器人有了更高的靈活性。”
02 優(yōu)必選群體智能再升級(jí),構(gòu)建AI雙循環(huán)
同樣在這一展館中吸引了大量觀眾的,還有優(yōu)必選的展臺(tái),相較于去年將一整條產(chǎn)線搬到現(xiàn)場(chǎng),這次優(yōu)必選進(jìn)一步將多臺(tái)人形機(jī)器人聯(lián)動(dòng)的群體智能系統(tǒng)在現(xiàn)場(chǎng)進(jìn)行了展示。
優(yōu)必選CBO譚旻在現(xiàn)場(chǎng)告訴我們,“實(shí)際工廠環(huán)境非常復(fù)雜,僅僅是在一個(gè)工廠中就可能有諸如AGV、機(jī)械臂等多種不同類(lèi)型、來(lái)自不同廠商的機(jī)器人,它們的通信協(xié)議不盡相同,我們一定要有一個(gè)智慧的網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)這其中所有機(jī)器人的通信,并通過(guò)多智能體的實(shí)時(shí)在線和連接實(shí)現(xiàn)調(diào)度和協(xié)作。”
據(jù)悉,優(yōu)必選的群體智能2024年10月首先在比亞迪長(zhǎng)沙工廠落地。
此外,優(yōu)必選近日還升級(jí)了群體智能系統(tǒng),
通過(guò)群腦網(wǎng)絡(luò)2.0+智能體技術(shù)Co-Agent構(gòu)建AI雙循環(huán),Walker S2不僅擁有更智慧的大腦,還擁有了端到端“類(lèi)人眼”雙目立體視覺(jué)感知系統(tǒng)。
譚旻還進(jìn)一步指出,“這樣的群腦網(wǎng)絡(luò)2.0+Co-Agent構(gòu)成的AI雙循環(huán)體系,不僅提升了群體智能的能力涌現(xiàn),也讓單臺(tái)機(jī)器人擁有了更強(qiáng)大的自主決策能力。”
也是在這次展會(huì)上,優(yōu)必選還特別發(fā)布了一款全尺寸通用輪式人形機(jī)器人,Cruzr S2。
據(jù)悉,這款采用全對(duì)稱(chēng)機(jī)身設(shè)計(jì)、支持前后屈,可實(shí)現(xiàn)0.8m極窄通道原地旋轉(zhuǎn)±170°,0-0.4m腰部升降設(shè)計(jì),能在0-1.8m全空間范圍內(nèi)搬運(yùn)15kg重物,具備更強(qiáng)的空間通過(guò)及作業(yè)能力。
譚旻向我們透露,“Cruzr S2上半身用的其實(shí)是Walker S2的整機(jī)結(jié)構(gòu),并將優(yōu)必選在Walker系列產(chǎn)品上積累的AI能力一并復(fù)用到了這款產(chǎn)品中。”
而之所以在有了適合全地形場(chǎng)景的Walker S2后,還會(huì)研發(fā)Cruzr S2,譚旻告訴我們,“本質(zhì)上還是用戶(hù)側(cè)向我們提出的需求,與此同時(shí),這款產(chǎn)品在大面積平整地面的物流場(chǎng)景,也會(huì)有更高的工作效率。”
03 引入更多“主動(dòng)AI”,傅利葉上新陪伴人形機(jī)器人
傅利葉在這次展會(huì)上,特別亮相的是第三代人形機(jī)器人。
這代機(jī)器人一個(gè)明顯的獨(dú)特之處是,親合度更高了,我們?cè)谡箷?huì)現(xiàn)場(chǎng)也看到了這款材質(zhì)、膚色與現(xiàn)場(chǎng)其他產(chǎn)品形成鮮明對(duì)比的人形機(jī)器人。
這代人形機(jī)器人的研發(fā),實(shí)際上來(lái)自傅利葉創(chuàng)始人兼CEO顧捷的一個(gè)想法——要讓機(jī)器人像“伙伴”一樣出現(xiàn)在我們的生活中。
于是,更強(qiáng)調(diào)“溫度”的傅利葉在第三代人形機(jī)器人研發(fā)和設(shè)計(jì)過(guò)程中參考了《超能陸戰(zhàn)隊(duì)》中的大白的角色設(shè)定,為此,傅利葉還在感知系統(tǒng)、擬人態(tài)設(shè)計(jì)、可靠性三方面進(jìn)行了特別考量。
以感知系統(tǒng)為例,傅利葉在及機(jī)器人的交互反饋設(shè)計(jì)中采用了“雙路徑響應(yīng)機(jī)制”:
當(dāng)機(jī)器人接收到單一指令時(shí),GR-3能即時(shí)觸發(fā)“快思考”反饋——呼喚時(shí)快速轉(zhuǎn)頭對(duì)視,被撫摸時(shí)輕晃腦袋回應(yīng);
同一指令被多次觸發(fā),GR-3就會(huì)啟動(dòng)“慢思考”模式——由大模型推理引擎理解復(fù)雜語(yǔ)義、交互歷史及觸發(fā)特征,生成更自然且適配場(chǎng)景的復(fù)合應(yīng)答。
值得一提的是,當(dāng)GR-3處于待機(jī)模式時(shí),還會(huì)時(shí)不時(shí)還有一些融入環(huán)境的“小動(dòng)作”,這是傅利葉研發(fā)團(tuán)隊(duì)特別為這代機(jī)器人加入的一些淺層設(shè)計(jì),為的是讓機(jī)器人更擬人化。
不過(guò),即便這款機(jī)器人在大會(huì)現(xiàn)場(chǎng)受到很多小朋友的圍觀,但GR-3依舊率先被定為到了面向公共服務(wù)空間的一款產(chǎn)品。
據(jù)顧捷透露,“人形機(jī)器人要進(jìn)入家庭場(chǎng)景,還需要考慮新的規(guī)范、標(biāo)準(zhǔn)等諸多因素,這些因素需要未來(lái)很長(zhǎng)時(shí)間才能得到解決。”
04 魔法原子發(fā)布“小人形”,要讓更多人先用上人形機(jī)器人
同樣在這次展會(huì)上呼聲很高的,還有魔法原子。
魔法原子這次在展臺(tái)上開(kāi)辟了一個(gè)演練場(chǎng)景,并將自家多款人形機(jī)器人和四足機(jī)器人帶到了現(xiàn)場(chǎng)。
我們?cè)诂F(xiàn)場(chǎng)不僅看到了魔法原子新發(fā)布的工業(yè)四足機(jī)器人MagicDog Y1、全尺寸人形機(jī)器人小麥,也看到了魔法原子前不久發(fā)布的小型雙足人形機(jī)器人MagicBot Z1。
據(jù)悉,MagicBot Z1身高約1.4m,體重約40kg,配有10000mAh電池,擁有320°關(guān)節(jié)運(yùn)動(dòng)范圍,關(guān)節(jié)扭矩超130N·m,基于模仿強(qiáng)化學(xué)習(xí)可以實(shí)現(xiàn)1天掌握擬人化全身動(dòng)作。
魔法原子銷(xiāo)售總監(jiān)田罡告訴我們,“這款注重運(yùn)動(dòng)能力的人形機(jī)器人產(chǎn)品正式發(fā)布是在7月,與此同時(shí),我們?cè)?月底又發(fā)布了MagicDog,迅速將我們的產(chǎn)品線豐富了起來(lái),這其中的本質(zhì)是,我們過(guò)去一年半一直在打磨我們的關(guān)節(jié)模組,關(guān)節(jié)模組在機(jī)器人整機(jī)成本占比高達(dá)40%,在將關(guān)節(jié)模組打磨好后,握緊就可以快速擴(kuò)充我們的產(chǎn)品矩陣。”
在機(jī)器人極度內(nèi)卷的2025年,魔法原子也一直在摸索機(jī)器人應(yīng)用市場(chǎng),“現(xiàn)在還沒(méi)有哪個(gè)具體的機(jī)器人應(yīng)用場(chǎng)景一定會(huì)在短期起量,所以我們需要快速摸排市場(chǎng)。”
這是魔法原子的產(chǎn)品邏輯,也是魔法原子的商業(yè)化思路。
至于包括魔法原子在內(nèi)的人形機(jī)器人整機(jī)廠商,在有了全尺寸人形機(jī)器人后,為什么還會(huì)發(fā)布小型人形機(jī)器人?
田罡告訴我們,“全尺寸人形機(jī)器人小麥主要是為了工業(yè)和商業(yè)兩大領(lǐng)域服務(wù),身高和體重更適配這些場(chǎng)景,但近半年大家對(duì)具身智能和機(jī)器人有了更高的認(rèn)知,我們看到了一些教育機(jī)構(gòu)或場(chǎng)景,對(duì)人形機(jī)器人表現(xiàn)出了很高的關(guān)注,為了進(jìn)一步降低人形機(jī)器人使用門(mén)檻,也就有了我們耗時(shí)半年研發(fā)的MagicBot Z1。”
當(dāng)人形機(jī)器人的認(rèn)知度被不斷拉高,人形機(jī)器人的教育市場(chǎng)和極客市場(chǎng)邊界被不斷拓寬,原來(lái)只有高校實(shí)驗(yàn)室買(mǎi)得起的人形機(jī)器人,現(xiàn)在也要讓更多個(gè)人極客或教育機(jī)構(gòu)先用上人形機(jī)器人,訓(xùn)練人形機(jī)器人原子技能,讓機(jī)器人市場(chǎng)有更大的成長(zhǎng)空間。
這也就成了MagicBot Z1這類(lèi)小型人形機(jī)器人不斷涌現(xiàn)的一個(gè)底層邏輯。
05 數(shù)字華夏升級(jí)電子皮膚,為人形商用增加想象力
數(shù)字華夏仿生技術(shù)再升級(jí),為人形商用增加想象力
成立僅一年半的數(shù)字華夏,在今年的展會(huì)上也有了屬于自己的、更大的展臺(tái)。
數(shù)字華夏公共關(guān)系事業(yè)部總經(jīng)理吳為告訴我們,“之所以今年有了更大的展臺(tái),是因?yàn)槲覀兘衲暧懈嗟漠a(chǎn)品需要向公眾展示,也有了更多產(chǎn)品有商業(yè)化需求。”
吳為口中的更多產(chǎn)品,既包括去年發(fā)布的夏瀾、夏起,也包括今年發(fā)布的星行俠、衛(wèi)小鹿,我們?cè)谡古_(tái)上也看到了這些產(chǎn)品的最新技術(shù)和商業(yè)進(jìn)展。
首先是夏瀾不僅有了7大類(lèi)22種表情、裝上了電子皮膚,還擁有了模仿人類(lèi)表情的能力,夏瀾可以模仿站在她面前的觀眾的表情,進(jìn)一步降低了恐怖谷效應(yīng),實(shí)現(xiàn)了更擬人化的表情,不少人在現(xiàn)場(chǎng)與夏瀾進(jìn)行表情互動(dòng)玩得不亦樂(lè)乎。
據(jù)悉,數(shù)字華夏已經(jīng)攻克了“眼球追蹤”和“口型一致”等前沿技術(shù),更強(qiáng)交互能力的新一代夏瀾也即將面市。
吳為告訴我們,"所有人形機(jī)器人在進(jìn)入商業(yè)或家庭場(chǎng)景未來(lái)都需要仿生人臉,乃至電子肌肉,只有這樣才會(huì)有更多人愿意和人形機(jī)器人交互。"
然而,這類(lèi)具備仿生人臉的人形機(jī)器人,目前成本依然是一個(gè)瓶頸,不過(guò)吳為說(shuō),數(shù)字華夏已經(jīng)做好了仿生頭量產(chǎn)的準(zhǔn)備,量產(chǎn)后成本就大幅下降。
我們?cè)跀?shù)字華夏展開(kāi)上也看到,數(shù)字華夏團(tuán)隊(duì)通過(guò)為星行俠P01設(shè)計(jì)了更豐富、可更換的機(jī)器人頭部,可更換定制化頭部,也讓星行俠P01得以滿足更多商用場(chǎng)景的個(gè)性化需求。
就數(shù)字華夏人形機(jī)器人的商業(yè)落地情況,吳為告訴我們,"現(xiàn)在數(shù)字華夏的人形機(jī)器人已經(jīng)在銀行場(chǎng)景落地,正在打通機(jī)器人與行內(nèi)大模型和業(yè)務(wù)系統(tǒng),將在銀行場(chǎng)景實(shí)現(xiàn)諸如迎賓導(dǎo)覽,乃至儲(chǔ)蓄卡、信用卡開(kāi)通等業(yè)務(wù),相較于此前的非人形的服務(wù)機(jī)器人,人形機(jī)器人在這一場(chǎng)景有著交互性?xún)?yōu)勢(shì)——更多人會(huì)愿意和人形機(jī)器人交互。"
這讓金融服務(wù)機(jī)器人在人形這一形態(tài)下,有了更多可能。
不過(guò),數(shù)字華夏的人形機(jī)器人不僅僅銀行場(chǎng)景,他們還在現(xiàn)場(chǎng)展示了運(yùn)營(yíng)商、能源、教科研、商業(yè)零售場(chǎng)景的應(yīng)用。
此外,由于為機(jī)器人裝上了電子皮膚,機(jī)器人能夠精準(zhǔn)感知觀眾手部的觸覺(jué)和溫度,機(jī)器人的手部、臉部等“皮膚”可以像人類(lèi)一樣細(xì)膩地感知壓力、溫度、紋理變化甚至脈搏,這也讓人形機(jī)器人未來(lái)有了更大的想象空間。
例如,讓人形機(jī)器人為人類(lèi)尋診把脈。
06 AI inside機(jī)器人,加速具身進(jìn)化
相較去年,在今年大會(huì)現(xiàn)場(chǎng)我們一個(gè)明顯的感受是,人形機(jī)器人終于不用再被吊起來(lái)了,大多數(shù)人形機(jī)器人都已經(jīng)具備了良好的行走能力。
所以,各大人形機(jī)器人團(tuán)隊(duì)都將展臺(tái)當(dāng)成了“演武場(chǎng)”,除了上述幾家典型代表團(tuán)隊(duì)外,我們?cè)诂F(xiàn)場(chǎng)還看到了:
加速進(jìn)化將足球比賽搬到了現(xiàn)場(chǎng),現(xiàn)場(chǎng)不少小朋友圍觀,甚至為機(jī)器人球隊(duì)加油:
眾擎機(jī)器人讓人形機(jī)器人在展臺(tái)上走秀、跳舞,同樣引起了不少人駐足關(guān)注:
此外,諸如北京、上海、浙江、湖北等地的人形機(jī)器人創(chuàng)新中心展出了各地的人形機(jī)器人產(chǎn)品,以及當(dāng)?shù)禺a(chǎn)業(yè)鏈生態(tài),這也成了中國(guó)人形機(jī)器人產(chǎn)業(yè)的獨(dú)特之處。
不過(guò),在人形機(jī)器人產(chǎn)業(yè)大繁榮的背后,離不開(kāi)整個(gè)產(chǎn)業(yè)基礎(chǔ)設(shè)施的爬坡。
以具身智能尤為關(guān)鍵的算力平臺(tái)為例,我們?cè)诂F(xiàn)場(chǎng)看到不少展臺(tái)展示的產(chǎn)品有“NVIDIA Partner”的字樣,第一批搭載英偉達(dá)Jetson Thor具身大模型通用機(jī)器人開(kāi)始涌入市場(chǎng)。
與此同時(shí),我們?cè)诂F(xiàn)場(chǎng)也看到了國(guó)產(chǎn)機(jī)器人開(kāi)發(fā)平臺(tái)——RDK的身影。
在國(guó)地共建人形機(jī)器人創(chuàng)新中心展臺(tái)上,搭載地瓜機(jī)器人S100P智能計(jì)算平臺(tái)的人形機(jī)器人“青龍”,憑借128TOPS端側(cè)AI算力,支撐起了VLA端到端模型運(yùn)行。
用戶(hù)只要對(duì)著“青龍”發(fā)出一個(gè)諸如“將水拿過(guò)來(lái)”這樣的抓取物品的指令,“青龍”就可以完成語(yǔ)音→視覺(jué)→抓取全鏈路閉環(huán)。
恒之未來(lái)今年7月在海外平臺(tái)上線12小時(shí),就眾籌了百萬(wàn)美元的爆款智能機(jī)器狗Sirius,搭載了擁有5TOPS端側(cè)算力的RDK X3 Module作為AI計(jì)算平臺(tái),可實(shí)現(xiàn)基于語(yǔ)音與視覺(jué)的智能交互,讓它能夠帶來(lái)如寵物般靈動(dòng)的情感互動(dòng)反應(yīng),這款產(chǎn)品也在大會(huì)上進(jìn)行了展示。
我們?cè)诖髸?huì)現(xiàn)場(chǎng)也見(jiàn)到了地瓜機(jī)器人技術(shù)副總裁隋偉博士,作為從自動(dòng)駕駛領(lǐng)域“跨界”到具身智能領(lǐng)域的技術(shù)專(zhuān)家,他告訴我們,“地瓜機(jī)器人認(rèn)為機(jī)器人是自動(dòng)駕駛在技術(shù)上的接力和傳承,這之中很多技術(shù)是相通的,我們希望可以將在自動(dòng)駕駛領(lǐng)域多年積累的經(jīng)驗(yàn)遷移到機(jī)器人領(lǐng)域,其中的難點(diǎn)是具身機(jī)器人目前還不夠成熟,數(shù)據(jù)閉環(huán)和端到端在實(shí)際機(jī)器人本體上還處于起步階段。”
不過(guò),隋偉也特別提到,“人形機(jī)器人的價(jià)值在于可以適應(yīng)人類(lèi)環(huán)境和使用工具,這讓人形機(jī)器人產(chǎn)業(yè)未來(lái)?yè)碛辛撕艽蟮南胂罂臻g。”
此外,值得一提的是,作為大會(huì)的全球獨(dú)家戰(zhàn)略合作伙伴,京東成了本屆大會(huì)的最大贏家,大會(huì)上不僅隨處可見(jiàn)“買(mǎi)機(jī)器人,上京東”的標(biāo)語(yǔ),京東還特別推出了附身智能品牌Joyinside。
通過(guò)智能機(jī)器人產(chǎn)業(yè)加速計(jì)劃,京東一方面是想要將京東的大模型帶到具身智能戰(zhàn)場(chǎng),成為具身機(jī)器人大腦的第一順位,另一方面,也是希望將京東作為具身機(jī)器人的關(guān)鍵分銷(xiāo)平臺(tái),在機(jī)器人量產(chǎn)之年,構(gòu)建起機(jī)器人的銷(xiāo)售渠道。
2025年,當(dāng)算力平臺(tái)、核心部件、具身大模型的性能不斷爬坡,人形機(jī)器人有了更強(qiáng)的運(yùn)動(dòng)能力,開(kāi)始走起來(lái)的時(shí)候,中國(guó)的人形機(jī)器人開(kāi)始走向量產(chǎn),并與第一批用戶(hù)正式見(jiàn)面。
而這,只是中國(guó)人形機(jī)器人產(chǎn)業(yè)的又一個(gè)新的開(kāi)始。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專(zhuān)家搜索方法,讓AI能根據(jù)不同問(wèn)題靈活調(diào)整內(nèi)部專(zhuān)家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類(lèi)型問(wèn)題偏愛(ài)不同專(zhuān)家配置,為AI推理優(yōu)化開(kāi)辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過(guò)"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問(wèn)題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開(kāi)發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過(guò)滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問(wèn)題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開(kāi)辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過(guò)讓AI模型學(xué)習(xí)解決幾何問(wèn)題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來(lái)顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。
關(guān)注智造、硬件、機(jī)器人。