作者| 金旺
欄目| 具身資訊
近日,在民營(yíng)企業(yè)座談會(huì)上,宇樹科技創(chuàng)始人王興興指出,“今年年底之前,整個(gè)AI的人形機(jī)器人會(huì)達(dá)到一個(gè)新的量級(jí)。”
作為國(guó)內(nèi)人形機(jī)器人明星企業(yè),在2024年9月完成C輪融資后,宇樹科技估值已經(jīng)突破80億元。
不過,宇樹科技的人形機(jī)器人真正在大眾層面得到廣泛認(rèn)知,是在今年春晚上。
在今年春晚上,宇樹科技16臺(tái)人形機(jī)器人H1與新疆藝術(shù)學(xué)院舞蹈演員表演的舞蹈節(jié)目《秧BOT》,作為今年春晚的特色之一,迅速讓人形機(jī)器人闖入大眾視野。
與此同時(shí),人形機(jī)器人在人工智能技術(shù)加持下,確實(shí)在以肉眼可見的速度發(fā)生著改變。
01 機(jī)器人跳舞太“絲滑”,被質(zhì)疑為AI生成
近日,一個(gè)宇樹人形機(jī)器人G1的跳舞視頻在網(wǎng)上爆火,在視頻中,從機(jī)器人跳舞的穩(wěn)定性、流暢度,以及自然程度上來看,都很難想象是現(xiàn)階段人形機(jī)器人能夠?qū)崿F(xiàn)的能力。
畢竟,宇樹人形機(jī)器人在春晚舞臺(tái)上還曾因被舞蹈演員“扶著”下臺(tái)被主持人調(diào)侃。
這段人形機(jī)器人跳舞視頻發(fā)布后,在視頻平臺(tái)上被算法識(shí)別并自動(dòng)打上了“疑似使用AI技術(shù)生成”的提醒標(biāo)簽。
為了證明人形機(jī)器人跳舞的真實(shí)性,宇樹科技官方昨日在視頻平臺(tái)上又更新了一個(gè)視頻,視頻中,宇樹G1跳的依然是之前的舞蹈,不同的是,鏡頭側(cè)面放置了一面全身鏡實(shí)時(shí)顯示周邊環(huán)境,并時(shí)不時(shí)由旁邊的員工給他丟個(gè)球、來兩下,進(jìn)行干擾。
在這則視頻中,宇樹科技官方也對(duì)上一個(gè)視頻中提到的“算法升級(jí),任意舞蹈任意學(xué)”的說法給出了解釋:
“最近幾天剛開發(fā)好的功能,還沒有推送給客戶,不同型號(hào)版本的機(jī)器人功能也有差異。”
這一方面證實(shí)了機(jī)器人跳舞的真實(shí)性,另一方面也對(duì)客戶手中的機(jī)器人沒有這個(gè)功能給出了一個(gè)交代。
據(jù)悉,宇樹科技的人形機(jī)器人在今年登上春晚后不久,就曾直接在京東平臺(tái)上開售H1和G1兩個(gè)型號(hào)的人形機(jī)器人,前者售價(jià)65萬元,預(yù)計(jì)60天交貨,后者售價(jià)9.9萬元起售,預(yù)計(jì)45天交貨。
然而,這兩款產(chǎn)品在上線不久后就進(jìn)行了下架,如今依然需要通過官方渠道進(jìn)行購(gòu)買。
值得注意的是,宇樹科技這款人形機(jī)器人此前在京東線上頁(yè)面顯示整機(jī)重約35kg,身高127cm,續(xù)航為2—4小時(shí),主要面向場(chǎng)景為娛樂陪伴。
對(duì)于希望在2025年實(shí)現(xiàn)量產(chǎn)的人形機(jī)器人產(chǎn)業(yè)而言,面向消費(fèi)市場(chǎng)的娛樂陪伴場(chǎng)景,顯然是一個(gè)更廣闊的量產(chǎn)市場(chǎng)。
不過,王興興在近日接受媒體采訪時(shí)指出:
“今年年底之前,整個(gè)AI(驅(qū)動(dòng))的人形機(jī)器人會(huì)達(dá)到一個(gè)新的量級(jí),如果順利的話,諸如服務(wù)業(yè)、工業(yè)等基礎(chǔ)場(chǎng)景到明后年就可以推起來了,但家用(場(chǎng)景)會(huì)慢一點(diǎn),因?yàn)榧矣脤?duì)安全性的要求更高,需要技術(shù)相對(duì)更成熟一點(diǎn)。”
02 人形機(jī)器人產(chǎn)業(yè)繼續(xù)競(jìng)速
在宇樹人形機(jī)器人登上春晚,馬斯克號(hào)稱Optimus將要量產(chǎn)的2025年,人形機(jī)器人仍在競(jìng)速。
就在近日,我們看到,美國(guó)人形機(jī)器人明星企業(yè)Apptronik官宣融資3.5億美元(約25.5億元),國(guó)內(nèi)也有初創(chuàng)公司靈寶CASBOT完成了億元天使輪融資。
在技術(shù)迭代方面,逐際動(dòng)力近日發(fā)布了LimX VGM具身機(jī)器人操作算法,據(jù)官方公開資料顯示,這是一個(gè)基于視頻生成大模型的具身操作算法,通過人類操作視頻數(shù)據(jù)對(duì)現(xiàn)有的視頻生成大模型進(jìn)行后訓(xùn)練,僅需將場(chǎng)景圖片和操作任務(wù)指令作為提示Prompts,即可實(shí)現(xiàn)任務(wù)理解與拆分、物體操作軌跡生成以及機(jī)器人操作執(zhí)行的全流程,全過程零真機(jī)樣本數(shù)據(jù),并且可實(shí)現(xiàn)多平臺(tái)泛化。
加速進(jìn)化Booster T1也在近日公開了耐用性和撞擊測(cè)試視頻,在官方公開的視頻中,Booster T1人形機(jī)器人在表演完“胸口碎大石”后,依然可以再次起身。
不過,在這一系列人形機(jī)器人企業(yè)融資、技術(shù)創(chuàng)新背后,人形機(jī)器人產(chǎn)業(yè)競(jìng)爭(zhēng)也在加劇。
2025年不僅是人形機(jī)器人步入量產(chǎn)的關(guān)鍵一年,也將會(huì)是人形機(jī)器人大浪淘沙的一年。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。
關(guān)注智造、硬件、機(jī)器人。