作者| 金旺
欄目| 具身資訊
近日,在民營(yíng)企業(yè)座談會(huì)上,宇樹科技創(chuàng)始人王興興指出,“今年年底之前,整個(gè)AI的人形機(jī)器人會(huì)達(dá)到一個(gè)新的量級(jí)。”
作為國(guó)內(nèi)人形機(jī)器人明星企業(yè),在2024年9月完成C輪融資后,宇樹科技估值已經(jīng)突破80億元。
不過,宇樹科技的人形機(jī)器人真正在大眾層面得到廣泛認(rèn)知,是在今年春晚上。
在今年春晚上,宇樹科技16臺(tái)人形機(jī)器人H1與新疆藝術(shù)學(xué)院舞蹈演員表演的舞蹈節(jié)目《秧BOT》,作為今年春晚的特色之一,迅速讓人形機(jī)器人闖入大眾視野。
與此同時(shí),人形機(jī)器人在人工智能技術(shù)加持下,確實(shí)在以肉眼可見的速度發(fā)生著改變。
01 機(jī)器人跳舞太“絲滑”,被質(zhì)疑為AI生成
近日,一個(gè)宇樹人形機(jī)器人G1的跳舞視頻在網(wǎng)上爆火,在視頻中,從機(jī)器人跳舞的穩(wěn)定性、流暢度,以及自然程度上來看,都很難想象是現(xiàn)階段人形機(jī)器人能夠?qū)崿F(xiàn)的能力。
畢竟,宇樹人形機(jī)器人在春晚舞臺(tái)上還曾因被舞蹈演員“扶著”下臺(tái)被主持人調(diào)侃。
這段人形機(jī)器人跳舞視頻發(fā)布后,在視頻平臺(tái)上被算法識(shí)別并自動(dòng)打上了“疑似使用AI技術(shù)生成”的提醒標(biāo)簽。
為了證明人形機(jī)器人跳舞的真實(shí)性,宇樹科技官方昨日在視頻平臺(tái)上又更新了一個(gè)視頻,視頻中,宇樹G1跳的依然是之前的舞蹈,不同的是,鏡頭側(cè)面放置了一面全身鏡實(shí)時(shí)顯示周邊環(huán)境,并時(shí)不時(shí)由旁邊的員工給他丟個(gè)球、來兩下,進(jìn)行干擾。
在這則視頻中,宇樹科技官方也對(duì)上一個(gè)視頻中提到的“算法升級(jí),任意舞蹈任意學(xué)”的說法給出了解釋:
“最近幾天剛開發(fā)好的功能,還沒有推送給客戶,不同型號(hào)版本的機(jī)器人功能也有差異。”
這一方面證實(shí)了機(jī)器人跳舞的真實(shí)性,另一方面也對(duì)客戶手中的機(jī)器人沒有這個(gè)功能給出了一個(gè)交代。
據(jù)悉,宇樹科技的人形機(jī)器人在今年登上春晚后不久,就曾直接在京東平臺(tái)上開售H1和G1兩個(gè)型號(hào)的人形機(jī)器人,前者售價(jià)65萬元,預(yù)計(jì)60天交貨,后者售價(jià)9.9萬元起售,預(yù)計(jì)45天交貨。
然而,這兩款產(chǎn)品在上線不久后就進(jìn)行了下架,如今依然需要通過官方渠道進(jìn)行購買。
值得注意的是,宇樹科技這款人形機(jī)器人此前在京東線上頁面顯示整機(jī)重約35kg,身高127cm,續(xù)航為2—4小時(shí),主要面向場(chǎng)景為娛樂陪伴。
對(duì)于希望在2025年實(shí)現(xiàn)量產(chǎn)的人形機(jī)器人產(chǎn)業(yè)而言,面向消費(fèi)市場(chǎng)的娛樂陪伴場(chǎng)景,顯然是一個(gè)更廣闊的量產(chǎn)市場(chǎng)。
不過,王興興在近日接受媒體采訪時(shí)指出:
“今年年底之前,整個(gè)AI(驅(qū)動(dòng))的人形機(jī)器人會(huì)達(dá)到一個(gè)新的量級(jí),如果順利的話,諸如服務(wù)業(yè)、工業(yè)等基礎(chǔ)場(chǎng)景到明后年就可以推起來了,但家用(場(chǎng)景)會(huì)慢一點(diǎn),因?yàn)榧矣脤?duì)安全性的要求更高,需要技術(shù)相對(duì)更成熟一點(diǎn)。”
02 人形機(jī)器人產(chǎn)業(yè)繼續(xù)競(jìng)速
在宇樹人形機(jī)器人登上春晚,馬斯克號(hào)稱Optimus將要量產(chǎn)的2025年,人形機(jī)器人仍在競(jìng)速。
就在近日,我們看到,美國(guó)人形機(jī)器人明星企業(yè)Apptronik官宣融資3.5億美元(約25.5億元),國(guó)內(nèi)也有初創(chuàng)公司靈寶CASBOT完成了億元天使輪融資。
在技術(shù)迭代方面,逐際動(dòng)力近日發(fā)布了LimX VGM具身機(jī)器人操作算法,據(jù)官方公開資料顯示,這是一個(gè)基于視頻生成大模型的具身操作算法,通過人類操作視頻數(shù)據(jù)對(duì)現(xiàn)有的視頻生成大模型進(jìn)行后訓(xùn)練,僅需將場(chǎng)景圖片和操作任務(wù)指令作為提示Prompts,即可實(shí)現(xiàn)任務(wù)理解與拆分、物體操作軌跡生成以及機(jī)器人操作執(zhí)行的全流程,全過程零真機(jī)樣本數(shù)據(jù),并且可實(shí)現(xiàn)多平臺(tái)泛化。
加速進(jìn)化Booster T1也在近日公開了耐用性和撞擊測(cè)試視頻,在官方公開的視頻中,Booster T1人形機(jī)器人在表演完“胸口碎大石”后,依然可以再次起身。
不過,在這一系列人形機(jī)器人企業(yè)融資、技術(shù)創(chuàng)新背后,人形機(jī)器人產(chǎn)業(yè)競(jìng)爭(zhēng)也在加劇。
2025年不僅是人形機(jī)器人步入量產(chǎn)的關(guān)鍵一年,也將會(huì)是人形機(jī)器人大浪淘沙的一年。
好文章,需要你的鼓勵(lì)
這項(xiàng)研究提出了"高效探測(cè)"方法,解決了掩碼圖像建模AI難以有效評(píng)估的問題。通過創(chuàng)新的多查詢交叉注意力機(jī)制,該方法在減少90%參數(shù)的同時(shí)實(shí)現(xiàn)10倍速度提升,在七個(gè)基準(zhǔn)測(cè)試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質(zhì)量與分類性能的強(qiáng)相關(guān)性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應(yīng)性。團(tuán)隊(duì)承諾開源全部代碼,推動(dòng)技術(shù)普及應(yīng)用。
伊利諾伊大學(xué)研究團(tuán)隊(duì)開發(fā)了CLAIMSPECT系統(tǒng),通過層次化分解復(fù)雜爭(zhēng)議、智能檢索相關(guān)文獻(xiàn)、多角度收集觀點(diǎn)的方法,將傳統(tǒng)的"真假"判斷轉(zhuǎn)變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動(dòng)構(gòu)建爭(zhēng)議話題的分析框架,識(shí)別不同觀點(diǎn)及其支撐證據(jù),為科學(xué)和政治爭(zhēng)議提供更全面客觀的分析,已在生物醫(yī)學(xué)和國(guó)際關(guān)系領(lǐng)域驗(yàn)證有效性。
清華大學(xué)研究團(tuán)隊(duì)首次提出情感認(rèn)知融合網(wǎng)絡(luò)(ECFN),讓AI能像人類一樣理解和表達(dá)情感。該系統(tǒng)通過多層次情感處理架構(gòu),在情感識(shí)別準(zhǔn)確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達(dá)自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實(shí)現(xiàn)了跨模態(tài)情感融合、動(dòng)態(tài)情感追蹤和個(gè)性化情感建模,為醫(yī)療、教育、客服等領(lǐng)域帶來革命性應(yīng)用前景。
哈佛大學(xué)研究團(tuán)隊(duì)通過創(chuàng)新的多智能體強(qiáng)化學(xué)習(xí)方法,讓AI在戰(zhàn)略游戲中學(xué)會(huì)復(fù)雜推理。研究發(fā)現(xiàn)AI通過游戲競(jìng)爭(zhēng)能發(fā)展出類人思維能力,在邏輯推理、創(chuàng)造性解決問題等方面表現(xiàn)顯著提升。這項(xiàng)突破性成果為未來AI在醫(yī)療、教育、城市管理等領(lǐng)域的應(yīng)用奠定基礎(chǔ),展現(xiàn)了通過模擬人類學(xué)習(xí)過程培養(yǎng)真正智能AI的新路徑。
關(guān)注智造、硬件、機(jī)器人。