av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

<del id="27hsc"><option id="27hsc"><code id="27hsc"></code></option></del>

微信掃一掃，關(guān)注公眾號

科技行者
算力行者

見證連接與計算的「力量」

讓機(jī)器人理解他人視角：意大利理工學(xué)院和阿伯丁大學(xué)聯(lián)合開發(fā)的空間感知訓(xùn)練新方法

人機(jī)交互視覺視角采納具身人工智能

讓機(jī)器人理解他人視角：意大利理工學(xué)院和阿伯丁大學(xué)聯(lián)合開發(fā)的空間感知訓(xùn)練新方法

作者：科技行者

2025-05-27 09:37

分享至：

意大利理工學(xué)院與英國阿伯丁大學(xué)聯(lián)合研究團(tuán)隊(duì)發(fā)布了一項(xiàng)突破性研究，提出通過合成數(shù)據(jù)訓(xùn)練視覺語言模型實(shí)現(xiàn)機(jī)器人的視覺視角采納能力。研究團(tuán)隊(duì)創(chuàng)建了一個包含RGB圖像、語言描述和精確空間變換矩陣的合成數(shù)據(jù)集，使機(jī)器人能夠理解物體在不同視角下的空間關(guān)系。這一基礎(chǔ)工作為實(shí)現(xiàn)能在人機(jī)交互中理解空間關(guān)系的具身AI系統(tǒng)鋪平了道路，有望顯著提升未來機(jī)器人與人類協(xié)作的自然度和直觀性。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2025-05-27 09:37 ? 科技行者

這項(xiàng)來自意大利理工學(xué)院(IIT)和英國阿伯丁大學(xué)聯(lián)合研究團(tuán)隊(duì)的最新研究，剛剛于2025年5月在arXiv預(yù)印本平臺上發(fā)布。這篇題為《通過空間錨定的合成世界實(shí)現(xiàn)機(jī)器人的具身認(rèn)知》(Towards Embodied Cognition in Robots via Spatially Grounded Synthetic Worlds)的論文由Joel Currie、Gioele Migno、Enrico Piacenti等研究者共同完成，他們提出了一個令人興奮的新方法，希望教會機(jī)器人理解"別人看到的世界"是什么樣子。

想象這樣一個場景：你和朋友坐在餐桌兩側(cè)，你說"請遞給我左邊的那杯咖啡"。對于人類來說，朋友會自然地理解你說的"左邊"是從你的視角出發(fā)的，而不是從他自己的視角。這種能力在人類社交中看似簡單，卻是機(jī)器人至今難以掌握的重要技能，專業(yè)上稱為"視覺視角采納"(Visual Perspective Taking，簡稱VPT)。

研究團(tuán)隊(duì)指出，具備視角轉(zhuǎn)換能力對于機(jī)器人與人類順暢互動至關(guān)重要。想一想，如果機(jī)器人助手無法理解"在我左邊的杯子"和"在你左邊的杯子"之間的區(qū)別，它將如何正確執(zhí)行你的指令？這種看似簡單的能力實(shí)際上涉及復(fù)雜的空間認(rèn)知，是機(jī)器人實(shí)現(xiàn)"具身認(rèn)知"（即通過身體與環(huán)境互動來理解世界）的關(guān)鍵一步。

現(xiàn)有的機(jī)器人視角采納解決方案通常依賴于復(fù)雜的幾何模型和手工設(shè)計的視角轉(zhuǎn)換規(guī)則，就像是給機(jī)器人提供一本詳細(xì)的地圖和轉(zhuǎn)向指南。雖然這些方法在受控環(huán)境中有效，但缺乏靈活性和適應(yīng)性，就像只會按固定路線行駛的自動駕駛汽車，一旦遇到地圖上沒有的路況就不知所措。

與此相對，視覺語言模型（VLMs）展現(xiàn)出驚人的靈活性和適應(yīng)能力，就像能夠理解各種場景的通用翻譯器。然而，現(xiàn)有的視覺語言模型在精確的空間推理方面仍然表現(xiàn)不佳，特別是在推斷物體位置、相對方向或特定視角下的關(guān)系時。這就像一個能認(rèn)出各種物品的人，卻無法準(zhǔn)確描述它們之間的位置關(guān)系。

研究者認(rèn)為，這些空間推理能力的缺乏并非模型架構(gòu)的固有缺陷，而可能是由于缺少明確將空間關(guān)系與視覺場景聯(lián)系起來的訓(xùn)練數(shù)據(jù)造成的。這就像是試圖教一個孩子認(rèn)識方向，但從來沒有給他展示過真實(shí)的空間關(guān)系例子。

為了解決這個問題，研究團(tuán)隊(duì)提出了一個概念性框架，旨在訓(xùn)練視覺語言模型執(zhí)行視覺視角采納任務(wù)。作為實(shí)現(xiàn)這一愿景的第一步，他們創(chuàng)建了一個合成數(shù)據(jù)集，由NVIDIA Omniverse生成，用于空間推理任務(wù)的監(jiān)督學(xué)習(xí)。

數(shù)據(jù)集的每個實(shí)例都包含三個關(guān)鍵元素：一個RGB圖像（就像機(jī)器人的"眼睛"看到的圖像）、一個自然語言描述（比如"桌上有一個紅色立方體"）、以及一個真實(shí)的4×4變換矩陣，代表物體相對于相機(jī)的精確位置姿態(tài)。這有點(diǎn)像給機(jī)器人同時提供一張照片、照片的文字描述，以及物體的準(zhǔn)確坐標(biāo)和方向。

當(dāng)前的研究專注于推斷Z軸距離（即物體到相機(jī)的遠(yuǎn)近距離）這一基礎(chǔ)能力，研究者計劃在未來將其擴(kuò)展到完整的六自由度（6 DOF）推理，包括物體的所有可能位置和旋轉(zhuǎn)角度。這就像是先教會孩子判斷物體的遠(yuǎn)近，然后再教他理解物體的左右、上下以及旋轉(zhuǎn)方向。

研究團(tuán)隊(duì)設(shè)計的概念性流程包括三個關(guān)鍵階段：首先，從圖像和文本輸入估計物體姿態(tài)，得到一個變換矩陣；其次，推斷代理（如另一個機(jī)器人或人類）與相機(jī)之間的相對視角變換；最后，通過變換組合進(jìn)行視角映射，得出從代理視角看到的物體姿態(tài)。通過這種結(jié)構(gòu)化的空間監(jiān)督方式，研究者希望推動能夠執(zhí)行具身認(rèn)知任務(wù)的機(jī)器人發(fā)展，如視角采納、空間推理和視角不變的物體理解。

團(tuán)隊(duì)將他們創(chuàng)建的合成數(shù)據(jù)集公開發(fā)布在Hugging Face平臺上，任何人都可以通過https://huggingface.co/datasets/jwgcurrie/synthetic-distance鏈接訪問，這為進(jìn)一步研究提供了寶貴資源。

這項(xiàng)工作得到了歐盟"下一代歐盟PNRR MUR"資助的"未來人工智能研究"(FAIR)項(xiàng)目的支持，為實(shí)現(xiàn)能夠在人機(jī)交互場景中進(jìn)行空間理解的具身AI系統(tǒng)邁出了關(guān)鍵的第一步。雖然現(xiàn)在的成果還是初步的，但它為未來機(jī)器人能夠真正理解"別人眼中的世界"鋪平了道路，這對實(shí)現(xiàn)自然、直觀的人機(jī)交互至關(guān)重要。

想象未來的機(jī)器人助手不僅能看到世界，還能理解你所看到的世界——當(dāng)你說"請拿那個靠近你的杯子"時，機(jī)器人能夠準(zhǔn)確理解"靠近你"是從你的視角出發(fā)的空間關(guān)系。這種看似簡單的能力，實(shí)際上是人機(jī)協(xié)作的重要基石，而這項(xiàng)研究正是朝著這個方向邁出的重要一步。

人機(jī)交互視覺視角采納具身人工智能

分享至

0贊

好文章，需要你的鼓勵

推薦文章

人工智能
動態(tài)專家搜索
推理優(yōu)化

2025-10-22 13:24

浙江大學(xué)突破：讓AI專家團(tuán)隊(duì)在考試時"動態(tài)組隊(duì)"，推理能力飆升

浙江大學(xué)團(tuán)隊(duì)提出動態(tài)專家搜索方法，讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率，且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置，為AI推理優(yōu)化開辟新路徑。
人工智能
強(qiáng)化學(xué)習(xí)
模型優(yōu)化

2025-10-22 13:24

清華大學(xué)新突破：AI模型居然能學(xué)會"少說話多做事"，推理效率提升一倍還更準(zhǔn)確

清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法，通過"壓縮-擴(kuò)張"交替訓(xùn)練策略，成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實(shí)驗(yàn)顯示，該方法在數(shù)學(xué)競賽題上將模型準(zhǔn)確率提升43.2%的同時，輸出長度減少46.9%，真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化，為AI模型訓(xùn)練提供了新思路。
人工智能
視頻生成
實(shí)時流媒體

2025-10-22 13:24

南洋理工大學(xué)突破性研究：用AI實(shí)現(xiàn)多分鐘視頻實(shí)時流式生成，就像看電視直播一樣

南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開發(fā)出Rolling Forcing技術(shù)，實(shí)現(xiàn)AI視頻實(shí)時流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新，解決了長視頻生成中的錯誤累積問題，可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻，延遲僅0.76秒，質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01，為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
人工智能
幾何學(xué)習(xí)
空間智能

2025-10-22 10:14

華中科技大學(xué)團(tuán)隊(duì)突破性發(fā)現(xiàn)：讓AI像幾何學(xué)家一樣思考，竟能大幅提升空間理解能力

華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn)，通過讓AI模型學(xué)習(xí)解決幾何問題，能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集，使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個AI模型。實(shí)驗(yàn)結(jié)果顯示，幾何訓(xùn)練在四個空間智能測試基準(zhǔn)上都帶來顯著提升，其中最佳模型達(dá)到49.6%準(zhǔn)確率，超越此前最好成績。這項(xiàng)研究揭示了基礎(chǔ)幾何知識對培養(yǎng)AI空間智能的重要價值。

浙江大學(xué)突破：讓AI專家團(tuán)隊(duì)在考試時"動態(tài)組隊(duì)"，推理能力飆升

浙江大學(xué)突破：讓AI專家團(tuán)隊(duì)在考試時"動態(tài)組隊(duì)"，推理能力飆升

2025-10-22 13:24

清華大學(xué)新突破：AI模型居然能學(xué)會"少說話多做事"，推理效率提升一倍還更準(zhǔn)確

清華大學(xué)新突破：AI模型居然能學(xué)會"少說話多做事"，推理效率提升一倍還更準(zhǔn)確

2025-10-22 13:24

南洋理工大學(xué)突破性研究：用AI實(shí)現(xiàn)多分鐘視頻實(shí)時流式生成，就像看電視直播一樣

南洋理工大學(xué)突破性研究：用AI實(shí)現(xiàn)多分鐘視頻實(shí)時流式生成，就像看電視直播一樣

2025-10-22 13:24

華中科技大學(xué)團(tuán)隊(duì)突破性發(fā)現(xiàn)：讓AI像幾何學(xué)家一樣思考，竟能大幅提升空間理解能力

華中科技大學(xué)團(tuán)隊(duì)突破性發(fā)現(xiàn)：讓AI像幾何學(xué)家一樣思考，竟能大幅提升空間理解能力

2025-10-22 10:14

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

友情鏈接

至頂網(wǎng)
管理現(xiàn)代化
和訊IT
TechWeb
第三媒體
速途網(wǎng)
51CTO傳媒
投資界
科技訊
智者新時代

京ICP證15039648號京ICP備15039648號-9 京公網(wǎng)安備 11010802021500號

北京第二十六維信息技術(shù)有限公司（至頂網(wǎng)）版權(quán)所有。 | 聯(lián)絡(luò)我們

舉報電話：010-62641205　涉未成年人舉報專線：010-62641208 舉報郵箱: jubao@zhiding.cn 　網(wǎng)上有害信息舉報專區(qū)：https://www.12377.cn

<em id="amqsu"><tt id="amqsu"><small id="amqsu"></small></tt></em>

<dfn id="amqsu"><fieldset id="amqsu"></fieldset></dfn>