av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

微信掃一掃,關注公眾號

  • 科技行者

  • 算力行者

見證連接與計算的「力量」

首頁 復旦大學團隊重磅突破:機器人終于學會了"問問題",從被動執(zhí)行者進化為主動合作伙伴

復旦大學團隊重磅突破:機器人終于學會了"問問題",從被動執(zhí)行者進化為主動合作伙伴

2025-10-09 12:20
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2025-10-09 12:20 ? 科技行者

這項由復旦大學計算機科學與人工智能學院林心瑤、朱星昊等研究團隊主導的創(chuàng)新研究發(fā)表于2025年9月的arXiv預印本平臺(論文編號:arXiv:2509.15061v2),有興趣深入了解的讀者可以通過該編號在arXiv官網上訪問完整論文。研究團隊還包括來自上海創(chuàng)新研究院和加州大學伯克利分校的研究人員。

在我們日常生活中,當你對朋友說"把那個水果拿給我"時,如果桌上有好幾種水果,你的朋友肯定會問"你要哪個?蘋果還是橙子?"這種自然的澄清對話對人類來說再簡單不過,但對機器人而言卻是一個巨大的技術挑戰(zhàn)。長期以來,機器人就像是只會按指令行事的執(zhí)行者,面對模糊指令時要么隨機選擇,要么干脆罷工。而復旦大學這個研究團隊的最新成果,讓機器人首次具備了"問問題"的能力,真正從被動的指令執(zhí)行者進化為能夠主動溝通的合作伙伴。

這項突破性研究的核心在于開發(fā)了一個名為"Ask-to-Clarify"(詢問澄清)的框架。這個框架就像給機器人裝上了一個"智能大腦",讓它能夠識別指令中的歧義,主動提出澄清問題,然后根據(jù)人類的回答準確執(zhí)行任務。更令人驚喜的是,這個系統(tǒng)不僅能問問題,還能在澄清后直接生成精確的低級動作指令,實現(xiàn)端到端的任務執(zhí)行。

研究團隊在8個真實世界任務中測試了這個框架,結果令人振奮。相比于現(xiàn)有的最先進機器人系統(tǒng),Ask-to-Clarify框架在所有任務上都表現(xiàn)出了顯著的優(yōu)越性。這意味著我們距離擁有真正智能的家庭助理機器人又近了一大步,這些機器人不僅能理解我們的指令,還能在不確定時主動與我們溝通,就像一個貼心的生活伙伴。

一、問題的核心:機器人為什么總是"聽不懂話"

想象一下這樣的場景:你回到家,疲憊地對家庭機器人說"給我倒杯水",結果機器人呆呆地站在那里不動,或者胡亂地拿起桌上任何一個杯子。這種尷尬的情況在當前的機器人系統(tǒng)中經常發(fā)生,根本原因在于人類的語言天生就充滿了歧義性。

我們人類在日常交流中,經常使用模糊、簡略或指代不明的表達。比如"把那個東西拿過來"、"打開燈"(哪盞燈?)、"整理一下桌子"(整理到什么程度?)。對于人類來說,這些表達在特定情境下都是可以理解的,因為我們會通過眼神交流、手勢指向或直接詢問來消除歧義。但傳統(tǒng)的機器人系統(tǒng)缺乏這種交互能力,它們只能按照預設程序執(zhí)行明確的指令。

這個問題的嚴重性不僅僅在于執(zhí)行錯誤,更在于它限制了機器人在真實世界中的應用。在實際的家庭或工作環(huán)境中,幾乎所有的人機交互都包含某種程度的歧義。如果機器人無法處理這些歧義,它們就永遠無法成為真正有用的助手。

研究團隊深入分析了現(xiàn)有機器人系統(tǒng)的局限性。他們發(fā)現(xiàn),目前最先進的視覺-語言-動作模型(VLA)雖然在技術上已經相當成熟,但都采用單向的指令執(zhí)行模式。這些系統(tǒng)接收指令后會立即嘗試執(zhí)行,沒有任何澄清或確認的環(huán)節(jié)。就像一個只會點頭說"是"的員工,不管指令多么模糊都會硬著頭皮去做。

更深層的問題在于,這些系統(tǒng)無法區(qū)分指令的明確性程度。對于"把紅色的蘋果放到藍色盤子里"這樣明確的指令,它們能夠很好地執(zhí)行。但對于"把水果放到盤子里"這樣的模糊指令,它們就會陷入困境。在有多個水果和多個盤子的情況下,系統(tǒng)要么隨機選擇,要么因為無法決策而失敗。

這種單向執(zhí)行模式的根本缺陷在于缺乏反饋機制。真正的合作需要雙向溝通,需要在不確定時尋求澄清,需要根據(jù)反饋調整行為。而現(xiàn)有的機器人系統(tǒng)在這些方面都存在嚴重不足。

二、突破性的解決方案:讓機器人學會"問話"的藝術

面對這個挑戰(zhàn),復旦大學研究團隊提出了一個巧妙的解決方案,就像教會機器人"問話"的藝術。他們開發(fā)的Ask-to-Clarify框架可以形象地比作給機器人裝上了一套"智能溝通系統(tǒng)",讓它能夠識別指令中的模糊之處,主動提出問題,并根據(jù)人類的回答做出準確的行動。

這個框架的工作原理類似于一個經驗豐富的服務員。當顧客說"給我來一份主菜"時,好的服務員不會隨便上一道菜,而是會問"您想要牛排、雞肉還是魚?"同樣,當機器人接收到模糊指令時,Ask-to-Clarify系統(tǒng)會分析指令的歧義性,然后提出針對性的澄清問題。

整個系統(tǒng)由兩個核心組件構成,就像人腦的兩個不同區(qū)域分工合作。第一個組件是"合作部分",基于先進的視覺-語言模型構建,專門負責理解場景、識別歧義并生成澄清問題。這部分就像機器人的"語言中心",能夠理解人類的表達并進行自然的對話。第二個組件是"行動部分",采用擴散模型技術,專門負責生成精確的低級動作指令。這部分就像機器人的"運動皮層",將抽象的任務轉化為具體的機械動作。

為了讓這兩個組件協(xié)調工作,研究團隊還設計了一個巧妙的"連接模塊"。這個模塊的作用類似于翻譯官,它能夠將語言理解的結果轉化為動作生成所需的條件信號。更重要的是,這個模塊能夠根據(jù)澄清后的指令調整視覺觀察,為動作生成提供更可靠、更精確的條件。

系統(tǒng)的工作流程非常自然流暢。當接收到指令"把水果放到盤子上"時,合作組件首先分析當前場景,發(fā)現(xiàn)桌上有蘋果、橙子和桃子三種水果。系統(tǒng)立即識別出這個指令存在歧義,于是生成澄清問題:"您要的是蘋果嗎?"如果用戶回答"不是",系統(tǒng)會繼續(xù)問:"是橙子嗎?"直到獲得明確答案。一旦歧義消除,系統(tǒng)就會生成清晰的指令"把橙子放到盤子上",然后由行動組件接管,生成精確的機械臂動作序列來完成任務。

這種設計的巧妙之處在于它模擬了人類處理歧義的自然方式。我們在面對不確定情況時也是這樣處理的:先嘗試理解,發(fā)現(xiàn)歧義后主動詢問,獲得澄清后再行動。這種方式不僅提高了任務執(zhí)行的準確性,也讓人機交互變得更加自然和友好。

三、創(chuàng)新的訓練策略:兩階段"知識隔離"方法

訓練這樣一個復雜的系統(tǒng)面臨著獨特的挑戰(zhàn),就像要教一個人既要擅長交談又要精通手工藝。如果同時訓練這兩種能力,很可能會相互干擾,導致哪個都學不好。為了解決這個問題,研究團隊開發(fā)了一種創(chuàng)新的"兩階段知識隔離"訓練策略,這種方法可以比作分科目學習然后融會貫通的教育方式。

第一階段專門訓練"溝通技能"。研究團隊首先為合作組件準備了大量的歧義解決對話數(shù)據(jù)。這些數(shù)據(jù)就像是專門設計的溝通課程,包含了各種模糊指令、相應的澄清問題和正確的回答。系統(tǒng)在這個階段學會了如何識別指令中的歧義,如何提出合適的問題,以及如何根據(jù)用戶回答推導出正確的指令。

在這個階段,研究團隊還引入了特殊的信號標記系統(tǒng),就像給機器人裝上了"情緒表達"功能。當系統(tǒng)識別出模糊指令時,它會生成帶有特殊標記的回應,比如用特殊符號標記"這個指令不清楚,需要澄清"。當通過對話澄清了指令后,系統(tǒng)會生成另一個標記表示"現(xiàn)在指令清楚了,可以執(zhí)行了"。這種標記系統(tǒng)為后續(xù)的無縫切換奠定了基礎。

訓練過程中,研究團隊采用了"知識隔離"的策略。他們凍結了視覺編碼器的參數(shù),只微調語言模型部分。這樣做的好處是既能保持系統(tǒng)原有的視覺理解能力,又能專門強化對話交互能力,避免新舊知識之間的沖突。

第二階段專注于"動作技能"的集成。在這個階段,研究團隊保持合作組件完全凍結,專門訓練行動組件。這就像是在保持溝通能力不變的前提下,專門練習手工技能。通過這種方式,系統(tǒng)既保持了第一階段學到的對話能力,又獲得了精確的動作執(zhí)行能力。

為了實現(xiàn)兩個組件之間的順暢協(xié)作,連接模塊在這個階段發(fā)揮了關鍵作用。它學會了如何將澄清后的指令轉化為更好的動作條件。這個過程類似于大腦中語言區(qū)域和運動區(qū)域之間的協(xié)調。連接模塊不僅傳遞信息,還會根據(jù)指令內容調整視覺觀察的重點,確保動作生成能夠獲得最相關的視覺信息。

這種兩階段訓練策略的優(yōu)勢是顯而易見的。它避免了同時訓練多個復雜能力時可能出現(xiàn)的相互干擾,確保每個組件都能達到最佳性能。同時,通過知識隔離,系統(tǒng)能夠在獲得新能力的同時保持原有能力不受損失。

更重要的是,這種訓練方式是可擴展的。隨著技術的發(fā)展,可以在不影響現(xiàn)有能力的情況下繼續(xù)添加新的功能模塊。這為未來開發(fā)更復雜的機器人系統(tǒng)提供了可行的技術路徑。

四、智能的信號檢測系統(tǒng):讓機器人學會"察言觀色"

訓練完成后,如何讓機器人在實際使用中自動決定什么時候問問題、什么時候直接行動,這是一個關鍵的技術挑戰(zhàn)。研究團隊為此開發(fā)了一個巧妙的"信號檢測系統(tǒng)",這個系統(tǒng)就像是機器人的"直覺判斷中心",能夠在不同的工作模式之間無縫切換。

這個檢測系統(tǒng)的工作原理可以比作一個經驗豐富的接待員。當有人走進辦公室說"我要找王經理"時,如果公司里只有一個王經理,接待員會直接帶路;但如果有多個王經理,接待員就會問"您要找的是會計部的王經理還是市場部的王經理?"這種判斷能力正是信號檢測系統(tǒng)的核心功能。

在Ask-to-Clarify框架中,研究團隊設計了四種關鍵的信號標記,每種都對應特定的情況和應對策略。當系統(tǒng)接收到指令后,合作組件會在輸出的最后生成一個信號標記,檢測系統(tǒng)根據(jù)這個標記決定下一步的行動。

第一種信號表示"指令模糊,需要澄清"。當檢測到這個信號時,系統(tǒng)會進入對話模式,開始提出澄清問題。這就像是機器人在說"我不太確定您的意思,能否詳細說明一下?"系統(tǒng)會耐心地與用戶進行多輪對話,直到完全理解用戶的真實意圖。

第二種信號表示"指令已經明確,可以執(zhí)行"。當通過對話澄清了用戶意圖后,系統(tǒng)會生成這個信號,表示現(xiàn)在可以開始執(zhí)行任務了。這時檢測系統(tǒng)會提取澄清后的準確指令,并將控制權轉移給行動組件。

第三種信號表示"可以執(zhí)行",第四種信號表示"拒絕執(zhí)行"。這兩個信號是系統(tǒng)在獲得明確指令后的最終判斷。系統(tǒng)會檢查目標物體是否在當前視野中,如果在就執(zhí)行,如果不在就禮貌地拒絕。這就像是一個負責任的助手,在無法完成任務時會如實告知,而不是勉強行事。

檢測系統(tǒng)的智能之處在于它能夠維護完整的對話歷史。每一輪的問題和回答都會被記錄下來,作為下一輪判斷的依據(jù)。這確保了對話的連貫性和邏輯性,避免了重復詢問或前后矛盾的問題。

更令人印象深刻的是,這個系統(tǒng)完全不需要額外的訓練。它是基于訓練階段學到的信號標記工作的,在推理時自動激活。這種設計大大簡化了系統(tǒng)的部署和維護,也提高了實際應用的可靠性。

在實際工作中,信號檢測系統(tǒng)的響應速度非常快,幾乎不會造成任何延遲。用戶感受到的是一個反應敏捷、判斷準確的智能助手,而不是一個需要等待處理的機械系統(tǒng)。

五、真實世界的驚艷表現(xiàn):8項任務全面勝出

為了驗證Ask-to-Clarify框架的實際效果,研究團隊設計了一系列貼近真實生活的測試任務。這些測試就像是給機器人進行的"實習考核",涵蓋了家庭環(huán)境中最常見的操作需求。測試使用的是xArm 7機械臂,配備了RealSense攝像頭,完全模擬真實的家庭機器人使用場景。

測試任務分為三大類,每類都針對不同的生活場景。第一類是"放置任務",比如"把水果放到盤子上",其中水果可能是蘋果、桃子或橙子。第二類是"傾倒任務",比如"把水從杯子里倒到盤子上",其中杯子可能是紅色、綠色或白色的。第三類是"堆疊任務",比如"把積木摞起來",涉及不同顏色積木的組合。

測試結果令人振奮。Ask-to-Clarify框架在所有8個任務上都顯著超越了現(xiàn)有的最先進系統(tǒng)。在放置任務中,系統(tǒng)達到了95%的成功率,在傾倒任務中達到了98.3%,在堆疊任務中也達到了90%。相比之下,傳統(tǒng)的機器人系統(tǒng)要么完全無法完成任務,要么成功率極低。

更讓人驚訝的是測試條件的設置。研究團隊特意為Ask-to-Clarify系統(tǒng)使用了模糊指令,需要它通過對話澄清才能執(zhí)行。而對照的基準系統(tǒng)則直接獲得了明確的指令。即使在這種"不公平"的比較條件下,Ask-to-Clarify框架仍然表現(xiàn)出色,這充分證明了其澄清對話功能的有效性。

研究團隊還深入分析了一些基準系統(tǒng)失敗的原因。他們發(fā)現(xiàn),一些采用層次化架構的系統(tǒng)雖然也使用了擴散模型作為動作專家,但由于缺乏有效的連接機制,導致不同指令產生的條件信號過于相似。通過計算相似度矩陣,他們發(fā)現(xiàn)這些系統(tǒng)面對"放蘋果"、"放桃子"、"放橙子"等不同指令時,生成的條件幾乎完全相同,自然無法正確執(zhí)行任務。

而Ask-to-Clarify框架通過連接模塊的調節(jié),能夠為不同的指令生成顯著不同的條件信號。這就像是給每個任務配備了專門的"操作指南",確保機械臂能夠準確理解并執(zhí)行每個具體任務。

測試還包括了對系統(tǒng)協(xié)作能力的專門評估。研究團隊設計了"存在"和"缺失"兩種場景。在"存在"場景中,目標物體在桌面上,系統(tǒng)需要通過對話確認并執(zhí)行任務。在"缺失"場景中,目標物體不在視野內,系統(tǒng)需要禮貌地拒絕執(zhí)行。結果顯示,Ask-to-Clarify框架在兩種場景下都表現(xiàn)優(yōu)異,證明了其智能判斷和適當拒絕的能力。

六、系統(tǒng)韌性測試:在困難條件下依然表現(xiàn)出色

真實世界的環(huán)境往往比實驗室條件更加復雜和苛刻。為了驗證Ask-to-Clarify框架的實用性,研究團隊進行了一系列"壓力測試",模擬各種可能影響系統(tǒng)性能的不利條件。

第一項測試模擬了光線不足的環(huán)境。研究團隊關閉了一半的照明設備,創(chuàng)造出類似傍晚或陰天室內的光線條件。在這種情況下,傳統(tǒng)的機器人系統(tǒng)性能急劇下降,成功率從57.5%暴跌到22.5%。而Ask-to-Clarify框架的表現(xiàn)要穩(wěn)定得多,成功率僅從90%下降到80%,展現(xiàn)出了優(yōu)異的適應性。

這種差異的原因很有意思。傳統(tǒng)系統(tǒng)為了適應特定任務,需要對整個模型進行微調,這使得它們過度擬合了訓練時的光線條件。一旦環(huán)境發(fā)生變化,性能就會大幅下降。而Ask-to-Clarify框架采用知識隔離策略,保持視覺編碼器凍結,因此保留了在各種環(huán)境條件下的通用視覺理解能力。

第二項測試引入了視覺干擾物。研究團隊在測試環(huán)境中放置了石榴等與目標物體(如蘋果)外觀相似的干擾物。這種測試模擬了現(xiàn)實生活中常見的情況,比如廚房臺面上同時擺放著多種相似的食材。結果顯示,Ask-to-Clarify框架的成功率從95%下降到80%,而基準系統(tǒng)的成功率從95%下降到65%。

這個結果特別有意義,因為它表明Ask-to-Clarify框架不僅能夠處理指令歧義,還能在一定程度上應對視覺歧義。當系統(tǒng)遇到外觀相似的物體時,它的對話澄清機制能夠幫助用戶指定正確的目標,從而提高任務執(zhí)行的準確性。

研究團隊還測試了系統(tǒng)在不同復雜程度任務中的表現(xiàn)。他們發(fā)現(xiàn),隨著任務復雜度的增加,Ask-to-Clarify框架的優(yōu)勢變得更加明顯。在簡單任務中,傳統(tǒng)系統(tǒng)可能還能勉強應付,但在涉及多個物體、多個屬性的復雜任務中,只有具備澄清對話能力的系統(tǒng)才能可靠地完成任務。

這些韌性測試的結果證明了Ask-to-Clarify框架不僅在理想條件下表現(xiàn)優(yōu)異,在面對真實世界的各種挑戰(zhàn)時也能保持穩(wěn)定的性能。這種魯棒性對于實際部署的機器人系統(tǒng)來說至關重要。

七、深度解析:為什么這個方案如此有效

Ask-to-Clarify框架的成功不是偶然的,它的設計理念和技術實現(xiàn)都體現(xiàn)了深刻的洞察力。通過深入分析,我們可以理解這個系統(tǒng)為什么能夠取得如此出色的效果。

首先,這個框架抓住了人機交互的本質特征。人類之間的有效溝通建立在雙向反饋的基礎上,當信息不明確時,我們會自然地尋求澄清。Ask-to-Clarify框架將這種自然的溝通模式引入了機器人系統(tǒng),讓人機交互變得更加自然和高效。

系統(tǒng)架構的模塊化設計是另一個關鍵因素。通過將語言理解和動作生成分離,每個組件都能專注于自己最擅長的任務。這種分工合作的方式不僅提高了整體性能,也增強了系統(tǒng)的可維護性和可擴展性。

連接模塊的設計尤其巧妙。它不是簡單的信息傳遞通道,而是一個智能的信息處理器,能夠根據(jù)澄清后的指令調整視覺觀察的重點。這種基于指令的觀察調節(jié)機制確保了動作生成能夠獲得最相關的信息,大大提高了執(zhí)行精度。

兩階段知識隔離訓練策略解決了多目標學習中的經典難題。通過時間上的分離,系統(tǒng)避免了不同能力之間的相互干擾,確保每個組件都能達到最佳狀態(tài)。更重要的是,這種策略具有很強的可復現(xiàn)性,為其他研究提供了寶貴的方法論指導。

信號檢測系統(tǒng)的無訓練設計體現(xiàn)了工程上的智慧。通過在第一階段訓練中嵌入信號標記,系統(tǒng)在推理時能夠自動進行模式切換,無需額外的判決模塊。這種設計簡化了系統(tǒng)架構,提高了運行效率。

從更宏觀的角度看,Ask-to-Clarify框架代表了機器人技術發(fā)展的一個重要方向。它不再追求讓機器人變得更加"智能",而是讓機器人變得更加"協(xié)作"。這種理念轉變可能比單純的技術進步更加重要。

系統(tǒng)的成功還得益于對真實應用場景的深入理解。研究團隊沒有停留在實驗室演示的層面,而是認真考慮了部署在真實環(huán)境中可能遇到的各種挑戰(zhàn)。從光線變化到視覺干擾,從簡單任務到復雜操作,每個測試都貼近實際應用需求。

八、技術創(chuàng)新的深層價值和廣闊前景

Ask-to-Clarify框架的意義遠超出了技術本身的創(chuàng)新,它為整個機器人領域提供了新的思路和方向。這項研究的價值可以從多個層面來理解。

從技術發(fā)展的角度看,這個框架打破了傳統(tǒng)機器人系統(tǒng)的單向執(zhí)行模式,引入了雙向交互的新范式。這種變革不僅提高了任務執(zhí)行的準確性,更重要的是改變了人們對機器人能力邊界的認知。原來機器人不僅可以執(zhí)行指令,還可以主動參與指令的完善過程。

在實際應用方面,這項技術為家庭服務機器人的發(fā)展掃清了一個重要障礙。長期以來,模糊指令處理一直是家庭機器人實用化的主要技術瓶頸之一。Ask-to-Clarify框架的成功表明,這個問題是可以有效解決的,為家庭機器人的大規(guī)模普及奠定了基礎。

從人機交互的角度看,這個系統(tǒng)讓機器人變得更加"人性化"。它不再是冷冰冰的執(zhí)行工具,而是能夠主動溝通、尋求澄清的合作伙伴。這種改變有助于提高用戶對機器人的接受度和信任度,促進機器人技術在日常生活中的普及。

技術的可擴展性也值得關注。研究團隊提出的兩階段知識隔離訓練策略不僅適用于當前的任務,也為未來添加更多功能提供了框架。隨著技術的發(fā)展,可以在不影響現(xiàn)有能力的前提下,繼續(xù)增強系統(tǒng)的其他方面,比如情感理解、多任務協(xié)調等。

在產業(yè)發(fā)展方面,這項技術有望催生新的商業(yè)模式和應用場景。從智能家居到醫(yī)療輔助,從教育陪伴到工業(yè)協(xié)作,具備澄清對話能力的機器人系統(tǒng)在各個領域都有廣闊的應用前景。

研究團隊在論文中也誠實地指出了當前系統(tǒng)的局限性和未來改進方向。比如,連接模塊目前采用的是相對簡單的特征調制方法,未來可以探索更復雜的注意力機制或對比學習方法。這種開放的研究態(tài)度為后續(xù)的技術發(fā)展留下了充足的空間。

更重要的是,這項研究為機器人技術的發(fā)展提供了新的評價標準。傳統(tǒng)的機器人評估主要關注任務完成率和執(zhí)行精度,而Ask-to-Clarify框架引入了交互質量、澄清效率等新的評價維度。這些指標對于開發(fā)真正實用的機器人系統(tǒng)具有重要的指導意義。

從長遠來看,這種澄清對話技術可能成為未來智能系統(tǒng)的標準配置。無論是機器人、智能音箱還是其他人工智能產品,都需要具備處理模糊輸入的能力。Ask-to-Clarify框架為這一發(fā)展方向提供了寶貴的技術基礎和實現(xiàn)路徑。

說到底,復旦大學這個研究團隊的工作不僅僅是技術上的突破,更是對機器人與人類關系的重新定義。他們向我們展示了一個令人興奮的未來:機器人不再是被動的工具,而是能夠主動溝通、持續(xù)學習的智能伙伴。這種轉變可能比我們想象的更快到來,也比我們預期的更深刻地改變我們的生活方式。

對于普通人來說,這意味著未來的家庭機器人將更加貼心和實用。你不再需要費心思考如何用精確的語言下達指令,只需要像對待朋友一樣自然地表達需求,機器人會主動詢問不明確的地方,確保準確理解你的意圖。這樣的機器人助手不僅能幫你做事,還能在過程中與你愉快地交流,真正成為生活中的貼心伙伴。

Q&A

Q1:Ask-to-Clarify框架是什么?它與傳統(tǒng)機器人有什么區(qū)別?

A:Ask-to-Clarify是復旦大學團隊開發(fā)的新型機器人框架,最大特點是能夠主動詢問澄清模糊指令。傳統(tǒng)機器人只能被動執(zhí)行明確指令,遇到"把水果拿過來"這樣的模糊指令時要么隨機選擇要么失敗。而Ask-to-Clarify框架的機器人會主動問"您要蘋果還是橙子?",確認后再準確執(zhí)行。

Q2:這個技術什么時候能在家庭機器人中使用?

A:目前Ask-to-Clarify框架已在8個真實任務中驗證成功,技術相對成熟。不過從實驗室到商用產品還需要時間,預計在未來3-5年內可能會出現(xiàn)具備這種對話澄清能力的家庭機器人產品。成本下降和技術優(yōu)化是主要考慮因素。

Q3:Ask-to-Clarify框架在復雜環(huán)境下表現(xiàn)如何?

A:測試顯示該框架具有良好的適應性。在光線不足條件下,傳統(tǒng)系統(tǒng)成功率從57.5%跌至22.5%,而Ask-to-Clarify僅從90%降至80%。即使有視覺干擾物存在,該框架仍能保持80%的成功率,明顯優(yōu)于傳統(tǒng)系統(tǒng)的65%。

分享至
0贊

好文章,需要你的鼓勵

推薦文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-