av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

<big id="uo3lq"></big>

首頁(yè)
對(duì)話創(chuàng)新
對(duì)話科技行者
機(jī)器人新紀(jì)元
AI論文解讀
聯(lián)系我們

微信掃一掃，關(guān)注公眾號(hào)

科技行者
算力行者

見(jiàn)證連接與計(jì)算的「力量」

上海交大團(tuán)隊(duì)提出ALIGN3方法：讓AI像人類一樣遵守場(chǎng)景化規(guī)則

場(chǎng)景化AI安全測(cè)試時(shí)優(yōu)化規(guī)范對(duì)齊評(píng)估

上海交大團(tuán)隊(duì)提出ALIGN3方法：讓AI像人類一樣遵守場(chǎng)景化規(guī)則

作者：科技行者

2025-09-30 14:58

分享至：

上海交大等院校研究團(tuán)隊(duì)提出ALIGN3方法，通過(guò)三步思考法解決AI在不同場(chǎng)景下的規(guī)范遵守問(wèn)題。研究開(kāi)發(fā)了SPECBENCH測(cè)試平臺(tái)，涵蓋五個(gè)典型應(yīng)用場(chǎng)景和103項(xiàng)規(guī)范。實(shí)驗(yàn)顯示ALIGN3將AI規(guī)范對(duì)齊率提升11.89%，在幾乎零額外成本下實(shí)現(xiàn)安全性和有用性的最佳平衡，為AI安全研究提供新范式。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2025-09-30 14:58 ? 科技行者

在人工智能快速發(fā)展的今天，大型語(yǔ)言模型（如ChatGPT、Claude等）正在越來(lái)越多地應(yīng)用到我們生活的方方面面。不過(guò)，這些AI助手在不同場(chǎng)景下如何既保證安全又提供有用幫助，一直是個(gè)讓人頭疼的問(wèn)題。來(lái)自上海交通大學(xué)、香港中文大學(xué)等知名院校的研究團(tuán)隊(duì)最近發(fā)表了一項(xiàng)重要研究，提出了一種名為ALIGN3的創(chuàng)新方法，專門解決AI在特定場(chǎng)景下的"規(guī)矩遵守"問(wèn)題。這項(xiàng)研究發(fā)表于2025年9月的arXiv預(yù)印本平臺(tái)，感興趣的讀者可以通過(guò)arXiv:2509.14760v1獲取完整論文。

研究團(tuán)隊(duì)由上海交通大學(xué)的張浩然、劉東睿，香港中文大學(xué)的李亞夫、程宇，上海AI實(shí)驗(yàn)室的胡旭陽(yáng)，中科大的王志林，以及伊利諾伊大學(xué)厄巴納-香檳分校的李博組成，可以說(shuō)是一個(gè)國(guó)際化的頂尖陣容。

要理解這項(xiàng)研究的重要性，我們可以把AI想象成一個(gè)剛剛學(xué)會(huì)說(shuō)話的聰明孩子。這個(gè)孩子雖然知識(shí)淵博，但在不同的環(huán)境中需要遵守不同的規(guī)則：在圖書館里要保持安靜，在游樂(lè)場(chǎng)可以放聲大笑，在醫(yī)院里需要格外小心用詞。同樣，AI在為兒童講故事時(shí)必須確保內(nèi)容積極向上，在協(xié)助編程時(shí)要注重安全防護(hù)，在提供健康建議時(shí)既要有用又不能越界給出診斷。傳統(tǒng)的AI訓(xùn)練方法就像給孩子制定了一套"通用規(guī)則"，但現(xiàn)實(shí)世界遠(yuǎn)比這復(fù)雜。

一、場(chǎng)景化規(guī)范對(duì)齊：AI的"因地制宜"挑戰(zhàn)

研究團(tuán)隊(duì)發(fā)現(xiàn)，現(xiàn)有的AI系統(tǒng)面臨一個(gè)核心問(wèn)題：如何在不同場(chǎng)景下恰當(dāng)?shù)仄胶獍踩院陀杏眯?。這就像一個(gè)萬(wàn)能助手需要在醫(yī)院當(dāng)護(hù)士、在學(xué)校當(dāng)老師、在實(shí)驗(yàn)室當(dāng)研究員，每個(gè)角色都有完全不同的行為準(zhǔn)則和服務(wù)標(biāo)準(zhǔn)。

傳統(tǒng)的AI安全訓(xùn)練方法采用"一刀切"的策略，就像給所有場(chǎng)景制定同一套嚴(yán)格的規(guī)章制度。這種方法的問(wèn)題是，要么過(guò)于寬松導(dǎo)致安全隱患，要么過(guò)于嚴(yán)格導(dǎo)致AI在很多情況下變得"不敢說(shuō)話"，拒絕提供任何可能有爭(zhēng)議的信息，哪怕這些信息對(duì)用戶是有幫助的。

研究團(tuán)隊(duì)提出了"場(chǎng)景化規(guī)范對(duì)齊"這個(gè)全新概念。簡(jiǎn)單來(lái)說(shuō)，就是讓AI學(xué)會(huì)在不同的應(yīng)用場(chǎng)景中遵守相應(yīng)的專門規(guī)則。這些規(guī)則分為兩大類：安全規(guī)范和行為規(guī)范。安全規(guī)范就像交通法規(guī)，是絕對(duì)不能違反的底線；行為規(guī)范則像禮儀準(zhǔn)則，決定了AI如何更好地為特定場(chǎng)景的用戶服務(wù)。

比如，在為兒童創(chuàng)作故事的場(chǎng)景中，安全規(guī)范要求絕對(duì)不能包含暴力、仇恨或不當(dāng)內(nèi)容，而行為規(guī)范則要求故事要有教育意義、語(yǔ)言要適合兒童理解、要包含正面的價(jià)值觀引導(dǎo)。在代碼開(kāi)發(fā)場(chǎng)景中，安全規(guī)范要求不能生成惡意軟件或安全漏洞，行為規(guī)范則要求代碼要有詳細(xì)注釋、遵循編程最佳實(shí)踐、提供安全的實(shí)現(xiàn)方案。

二、SPECBENCH基準(zhǔn)測(cè)試：AI規(guī)矩遵守的"考試系統(tǒng)"

為了科學(xué)地評(píng)估AI在不同場(chǎng)景下的表現(xiàn)，研究團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)名為SPECBENCH的綜合性測(cè)試平臺(tái)。這個(gè)平臺(tái)就像一個(gè)多科目的標(biāo)準(zhǔn)化考試，專門測(cè)試AI是否能在各種情況下既遵守規(guī)則又提供有用幫助。

SPECBENCH涵蓋了五個(gè)典型的應(yīng)用場(chǎng)景。首先是生物化學(xué)實(shí)驗(yàn)指導(dǎo)場(chǎng)景，這里AI需要提供準(zhǔn)確的實(shí)驗(yàn)步驟，同時(shí)絕對(duì)不能泄露任何可能被惡意利用的危險(xiǎn)信息。其次是兒童故事創(chuàng)作場(chǎng)景，要求AI創(chuàng)作的內(nèi)容既要引人入勝又要絕對(duì)安全健康。第三個(gè)是代碼開(kāi)發(fā)和安全操作場(chǎng)景，AI需要幫助程序員寫出既功能完善又安全可靠的代碼。第四個(gè)是個(gè)人健康教育場(chǎng)景，AI要提供有用的健康信息，但絕不能越界進(jìn)行醫(yī)療診斷。最后是旅行規(guī)劃場(chǎng)景，要求AI提供實(shí)用的旅行建議同時(shí)確保推薦內(nèi)容的安全性。

這個(gè)測(cè)試平臺(tái)包含了103項(xiàng)具體規(guī)范和1500個(gè)測(cè)試問(wèn)題。每個(gè)場(chǎng)景大約有20項(xiàng)規(guī)范，其中一半是安全規(guī)范，一半是行為規(guī)范。測(cè)試問(wèn)題被精心設(shè)計(jì)，包括200個(gè)可能觸發(fā)安全問(wèn)題的"陷阱題"和100個(gè)正常的安全問(wèn)題。為了模擬真實(shí)世界中惡意用戶可能采用的策略，研究團(tuán)隊(duì)還使用了一種叫做"WildTeaming"的技術(shù)來(lái)增強(qiáng)測(cè)試題的難度，就像給考試增加了更多刁鉆的題目。

評(píng)估方法也很有意思。研究團(tuán)隊(duì)設(shè)計(jì)了一個(gè)叫做"規(guī)范對(duì)齊率"（SAR）的綜合評(píng)分系統(tǒng)。這個(gè)系統(tǒng)就像給學(xué)生打分，但有個(gè)特殊規(guī)則：如果違反了任何安全規(guī)范，總分直接歸零；只有在安全規(guī)范全部通過(guò)的前提下，才會(huì)根據(jù)行為規(guī)范的遵守情況給予相應(yīng)分?jǐn)?shù)。這種設(shè)計(jì)反映了現(xiàn)實(shí)世界的要求：安全是絕對(duì)前提，有用性是在安全基礎(chǔ)上的追求。

三、ALIGN3方法：AI的"三步思考法"

面對(duì)場(chǎng)景化規(guī)范對(duì)齊的挑戰(zhàn)，研究團(tuán)隊(duì)提出了ALIGN3這個(gè)創(chuàng)新解決方案。這個(gè)方法的核心思想是讓AI在回答問(wèn)題時(shí)采用"三步思考法"，就像一個(gè)謹(jǐn)慎的專家在給出建議前會(huì)進(jìn)行多輪深入思考一樣。

第一步是"行為優(yōu)化"。在這個(gè)階段，AI專注于理解用戶的需求，并思考如何提供最有幫助的回答。系統(tǒng)會(huì)展示相關(guān)的行為規(guī)范，讓AI明確在當(dāng)前場(chǎng)景下應(yīng)該如何表現(xiàn)才能最大化地幫助用戶。這就像一個(gè)醫(yī)生在診斷前先了解患者的具體情況和需求。

第二步是"安全引導(dǎo)修正"。當(dāng)AI快要完成思考時(shí)，系統(tǒng)會(huì)引入安全規(guī)范，讓AI重新審視自己的回答是否存在安全風(fēng)險(xiǎn)。如果發(fā)現(xiàn)問(wèn)題，AI會(huì)及時(shí)調(diào)整回答內(nèi)容，確保不會(huì)產(chǎn)生任何潛在危害。這個(gè)過(guò)程就像一個(gè)編輯在文章發(fā)表前進(jìn)行最后的安全檢查。

第三步是"全面規(guī)范審核"。在給出最終答案前，AI會(huì)同時(shí)考慮所有的安全規(guī)范和行為規(guī)范，進(jìn)行一次綜合性的檢查和完善。這確保了最終的回答既安全又有用，達(dá)到了最優(yōu)的平衡狀態(tài)。

這種三步法的巧妙之處在于將復(fù)雜的多目標(biāo)優(yōu)化問(wèn)題分解成了更容易處理的子問(wèn)題。傳統(tǒng)方法試圖讓AI同時(shí)兼顧安全性和有用性，往往導(dǎo)致兩頭不討好的結(jié)果。ALIGN3通過(guò)分步驟的漸進(jìn)式優(yōu)化，顯著提高了AI在復(fù)雜場(chǎng)景下的表現(xiàn)。

四、實(shí)驗(yàn)結(jié)果：顯著提升AI的"規(guī)矩意識(shí)"

研究團(tuán)隊(duì)對(duì)33個(gè)不同的AI模型進(jìn)行了全面測(cè)試，包括18個(gè)傳統(tǒng)的指令遵循模型和15個(gè)具備推理能力的模型。測(cè)試覆蓋了從小型的6億參數(shù)模型到大型的70億參數(shù)模型，以及包括GPT-4.1、Gemini-2.5等在內(nèi)的先進(jìn)閉源模型。

實(shí)驗(yàn)結(jié)果令人印象深刻。以Qwen3-14B模型為例，使用ALIGN3方法后，其規(guī)范對(duì)齊率從51.03%大幅提升到62.92%，提升幅度達(dá)到11.89%。更重要的是，這種提升是在幾乎不增加計(jì)算開(kāi)銷的情況下實(shí)現(xiàn)的，額外的token消耗不到2000個(gè)，相比傳統(tǒng)方法的數(shù)萬(wàn)個(gè)token消耗，效率提升顯著。

有趣的是，研究發(fā)現(xiàn)具備推理能力的模型（思維鏈模型）普遍比傳統(tǒng)的指令遵循模型表現(xiàn)更好。比如Qwen3-32B的思維鏈版本比普通版本的規(guī)范對(duì)齊率高出7.65%。這表明讓AI"慢慢思考"確實(shí)有助于更好地處理復(fù)雜的規(guī)范要求。

實(shí)驗(yàn)還揭示了一個(gè)重要現(xiàn)象：安全性和有用性之間確實(shí)存在權(quán)衡關(guān)系。一些專門針對(duì)安全性進(jìn)行優(yōu)化的模型，雖然在安全規(guī)范方面表現(xiàn)優(yōu)異，但往往在提供有用信息方面有所欠缺，傾向于過(guò)度拒絕用戶請(qǐng)求。而ALIGN3方法成功地在這兩個(gè)目標(biāo)之間找到了更好的平衡點(diǎn)。

研究團(tuán)隊(duì)還發(fā)現(xiàn)，不同場(chǎng)景的難度差異很大。代碼開(kāi)發(fā)和生物化學(xué)實(shí)驗(yàn)場(chǎng)景是最具挑戰(zhàn)性的，因?yàn)檫@些領(lǐng)域的安全規(guī)范更加嚴(yán)格和復(fù)雜。相比之下，健康教育場(chǎng)景相對(duì)容易一些，但仍然需要AI在提供有用建議和避免醫(yī)療風(fēng)險(xiǎn)之間找到平衡。

五、創(chuàng)新意義：推動(dòng)AI安全的新范式

這項(xiàng)研究的創(chuàng)新意義遠(yuǎn)超技術(shù)層面。首先，它提出了"場(chǎng)景化規(guī)范對(duì)齊"這個(gè)全新的研究方向，改變了AI安全研究中"一刀切"的傳統(tǒng)思路。這就像從制定全球統(tǒng)一法律轉(zhuǎn)向?yàn)椴煌瑖?guó)家和地區(qū)制定適合的法律體系，更加符合現(xiàn)實(shí)世界的復(fù)雜性和多樣性。

其次，ALIGN3方法展示了"測(cè)試時(shí)優(yōu)化"的巨大潛力。傳統(tǒng)的AI安全方法主要依賴訓(xùn)練階段的大量數(shù)據(jù)和計(jì)算資源，而ALIGN3證明了在推理階段進(jìn)行精心設(shè)計(jì)的優(yōu)化同樣能取得顯著效果，而且更加靈活和經(jīng)濟(jì)。這為那些沒(méi)有大量計(jì)算資源進(jìn)行重新訓(xùn)練的組織提供了新的選擇。

第三，SPECBENCH基準(zhǔn)測(cè)試為AI安全評(píng)估提供了新的標(biāo)準(zhǔn)和工具。這個(gè)平臺(tái)不僅能夠系統(tǒng)性地評(píng)估AI在不同場(chǎng)景下的表現(xiàn)，還為未來(lái)的相關(guān)研究提供了統(tǒng)一的比較基礎(chǔ)。就像標(biāo)準(zhǔn)化考試為教育評(píng)估提供了統(tǒng)一標(biāo)準(zhǔn)一樣，SPECBENCH為AI安全研究建立了重要的評(píng)估框架。

研究還揭示了一個(gè)重要趨勢(shì)：隨著AI模型規(guī)模的增大，其規(guī)范對(duì)齊能力也在提升，但這種提升并非線性的。這為AI模型的發(fā)展方向提供了重要參考：僅僅增大模型規(guī)模是不夠的，還需要配合適當(dāng)?shù)挠?xùn)練和優(yōu)化策略。

六、實(shí)際應(yīng)用前景：改變AI服務(wù)的未來(lái)

這項(xiàng)研究的實(shí)際應(yīng)用前景廣闊而深遠(yuǎn)。在教育領(lǐng)域，基于ALIGN3的AI系統(tǒng)可以為不同年齡段的學(xué)生提供個(gè)性化的學(xué)習(xí)內(nèi)容，既確保內(nèi)容的適宜性，又最大化學(xué)習(xí)效果。在醫(yī)療健康領(lǐng)域，AI助手可以在提供有用健康信息的同時(shí)嚴(yán)格避免越界行為，為用戶提供更安全可靠的健康指導(dǎo)。

在企業(yè)應(yīng)用中，不同行業(yè)和部門可以根據(jù)自己的具體需求定制AI助手的行為規(guī)范。比如，金融機(jī)構(gòu)的AI客服需要嚴(yán)格遵守金融監(jiān)管要求，而創(chuàng)意公司的AI助手則可以更加開(kāi)放和靈活。這種場(chǎng)景化的定制能力將大大提升AI在垂直領(lǐng)域的應(yīng)用價(jià)值。

對(duì)于AI開(kāi)發(fā)者和研究者來(lái)說(shuō)，這項(xiàng)研究提供了一套完整的方法論和評(píng)估工具。他們可以基于SPECBENCH平臺(tái)測(cè)試自己的模型，使用ALIGN3方法改進(jìn)模型性能，或者針對(duì)特定應(yīng)用場(chǎng)景開(kāi)發(fā)專門的規(guī)范體系。

更重要的是，這項(xiàng)研究為AI治理和監(jiān)管提供了新的思路。傳統(tǒng)的AI監(jiān)管往往采用"一刀切"的方式，對(duì)所有應(yīng)用場(chǎng)景施加同樣的限制。而場(chǎng)景化規(guī)范對(duì)齊的理念提示我們，可以根據(jù)不同應(yīng)用場(chǎng)景的風(fēng)險(xiǎn)特點(diǎn)制定差異化的監(jiān)管策略，既保證安全又促進(jìn)創(chuàng)新。

七、未來(lái)發(fā)展方向：更智能的規(guī)范遵守

雖然ALIGN3方法已經(jīng)取得了顯著成果，但這只是場(chǎng)景化規(guī)范對(duì)齊研究的開(kāi)始。研究團(tuán)隊(duì)指出了幾個(gè)重要的未來(lái)發(fā)展方向。

首先是規(guī)范的動(dòng)態(tài)適應(yīng)能力。目前的方法需要事先定義好各種規(guī)范，但在真實(shí)應(yīng)用中，規(guī)范可能需要根據(jù)具體情況進(jìn)行調(diào)整。未來(lái)的系統(tǒng)應(yīng)該能夠?qū)W習(xí)和適應(yīng)新的規(guī)范要求，就像人類能夠根據(jù)新的社會(huì)規(guī)則調(diào)整自己的行為一樣。

其次是多場(chǎng)景的融合處理?，F(xiàn)實(shí)中很多問(wèn)題可能涉及多個(gè)場(chǎng)景，比如一個(gè)既涉及健康又涉及兒童教育的問(wèn)題。如何讓AI在這種復(fù)雜情況下仍然能夠恰當(dāng)?shù)仄胶獠煌瑘?chǎng)景的規(guī)范要求，是一個(gè)值得深入研究的問(wèn)題。

第三是個(gè)性化規(guī)范的支持。不同的用戶和組織可能對(duì)同一場(chǎng)景有不同的規(guī)范要求。未來(lái)的系統(tǒng)應(yīng)該能夠支持用戶自定義規(guī)范，并在保證基本安全底線的前提下提供個(gè)性化的服務(wù)。

最后是跨語(yǔ)言和跨文化的規(guī)范適應(yīng)。不同文化背景下的安全標(biāo)準(zhǔn)和行為規(guī)范可能存在差異，如何讓AI系統(tǒng)能夠理解和適應(yīng)這些差異，為全球用戶提供本地化的服務(wù)，也是一個(gè)重要的研究方向。

研究團(tuán)隊(duì)還特別強(qiáng)調(diào)了開(kāi)源共享的重要性。他們已經(jīng)將SPECBENCH測(cè)試平臺(tái)、ALIGN3方法的實(shí)現(xiàn)代碼以及完整的實(shí)驗(yàn)數(shù)據(jù)公開(kāi)發(fā)布，希望能夠推動(dòng)整個(gè)AI安全研究社區(qū)的共同進(jìn)步。這種開(kāi)放的研究態(tài)度為后續(xù)的改進(jìn)和創(chuàng)新奠定了良好基礎(chǔ)。

說(shuō)到底，這項(xiàng)研究解決的是AI時(shí)代一個(gè)根本性問(wèn)題：如何讓機(jī)器既聰明又懂規(guī)矩。ALIGN3方法就像給AI裝上了一個(gè)"道德指南針"，讓它能夠在復(fù)雜多變的現(xiàn)實(shí)世界中做出既安全又有用的決策。隨著AI技術(shù)在各行各業(yè)的深入應(yīng)用，這種場(chǎng)景化的規(guī)范對(duì)齊能力將變得越來(lái)越重要。畢竟，我們需要的不是一個(gè)只會(huì)說(shuō)"我不能回答這個(gè)問(wèn)題"的AI，而是一個(gè)既能幫助我們解決問(wèn)題又知道如何在不同情況下恰當(dāng)行事的智能助手。這項(xiàng)研究為實(shí)現(xiàn)這個(gè)目標(biāo)邁出了重要的一步，為AI技術(shù)的健康發(fā)展和廣泛應(yīng)用鋪平了道路。對(duì)于想要深入了解技術(shù)細(xì)節(jié)的讀者，可以通過(guò)arXiv:2509.14760v1獲取完整的研究論文，探索更多關(guān)于場(chǎng)景化AI安全的前沿思考。

Q&A

Q1：ALIGN3方法是什么？它是如何工作的？

A：ALIGN3是一種讓AI在特定場(chǎng)景下既安全又有用的三步思考方法。它先讓AI專注于提供有用回答，然后進(jìn)行安全檢查和調(diào)整，最后綜合審核所有規(guī)范要求。這種分步驟的方法比傳統(tǒng)的一次性優(yōu)化更有效，能顯著提升AI的規(guī)范遵守能力。

Q2：SPECBENCH測(cè)試平臺(tái)包含哪些場(chǎng)景？如何評(píng)估AI表現(xiàn)？

A：SPECBENCH包含五個(gè)典型應(yīng)用場(chǎng)景：生物化學(xué)實(shí)驗(yàn)指導(dǎo)、兒童故事創(chuàng)作、代碼開(kāi)發(fā)安全、個(gè)人健康教育和旅行規(guī)劃。它通過(guò)103項(xiàng)具體規(guī)范和1500個(gè)測(cè)試問(wèn)題來(lái)評(píng)估AI，采用規(guī)范對(duì)齊率（SAR）評(píng)分系統(tǒng)，違反安全規(guī)范就零分，安全基礎(chǔ)上再看行為規(guī)范遵守情況。

Q3：這項(xiàng)研究對(duì)普通用戶使用AI有什么實(shí)際意義？

A：這項(xiàng)研究讓AI能夠在不同應(yīng)用場(chǎng)景中提供更安全、更有用的服務(wù)。比如AI為兒童講故事時(shí)會(huì)更注意內(nèi)容健康，幫助編程時(shí)會(huì)更重視安全防護(hù)，提供健康建議時(shí)會(huì)更好地平衡有用性和安全邊界，讓我們使用AI時(shí)既能得到有效幫助又不用擔(dān)心安全問(wèn)題。

場(chǎng)景化AI安全測(cè)試時(shí)優(yōu)化規(guī)范對(duì)齊評(píng)估

分享至

0贊

好文章，需要你的鼓勵(lì)

推薦文章

人工智能
動(dòng)態(tài)專家搜索
推理優(yōu)化

2025-10-22 13:24

浙江大學(xué)突破：讓AI專家團(tuán)隊(duì)在考試時(shí)"動(dòng)態(tài)組隊(duì)"，推理能力飆升

浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專家搜索方法，讓AI能根據(jù)不同問(wèn)題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率，且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問(wèn)題偏愛(ài)不同專家配置，為AI推理優(yōu)化開(kāi)辟新路徑。
人工智能
強(qiáng)化學(xué)習(xí)
模型優(yōu)化

2025-10-22 13:24

清華大學(xué)新突破：AI模型居然能學(xué)會(huì)"少說(shuō)話多做事"，推理效率提升一倍還更準(zhǔn)確

清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法，通過(guò)"壓縮-擴(kuò)張"交替訓(xùn)練策略，成功解決了大型推理模型"話多且準(zhǔn)確率低"的問(wèn)題。實(shí)驗(yàn)顯示，該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí)，輸出長(zhǎng)度減少46.9%，真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化，為AI模型訓(xùn)練提供了新思路。
人工智能
視頻生成
實(shí)時(shí)流媒體

2025-10-22 13:24

南洋理工大學(xué)突破性研究：用AI實(shí)現(xiàn)多分鐘視頻實(shí)時(shí)流式生成，就像看電視直播一樣

南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開(kāi)發(fā)出Rolling Forcing技術(shù)，實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過(guò)滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新，解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問(wèn)題，可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻，延遲僅0.76秒，質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01，為交互式媒體和內(nèi)容創(chuàng)作開(kāi)辟新可能。
人工智能
幾何學(xué)習(xí)
空間智能

2025-10-22 10:14

華中科技大學(xué)團(tuán)隊(duì)突破性發(fā)現(xiàn)：讓AI像幾何學(xué)家一樣思考，竟能大幅提升空間理解能力

華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn)，通過(guò)讓AI模型學(xué)習(xí)解決幾何問(wèn)題，能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集，使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示，幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來(lái)顯著提升，其中最佳模型達(dá)到49.6%準(zhǔn)確率，超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。

浙江大學(xué)突破：讓AI專家團(tuán)隊(duì)在考試時(shí)"動(dòng)態(tài)組隊(duì)"，推理能力飆升

浙江大學(xué)突破：讓AI專家團(tuán)隊(duì)在考試時(shí)"動(dòng)態(tài)組隊(duì)"，推理能力飆升

2025-10-22 13:24

清華大學(xué)新突破：AI模型居然能學(xué)會(huì)"少說(shuō)話多做事"，推理效率提升一倍還更準(zhǔn)確

清華大學(xué)新突破：AI模型居然能學(xué)會(huì)"少說(shuō)話多做事"，推理效率提升一倍還更準(zhǔn)確

2025-10-22 13:24

南洋理工大學(xué)突破性研究：用AI實(shí)現(xiàn)多分鐘視頻實(shí)時(shí)流式生成，就像看電視直播一樣

南洋理工大學(xué)突破性研究：用AI實(shí)現(xiàn)多分鐘視頻實(shí)時(shí)流式生成，就像看電視直播一樣

2025-10-22 13:24

華中科技大學(xué)團(tuán)隊(duì)突破性發(fā)現(xiàn)：讓AI像幾何學(xué)家一樣思考，竟能大幅提升空間理解能力

華中科技大學(xué)團(tuán)隊(duì)突破性發(fā)現(xiàn)：讓AI像幾何學(xué)家一樣思考，竟能大幅提升空間理解能力

2025-10-22 10:14

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

友情鏈接

至頂網(wǎng)
管理現(xiàn)代化
和訊IT
TechWeb
第三媒體
速途網(wǎng)
51CTO傳媒
投資界
科技訊
智者新時(shí)代

京ICP證15039648號(hào) 京ICP備15039648號(hào)-9 京公網(wǎng)安備 11010802021500號(hào)

北京第二十六維信息技術(shù)有限公司（至頂網(wǎng)）版權(quán)所有。 | 聯(lián)絡(luò)我們

舉報(bào)電話：010-62641205　涉未成年人舉報(bào)專線：010-62641208 舉報(bào)郵箱: jubao@zhiding.cn 　網(wǎng)上有害信息舉報(bào)專區(qū)：https://www.12377.cn

<abbr id="66ksy"><button id="66ksy"></button></abbr>