av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

<samp id="b4pgf"></samp>

<ruby id="b4pgf"></ruby>

微信掃一掃，關(guān)注公眾號

科技行者
算力行者

見證連接與計(jì)算的「力量」

加速擴(kuò)散大語言模型：UCLA研究團(tuán)隊(duì)提出自適應(yīng)并行解碼新方法

人工智能語言模型擴(kuò)散模型

加速擴(kuò)散大語言模型：UCLA研究團(tuán)隊(duì)提出自適應(yīng)并行解碼新方法

作者：科技行者

2025-06-06 17:25

分享至：

UCLA計(jì)算機(jī)科學(xué)系研究團(tuán)隊(duì)提出的"自適應(yīng)并行解碼"(APD)方法，成功解決了擴(kuò)散大語言模型面臨的速度與質(zhì)量權(quán)衡難題。該方法通過動態(tài)調(diào)整并行生成的詞數(shù)，結(jié)合一個(gè)小型輔助自回歸模型來評估生成質(zhì)量，并引入KV緩存和掩碼輸入限制等優(yōu)化措施，使擴(kuò)散模型能在保持高質(zhì)量輸出的同時(shí)顯著提升生成速度。實(shí)驗(yàn)表明，使用APD的Dream 7B模型不僅能達(dá)到每秒59個(gè)詞的吞吐量（比基線提升近6倍），還在數(shù)學(xué)推理等任務(wù)上保持了接近原始水平的準(zhǔn)確率，甚至超越了傳統(tǒng)自回歸模型的速度。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2025-06-06 17:25 ? 科技行者

當(dāng)我們使用大語言模型(LLM)時(shí)，是否曾因生成速度太慢而感到不耐煩？加利福尼亞大學(xué)洛杉磯分校(UCLA)的研究團(tuán)隊(duì)正面臨著這一挑戰(zhàn)。2025年5月31日，由Daniel Israel、Guy Van den Broeck和Aditya Grover組成的UCLA計(jì)算機(jī)科學(xué)系研究團(tuán)隊(duì)在arXiv上發(fā)表了題為《Accelerating Diffusion LLMs via Adaptive Parallel Decoding》的研究論文(arXiv:2506.00413v1)，提出了一種名為"自適應(yīng)并行解碼"(APD)的新方法，旨在大幅提升擴(kuò)散大語言模型的生成速度。

現(xiàn)今的大語言模型面臨著一個(gè)根本性的瓶頸：生成速度。主流的自回歸模型采用一次生成一個(gè)詞的順序解碼方式，這種方法雖然質(zhì)量高，但速度慢。想象一下你在寫一封信，但每次只能寫一個(gè)字，然后等待幾秒鐘才能寫下一個(gè)——這基本上就是自回歸模型的工作方式。而擴(kuò)散大語言模型(dLLM)理論上允許同時(shí)生成多個(gè)詞，就像你可以一次性寫下整句話那樣，應(yīng)該能顯著提高速度。

然而，實(shí)際情況卻不盡人意。研究團(tuán)隊(duì)發(fā)現(xiàn)，開源的擴(kuò)散模型如Dream和Llada在沒有額外改進(jìn)的情況下，無法同時(shí)兼顧速度和質(zhì)量。如果嘗試一次性生成多個(gè)詞(并行生成)，生成質(zhì)量就會大幅下降；如果堅(jiān)持高質(zhì)量生成，則不得不降低并行度，一次只生成一個(gè)詞，速度優(yōu)勢蕩然無存。這就像是擁有了一輛跑車，卻只能以自行車的速度行駛，否則就會偏離道路。

為什么會出現(xiàn)這種情況呢？簡單來說，當(dāng)并行生成多個(gè)詞時(shí)，模型只能獲取每個(gè)位置的"孤立"概率分布，而無法考慮詞與詞之間的關(guān)聯(lián)性。這就像是幾個(gè)人各自單獨(dú)創(chuàng)作一個(gè)句子，然后強(qiáng)行把它們拼在一起——結(jié)果通常不會連貫。

針對這一問題，UCLA團(tuán)隊(duì)提出了自適應(yīng)并行解碼(APD)方法。這種方法不是固定一次生成多少個(gè)詞，而是動態(tài)調(diào)整并行生成的詞數(shù)。它的核心思想是：當(dāng)模型有信心能正確預(yù)測連續(xù)多個(gè)詞時(shí)，就一次性生成這些詞；當(dāng)預(yù)測不確定時(shí)，就退回到逐個(gè)生成的方式。這就像是一個(gè)老練的作家，在寫熟悉的內(nèi)容時(shí)可以一氣呵成寫下整段文字，而遇到需要深思熟慮的部分時(shí)，則會放慢速度，字斟句酌。

研究團(tuán)隊(duì)的創(chuàng)新不僅體現(xiàn)在理論上，還包括一系列實(shí)用的技術(shù)改進(jìn)，如引入鍵值緩存(KV caching)和限制掩碼輸入大小。這些優(yōu)化大大提高了模型的計(jì)算效率。他們還引入了三個(gè)可調(diào)參數(shù)，讓用戶能夠根據(jù)需求靈活地在速度和質(zhì)量之間找到平衡點(diǎn)。

實(shí)驗(yàn)結(jié)果令人振奮。在GSM8K等基準(zhǔn)測試中，使用APD的擴(kuò)散模型能夠以接近原質(zhì)量的表現(xiàn)，將生成速度提高近6倍。更令人驚訝的是，優(yōu)化后的Dream 7B模型甚至比自回歸的Qwen 7B和Qwen 0.5B模型更快，同時(shí)保持了較高的準(zhǔn)確率。這就像是一輛既能高速行駛又能保持穩(wěn)定的新型汽車，徹底改變了我們對擴(kuò)散模型速度與質(zhì)量不可兼得的認(rèn)知。

這項(xiàng)研究不僅對擴(kuò)散大語言模型的實(shí)用性有重大意義，也為未來的模型設(shè)計(jì)提供了新的思路。隨著這些技術(shù)的應(yīng)用，我們可能很快就能享受到更快、更流暢的AI文本生成體驗(yàn)。

一、擴(kuò)散大語言模型的速度困境

當(dāng)今的大語言模型世界中，自回歸模型如同一個(gè)一絲不茍的書法家，一筆一畫地完成作品。雖然結(jié)果精美，但過程緩慢。這種逐詞生成的方式成為了實(shí)時(shí)應(yīng)用的主要障礙，特別是隨著模型規(guī)模不斷擴(kuò)大，這個(gè)問題變得更加突出。

擴(kuò)散大語言模型(dLLM)本應(yīng)像一個(gè)能同時(shí)控制多支畫筆的魔術(shù)師，理論上可以并行生成多個(gè)詞，大幅提升速度。這些模型受到圖像生成領(lǐng)域成功經(jīng)驗(yàn)的啟發(fā)，應(yīng)該能夠打破順序生成的限制。然而，UCLA研究團(tuán)隊(duì)通過實(shí)驗(yàn)發(fā)現(xiàn)，現(xiàn)實(shí)與理論存在顯著差距。

他們對兩個(gè)開源擴(kuò)散模型Dream和Llada進(jìn)行了詳細(xì)測試。結(jié)果顯示，這些模型要達(dá)到最佳質(zhì)量，必須采用"一次一詞"的生成方式（每個(gè)時(shí)間步生成一個(gè)詞）。任何嘗試?yán)貌⑿心芰Φ呐Χ紩?dǎo)致質(zhì)量下降。具體來說，在GSM8K數(shù)學(xué)推理任務(wù)上，當(dāng)使用從左到右的順序生成時(shí)，Dream 7B模型能達(dá)到83.2%的準(zhǔn)確率，但吞吐量只有每秒10.1個(gè)詞。相比之下，自回歸的Qwen2.5 7B模型不僅準(zhǔn)確率達(dá)到85.4%，吞吐量還高達(dá)每秒38.6個(gè)詞。

這種狀況就像擁有一臺設(shè)計(jì)時(shí)速200公里的跑車，但實(shí)際上只能以50公里的速度行駛，否則就會偏離道路或引擎過熱。問題的核心在于，當(dāng)并行預(yù)測多個(gè)詞時(shí)，模型只能獲取每個(gè)位置的邊緣概率分布，而忽略了詞與詞之間的依賴關(guān)系。這就像幾個(gè)廚師各自準(zhǔn)備一道菜而不知道其他人在做什么，最終拼湊成的菜單可能毫無協(xié)調(diào)性。

為了量化這種質(zhì)量與速度的權(quán)衡關(guān)系，研究團(tuán)隊(duì)進(jìn)行了一系列實(shí)驗(yàn)，固定每次迭代并行生成的詞數(shù)(K)。實(shí)驗(yàn)表明，隨著K值的增加，生成速度確實(shí)提高了，但準(zhǔn)確率呈現(xiàn)斷崖式下降。例如，當(dāng)K=7時(shí)，Dream 7B的GSM8K準(zhǔn)確率從約80%降至不足20%，這種犧牲顯然是不可接受的。

這一困境引發(fā)了一個(gè)關(guān)鍵問題：是否存在一種方法，能夠智能地決定何時(shí)并行生成多個(gè)詞，何時(shí)退回到逐個(gè)生成，從而在保持質(zhì)量的同時(shí)提高速度？這正是UCLA團(tuán)隊(duì)提出的自適應(yīng)并行解碼(APD)方法要解決的核心問題。

二、自適應(yīng)并行解碼：突破速度與質(zhì)量的平衡點(diǎn)

自適應(yīng)并行解碼(APD)的核心思想可以用一個(gè)熟練鋼琴家的例子來理解。當(dāng)演奏簡單、熟悉的曲目時(shí)，鋼琴家能夠流暢快速地彈奏；而遇到復(fù)雜段落時(shí)，則會放慢速度，確保每個(gè)音符的精準(zhǔn)。APD就是讓語言模型像這樣"知道"何時(shí)可以加速，何時(shí)需要謹(jǐn)慎。

具體來說，APD首先將擴(kuò)散模型的生成順序固定為從左到右，這看似是退回到自回歸模型的做法，但研究者發(fā)現(xiàn)這種方式不僅能保持生成質(zhì)量，有時(shí)甚至能提高質(zhì)量。這就像是讓一個(gè)本可以四處張望的人專注于向前看，反而讓他避免了分心，能更好地預(yù)測前方的路況。

接下來，APD引入了一個(gè)小型的輔助自回歸模型。這個(gè)小模型就像是主模型的"參謀"，幫助判斷哪些并行生成的詞可以被接受。研究團(tuán)隊(duì)設(shè)計(jì)了一個(gè)巧妙的機(jī)制：將擴(kuò)散模型的邊緣概率與小型自回歸模型的聯(lián)合概率進(jìn)行乘法混合，形成一個(gè)目標(biāo)分布。這種混合使用了一個(gè)可調(diào)參數(shù)R，當(dāng)R值較高時(shí)，系統(tǒng)更信任擴(kuò)散模型；當(dāng)R值較低時(shí)，則更依賴輔助自回歸模型的判斷。

為什么要使用小型輔助模型呢？因?yàn)樾∧Ｐ碗m然精確度不如大模型，但能夠快速并行計(jì)算序列的聯(lián)合概率，幫助大模型做出更好的決策。這有點(diǎn)像登山時(shí)，經(jīng)驗(yàn)豐富的向?qū)Вㄐ∧Ｐ停╇m然力氣不如年輕的登山者（大模型），但能夠更快地判斷哪條路徑安全可行。

值得注意的是，APD與目前流行的推測解碼（speculative decoding）方法有著本質(zhì)區(qū)別。推測解碼是用小模型生成初步內(nèi)容，再由大模型驗(yàn)證；而APD則是用大模型生成內(nèi)容，小模型幫助判斷質(zhì)量。這就像是推測解碼中，學(xué)徒（小模型）先畫草圖，大師（大模型）再修改完善；而在APD中，大師直接作畫，學(xué)徒只是在旁邊提供建議，幫助大師決定何時(shí)可以一氣呵成畫完某個(gè)部分。

UCLA團(tuán)隊(duì)還對算法實(shí)現(xiàn)進(jìn)行了多項(xiàng)優(yōu)化。例如，他們引入了鍵值緩存（KV caching）技術(shù)，這一技術(shù)通常用于自回歸模型，能夠避免重復(fù)計(jì)算，大大提高效率。想象一下，如果你在解一道復(fù)雜的數(shù)學(xué)題，已經(jīng)計(jì)算過的中間結(jié)果可以記錄下來，下次用到時(shí)直接查表，而不是重新計(jì)算，這就是KV緩存的作用。

另一個(gè)重要優(yōu)化是限制掩碼輸入的大小。由于擴(kuò)散模型是從左到右自回歸生成，輸入中會包含大塊連續(xù)的[MASK]標(biāo)記作為后綴。研究者設(shè)置了一個(gè)最大長度M參數(shù)，限制這個(gè)后綴的大小。這一簡單改變能顯著提高計(jì)算速度，因?yàn)樽⒁饬τ?jì)算的復(fù)雜度與序列長度的平方成正比。減小輸入大小就像是減少了廚師需要關(guān)注的食材數(shù)量，自然能加快烹飪速度。

最終，APD提供了三個(gè)可調(diào)參數(shù)：乘法混合權(quán)重R、重新計(jì)算KV窗口大小W和最大掩碼前瞻長度M。這些參數(shù)給用戶提供了在速度和質(zhì)量之間進(jìn)行靈活權(quán)衡的能力，就像是一輛汽車的不同駕駛模式，可以根據(jù)需要在經(jīng)濟(jì)模式和運(yùn)動模式之間切換。

三、實(shí)驗(yàn)驗(yàn)證：速度與質(zhì)量的最佳平衡

為了驗(yàn)證自適應(yīng)并行解碼的效果，UCLA研究團(tuán)隊(duì)進(jìn)行了一系列詳細(xì)實(shí)驗(yàn)。他們選擇了Dream 7B Instruct作為擴(kuò)散模型，Qwen2.5 0.5B作為輔助自回歸模型。這兩個(gè)模型都在數(shù)學(xué)、科學(xué)和推理基準(zhǔn)測試上表現(xiàn)出色，而且它們共享相同的分詞器，這使得它們能夠更好地協(xié)同工作。

研究團(tuán)隊(duì)首先分析了混合權(quán)重參數(shù)R對性能的影響。在GSM8K數(shù)學(xué)推理任務(wù)上，當(dāng)R值較小時(shí)（如0.1-0.5），模型每次迭代接受的詞數(shù)較少，但維持了較高的準(zhǔn)確率。隨著R值增加，并行生成的詞數(shù)顯著提升，但準(zhǔn)確率開始下降。有趣的是，當(dāng)R=0.6時(shí)，模型平均每次迭代能接受約5.75個(gè)詞，同時(shí)保持接近80%的GSM8K準(zhǔn)確率。這意味著模型速度提升了近6倍，而質(zhì)量只有微小降低。

相比之下，如果簡單地固定每次迭代生成K個(gè)詞，當(dāng)K=5時(shí)，GSM8K準(zhǔn)確率會降至約40%，這一差距充分說明了自適應(yīng)方法的優(yōu)勢。APD就像是一個(gè)懂得何時(shí)加速、何時(shí)放慢的老練司機(jī)，能夠在彎道前適當(dāng)減速，直道上全速前進(jìn)，整體行程既快速又安全。

研究者還探索了重新計(jì)算KV窗口大小W的影響。他們發(fā)現(xiàn)，即使將W值從無限（即每次都重新計(jì)算所有鍵值）降至16，準(zhǔn)確率也只有很小的下降，但吞吐量能提高約50%。這表明擴(kuò)散模型在自回歸生成時(shí)，遠(yuǎn)距離的詞對當(dāng)前生成的影響較小，可以通過緩存來提高效率。

最大掩碼前瞻長度M的實(shí)驗(yàn)也顯示了明顯的速度-質(zhì)量權(quán)衡。當(dāng)M值從無限減小到16時(shí)，吞吐量顯著提升，但準(zhǔn)確率開始下降。有趣的是，這種下降不僅是因?yàn)橛?jì)算質(zhì)量降低，還因?yàn)樯砷L度縮短。研究表明，較長的"思考時(shí)間"（即生成更多詞）通常能提高推理能力，因此過度限制M值可能會傷害模型在復(fù)雜推理任務(wù)上的表現(xiàn)。

將這三個(gè)參數(shù)組合在一起，研究團(tuán)隊(duì)繪制了一個(gè)"帕累托前沿"圖，展示了不同配置下的速度-質(zhì)量權(quán)衡。令人驚訝的是，使用APD的Dream 7B在某些配置下，不僅比其基線版本（K=1）快得多，甚至超過了自回歸的Qwen 7B和Qwen 0.5B的速度。在保持相當(dāng)質(zhì)量的同時(shí)，APD配置的Dream能夠達(dá)到每秒59個(gè)詞的吞吐量，而Qwen 7B只有每秒38個(gè)詞。

這一成果令人振奮，因?yàn)樗砻鹘?jīng)過優(yōu)化的擴(kuò)散模型可以在速度和質(zhì)量的"帕累托前沿"上占據(jù)有利位置——也就是說，沒有其他模型能在兩個(gè)維度上同時(shí)超越它。這就像是發(fā)現(xiàn)了一種既經(jīng)濟(jì)又性能出色的新型發(fā)動機(jī)，可能徹底改變?nèi)藗儗U(kuò)散模型的認(rèn)知。

除了標(biāo)準(zhǔn)基準(zhǔn)測試，研究團(tuán)隊(duì)還在開放式任務(wù)上進(jìn)行了測試。例如，在生成有說服力的論證時(shí)，使用R=0.7的APD配置，Dream 7B能夠平均每次迭代并行生成約3個(gè)詞，大大提高了生成速度，同時(shí)保持了輸出質(zhì)量。

四、技術(shù)創(chuàng)新與實(shí)用意義

自適應(yīng)并行解碼的核心創(chuàng)新在于它解決了一個(gè)看似矛盾的問題：如何在不犧牲質(zhì)量的前提下提高擴(kuò)散模型的速度。這個(gè)問題在技術(shù)上相當(dāng)棘手，因?yàn)閭鹘y(tǒng)的并行加速方法往往會導(dǎo)致質(zhì)量大幅下降。

研究團(tuán)隊(duì)的第一個(gè)關(guān)鍵創(chuàng)新是將問題重新定義為動態(tài)確定最優(yōu)并行長度。不同于固定每次迭代生成K個(gè)詞，APD讓模型自己"決定"何時(shí)可以并行生成多個(gè)詞，何時(shí)應(yīng)該謹(jǐn)慎地一個(gè)一個(gè)生成。這就像是熟練的音樂家能夠根據(jù)樂曲的難度自動調(diào)整演奏速度，而不是機(jī)械地按照固定節(jié)拍演奏。

第二個(gè)創(chuàng)新是引入了一個(gè)乘法混合目標(biāo)分布，結(jié)合了擴(kuò)散模型的邊緣概率和輔助自回歸模型的聯(lián)合概率。這種混合方式滿足了兩個(gè)重要特性：當(dāng)擴(kuò)散模型對某個(gè)詞有100%的確定性時(shí)，該詞應(yīng)該被接受；當(dāng)輔助模型認(rèn)為某個(gè)序列有100%的可能性時(shí)，也應(yīng)該被接受。這種設(shè)計(jì)使得系統(tǒng)能夠在保持高質(zhì)量的同時(shí)最大化并行度。

第三個(gè)創(chuàng)新是使用通用耦合（universal coupling）技術(shù)進(jìn)行采樣。這種技術(shù)使用相同的隨機(jī)源從兩個(gè)不同的分布中采樣，并比較結(jié)果來決定接受多少個(gè)詞。這一方法避免了傳統(tǒng)拒絕采樣需要重新計(jì)算條件分布的問題，使得并行采樣變得可行。

從實(shí)用角度看，APD為擴(kuò)散大語言模型的應(yīng)用打開了新的可能性。以前，盡管擴(kuò)散模型在理論上具有并行生成的潛力，但由于速度限制，它們在實(shí)際應(yīng)用中難以與自回歸模型競爭?，F(xiàn)在，通過APD，擴(kuò)散模型不僅能保持高質(zhì)量，還能達(dá)到甚至超過自回歸模型的速度。

這種突破特別適用于對實(shí)時(shí)性有要求的應(yīng)用場景，如即時(shí)通訊助手、實(shí)時(shí)翻譯系統(tǒng)或交互式教育工具。例如，在客服聊天機(jī)器人中，快速響應(yīng)對用戶體驗(yàn)至關(guān)重要；在實(shí)時(shí)翻譯中，延遲越低，對話越自然流暢；在教育應(yīng)用中，快速的反饋能保持學(xué)生的注意力和參與度。

此外，APD的三個(gè)可調(diào)參數(shù)（R、W和M）為不同應(yīng)用場景提供了靈活的配置選項(xiàng)。對于需要高準(zhǔn)確性的任務(wù)（如醫(yī)療診斷輔助），可以選擇較低的R值和較大的M值；對于對速度要求較高的任務(wù)（如社交媒體內(nèi)容生成），則可以增加R值，減小M值，以獲得更高的吞吐量。

值得一提的是，APD方法不需要重新訓(xùn)練模型，可以直接應(yīng)用于現(xiàn)有的擴(kuò)散模型。這意味著現(xiàn)有的Dream和Llada等模型可以立即受益于這一技術(shù)，無需額外的計(jì)算資源投入。這就像是通過軟件更新就能提升汽車性能，而不需要更換發(fā)動機(jī)。

五、未來展望與局限性

盡管自適應(yīng)并行解碼取得了顯著成果，研究團(tuán)隊(duì)也坦誠地指出了它的局限性。首先，APD提供的是一種權(quán)衡，而非免費(fèi)的午餐。提高吞吐量仍然會導(dǎo)致一定程度的質(zhì)量下降，盡管這種下降遠(yuǎn)小于簡單并行方法。其次，APD并不能提高基礎(chǔ)擴(kuò)散模型本身的能力——如果Dream 7B在某個(gè)領(lǐng)域表現(xiàn)不佳，使用APD也無法改變這一點(diǎn)。

未來的研究方向可能包括進(jìn)一步優(yōu)化混合分布的設(shè)計(jì)、探索更復(fù)雜的動態(tài)調(diào)整策略，以及將APD與其他加速技術(shù)（如量化）結(jié)合。特別是量化技術(shù)已被證明能提供強(qiáng)大的速度-質(zhì)量權(quán)衡，將其與APD結(jié)合可能帶來更顯著的性能提升。

另一個(gè)有趣的方向是探索APD在不同類型任務(wù)上的表現(xiàn)差異。研究已經(jīng)表明，在數(shù)學(xué)推理等高度結(jié)構(gòu)化的任務(wù)上，APD能獲得高并行度；而在開放式生成任務(wù)上，并行度較低。理解這種差異的原因，可能有助于設(shè)計(jì)針對特定任務(wù)優(yōu)化的解碼策略。

此外，將APD的思想擴(kuò)展到其他模型架構(gòu)也是一個(gè)潛在方向。雖然當(dāng)前研究聚焦于擴(kuò)散模型，但類似的自適應(yīng)并行思想可能適用于其他非自回歸模型，甚至是混合架構(gòu)模型。

最后，隨著模型規(guī)模不斷增長，生成速度將成為更加關(guān)鍵的瓶頸。研究表明，通過增加推理時(shí)計(jì)算資源（所謂的"test-time scaling"）和強(qiáng)化推理能力，可以進(jìn)一步提高大語言模型的性能。這些趨勢使得APD這類加速技術(shù)的重要性將進(jìn)一步提升。

總的來說，UCLA研究團(tuán)隊(duì)的這項(xiàng)工作代表了一個(gè)重要的技術(shù)突破，為解決大語言模型生成速度的瓶頸問題提供了新的思路。通過智能地調(diào)整并行生成的詞數(shù)，APD成功地在速度和質(zhì)量之間找到了更優(yōu)的平衡點(diǎn)，為擴(kuò)散大語言模型的實(shí)際應(yīng)用鋪平了道路。

研究團(tuán)隊(duì)表示，這項(xiàng)工作部分受到了美國國防高級研究計(jì)劃局(DARPA)的ANSR、CODORD和SAFRON項(xiàng)目以及美國國家科學(xué)基金會(NSF)的資助，同時(shí)也得到了Adobe Research、Cisco Research和Amazon的支持。對于有興趣了解更多技術(shù)細(xì)節(jié)的讀者，可以通過arXiv訪問完整論文(arXiv:2506.00413v1)。

人工智能語言模型擴(kuò)散模型

分享至

1贊

好文章，需要你的鼓勵(lì)

推薦文章

人工智能
動態(tài)專家搜索
推理優(yōu)化

2025-10-22 13:24

浙江大學(xué)突破：讓AI專家團(tuán)隊(duì)在考試時(shí)"動態(tài)組隊(duì)"，推理能力飆升

浙江大學(xué)團(tuán)隊(duì)提出動態(tài)專家搜索方法，讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率，且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置，為AI推理優(yōu)化開辟新路徑。
人工智能
強(qiáng)化學(xué)習(xí)
模型優(yōu)化

2025-10-22 13:24

清華大學(xué)新突破：AI模型居然能學(xué)會"少說話多做事"，推理效率提升一倍還更準(zhǔn)確

清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法，通過"壓縮-擴(kuò)張"交替訓(xùn)練策略，成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實(shí)驗(yàn)顯示，該方法在數(shù)學(xué)競賽題上將模型準(zhǔn)確率提升43.2%的同時(shí)，輸出長度減少46.9%，真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化，為AI模型訓(xùn)練提供了新思路。
人工智能
視頻生成
實(shí)時(shí)流媒體

2025-10-22 13:24

南洋理工大學(xué)突破性研究：用AI實(shí)現(xiàn)多分鐘視頻實(shí)時(shí)流式生成，就像看電視直播一樣

南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開發(fā)出Rolling Forcing技術(shù)，實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新，解決了長視頻生成中的錯(cuò)誤累積問題，可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻，延遲僅0.76秒，質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01，為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
人工智能
幾何學(xué)習(xí)
空間智能

2025-10-22 10:14

華中科技大學(xué)團(tuán)隊(duì)突破性發(fā)現(xiàn)：讓AI像幾何學(xué)家一樣思考，竟能大幅提升空間理解能力

華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn)，通過讓AI模型學(xué)習(xí)解決幾何問題，能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集，使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示，幾何訓(xùn)練在四個(gè)空間智能測試基準(zhǔn)上都帶來顯著提升，其中最佳模型達(dá)到49.6%準(zhǔn)確率，超越此前最好成績。這項(xiàng)研究揭示了基礎(chǔ)幾何知識對培養(yǎng)AI空間智能的重要價(jià)值。

浙江大學(xué)突破：讓AI專家團(tuán)隊(duì)在考試時(shí)"動態(tài)組隊(duì)"，推理能力飆升

浙江大學(xué)突破：讓AI專家團(tuán)隊(duì)在考試時(shí)"動態(tài)組隊(duì)"，推理能力飆升

2025-10-22 13:24

清華大學(xué)新突破：AI模型居然能學(xué)會"少說話多做事"，推理效率提升一倍還更準(zhǔn)確

清華大學(xué)新突破：AI模型居然能學(xué)會"少說話多做事"，推理效率提升一倍還更準(zhǔn)確

2025-10-22 13:24

南洋理工大學(xué)突破性研究：用AI實(shí)現(xiàn)多分鐘視頻實(shí)時(shí)流式生成，就像看電視直播一樣

南洋理工大學(xué)突破性研究：用AI實(shí)現(xiàn)多分鐘視頻實(shí)時(shí)流式生成，就像看電視直播一樣

2025-10-22 13:24

華中科技大學(xué)團(tuán)隊(duì)突破性發(fā)現(xiàn)：讓AI像幾何學(xué)家一樣思考，竟能大幅提升空間理解能力

華中科技大學(xué)團(tuán)隊(duì)突破性發(fā)現(xiàn)：讓AI像幾何學(xué)家一樣思考，竟能大幅提升空間理解能力

2025-10-22 10:14

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

友情鏈接

至頂網(wǎng)
管理現(xiàn)代化
和訊IT
TechWeb
第三媒體
速途網(wǎng)
51CTO傳媒
投資界
科技訊
智者新時(shí)代

京ICP證15039648號京ICP備15039648號-9 京公網(wǎng)安備 11010802021500號

北京第二十六維信息技術(shù)有限公司（至頂網(wǎng)）版權(quán)所有。 | 聯(lián)絡(luò)我們

舉報(bào)電話：010-62641205　涉未成年人舉報(bào)專線：010-62641208 舉報(bào)郵箱: jubao@zhiding.cn 　網(wǎng)上有害信息舉報(bào)專區(qū)：https://www.12377.cn

<ruby id="3cdkv"></ruby><strike id="3cdkv"><td id="3cdkv"></td></strike>