這項(xiàng)由加拿大Queen's大學(xué)的Ahmed E. Hassan教授領(lǐng)導(dǎo)的研究團(tuán)隊(duì)發(fā)表于2025年9月的論文,全面探討了軟件工程領(lǐng)域正在經(jīng)歷的一場(chǎng)前所未有的變革。該研究論文題為《Agentic Software Engineering: Foundational Pillars and a Research Roadmap》,有興趣深入了解的讀者可以通過(guò)arXiv:2509.06216v1訪問(wèn)完整論文。研究團(tuán)隊(duì)包來(lái)自Queen's大學(xué)、華為加拿大公司、康考迪亞大學(xué)以及日本奈良科學(xué)技術(shù)大學(xué)院的多位知名學(xué)者。
想象一下,如果說(shuō)傳統(tǒng)的程序員就像獨(dú)自在廚房里烹飪的廚師,那么未來(lái)的軟件工程師將更像是一個(gè)米其林餐廳的主廚,指揮著一整個(gè)由AI助手組成的廚師團(tuán)隊(duì)。每個(gè)AI助手都有自己的專長(zhǎng)——有的擅長(zhǎng)處理數(shù)據(jù)庫(kù),有的精通用戶界面設(shè)計(jì),有的專門負(fù)責(zé)測(cè)試代碼。而程序員的工作不再是親自下廚,而是制定菜譜、分配任務(wù)、品嘗試菜,確保最終端上桌的是一道完美的"軟件大餐"。
這種變化并非遙遠(yuǎn)的科幻想象。事實(shí)上,當(dāng)前像Google的Jules、OpenAI的Codex、Anthropic的Claude Code這樣的AI編程助手已經(jīng)開(kāi)始改變整個(gè)行業(yè)。這些智能體不僅能寫代碼,還能自主制定計(jì)劃、執(zhí)行復(fù)雜任務(wù),甚至主動(dòng)向人類請(qǐng)教遇到的難題。據(jù)統(tǒng)計(jì),目前這些AI助手已經(jīng)負(fù)責(zé)了數(shù)十萬(wàn)個(gè)成功合并的代碼提交,展現(xiàn)出驚人的生產(chǎn)力。
然而,這種超高的生產(chǎn)效率也帶來(lái)了新的挑戰(zhàn)。就像工廠流水線提高了產(chǎn)量,但也需要更嚴(yán)格的質(zhì)量控制一樣,AI生成的代碼雖然數(shù)量龐大,但質(zhì)量參差不齊。研究發(fā)現(xiàn),近30%被認(rèn)為"可行"的AI生成代碼在嚴(yán)格審查后存在問(wèn)題,真正達(dá)到可直接使用標(biāo)準(zhǔn)的代碼比例更是大幅下降。這就像是一個(gè)高產(chǎn)的面包師傅,雖然每天能烤出幾百個(gè)面包,但其中相當(dāng)一部分要么沒(méi)烤熟,要么口感不佳,需要師傅重新檢查和改進(jìn)。
面對(duì)這種"速度與信任"之間的矛盾,Hassan教授的研究團(tuán)隊(duì)提出了一個(gè)全新的解決方案——結(jié)構(gòu)化智能體軟件工程框架,簡(jiǎn)稱SASE。這個(gè)框架的核心思想是將軟件工程分為兩個(gè)相互配合的領(lǐng)域:為人類服務(wù)的軟件工程和為AI智能體服務(wù)的軟件工程。
在這個(gè)新的工作模式中,人類工程師的角色發(fā)生了根本性轉(zhuǎn)變。他們不再是直接編寫代碼的"手工藝人",而是成為了"智能體教練"。就像足球教練一樣,他們的主要工作是制定戰(zhàn)術(shù)、訓(xùn)練隊(duì)員、在關(guān)鍵時(shí)刻做出戰(zhàn)略決策,而具體的"踢球"工作則交給AI智能體團(tuán)隊(duì)來(lái)完成。
這種新的工作方式需要兩個(gè)專門設(shè)計(jì)的"工作臺(tái)"。第一個(gè)是智能體指揮環(huán)境,這是人類工程師的指揮中心,就像軍隊(duì)的作戰(zhàn)指揮室。在這里,工程師可以下達(dá)任務(wù)指令、監(jiān)控AI團(tuán)隊(duì)的工作進(jìn)展、審查最終成果,并在需要時(shí)提供指導(dǎo)。第二個(gè)是智能體執(zhí)行環(huán)境,這是AI團(tuán)隊(duì)的專屬工作空間,專門為它們的超強(qiáng)計(jì)算能力和不知疲倦的工作特性而優(yōu)化設(shè)計(jì)。
為了確保人類和AI之間的有效溝通,研究團(tuán)隊(duì)設(shè)計(jì)了一套標(biāo)準(zhǔn)化的"文檔語(yǔ)言"。這就像是建立了一套通用的工作流程手冊(cè),確保每個(gè)參與者都能理解任務(wù)要求和工作標(biāo)準(zhǔn)。這套文檔包括任務(wù)簡(jiǎn)報(bào)書(shū)、工作流程腳本、指導(dǎo)手冊(cè)等,所有這些都像軟件代碼一樣有版本控制,可以不斷改進(jìn)和完善。
最有趣的是,這個(gè)系統(tǒng)還建立了雙向的"咨詢機(jī)制"。當(dāng)AI遇到復(fù)雜問(wèn)題時(shí),它可以主動(dòng)生成一個(gè)"咨詢請(qǐng)求包",就像學(xué)生遇到難題時(shí)舉手請(qǐng)教老師一樣。而當(dāng)AI完成任務(wù)后,它會(huì)提交一個(gè)"合并就緒包",這就像廚師完成一道菜后請(qǐng)主廚品嘗檢驗(yàn)。這種設(shè)計(jì)確保了人類的專業(yè)判斷始終在關(guān)鍵時(shí)刻發(fā)揮作用。
研究團(tuán)隊(duì)將AI在軟件工程中的能力發(fā)展分為六個(gè)層次,類似于自動(dòng)駕駛汽車的分級(jí)系統(tǒng)。最基礎(chǔ)的是完全人工編程,然后是代碼自動(dòng)補(bǔ)全,接著是AI輔助編程,再到目標(biāo)導(dǎo)向的智能編程,最后是完全自主的軟件開(kāi)發(fā)。目前的技術(shù)水平正處于第三到第四級(jí)之間,即AI能夠理解高級(jí)目標(biāo)并制定實(shí)施計(jì)劃的階段。
這種變革對(duì)軟件工程教育也提出了新的要求。傳統(tǒng)的教育模式主要培養(yǎng)學(xué)生成為"代碼編寫者",但未來(lái)的教育需要培養(yǎng)學(xué)生成為"AI團(tuán)隊(duì)管理者"。這就像從培養(yǎng)獨(dú)立工匠轉(zhuǎn)向培養(yǎng)工廠車間主任,需要完全不同的技能組合。學(xué)生需要學(xué)習(xí)的不再是如何熟練地敲代碼,而是如何清晰地表達(dá)需求、如何設(shè)計(jì)工作流程、如何評(píng)估和指導(dǎo)AI的工作成果。
研究還發(fā)現(xiàn),目前最成功的"超級(jí)程序員"——那些能夠獲得100倍甚至1000倍生產(chǎn)力提升的工程師,他們的成功秘訣并不在于編程技能本身,而在于掌握了與AI協(xié)作的藝術(shù)。他們知道如何給AI提供清晰詳細(xì)的任務(wù)說(shuō)明,如何設(shè)置合適的質(zhì)量標(biāo)準(zhǔn),如何在AI遇到困難時(shí)提供恰當(dāng)?shù)闹笇?dǎo)。
從技術(shù)角度來(lái)看,這種新的工作模式需要解決許多挑戰(zhàn)。比如如何確保AI生成的代碼質(zhì)量穩(wěn)定可靠,如何建立有效的人機(jī)協(xié)作流程,如何管理多個(gè)AI智能體之間的協(xié)調(diào)合作等。研究團(tuán)隊(duì)為每個(gè)挑戰(zhàn)都提出了詳細(xì)的解決方案和研究方向。
在質(zhì)量控制方面,新框架要求AI不僅要提交代碼,還要提供完整的"證據(jù)包",證明代碼的功能完整性、測(cè)試充分性、工程規(guī)范性等。這就像餐廳的菜品不僅要味道好,還要提供營(yíng)養(yǎng)成分表、制作過(guò)程記錄、食品安全檢測(cè)報(bào)告等。
在協(xié)作流程方面,系統(tǒng)建立了結(jié)構(gòu)化的反饋機(jī)制。人類的每一次指導(dǎo)和糾錯(cuò)都會(huì)被記錄下來(lái),形成可重復(fù)使用的"指導(dǎo)手冊(cè)"。這樣AI就能從每次互動(dòng)中學(xué)習(xí),逐漸減少犯同樣錯(cuò)誤的概率,就像學(xué)徒通過(guò)師傅的反復(fù)指導(dǎo)逐漸成為熟練工匠。
對(duì)于多智能體協(xié)作,研究提出了專業(yè)化分工的概念。不同的AI可以專門負(fù)責(zé)不同的任務(wù)——有的專門寫界面代碼,有的專門處理數(shù)據(jù)庫(kù),有的專門做測(cè)試,就像現(xiàn)代工廠的流水線一樣。這種專業(yè)化分工不僅提高了效率,也讓每個(gè)AI的工作更容易監(jiān)督和改進(jìn)。
這項(xiàng)研究還特別強(qiáng)調(diào)了"記憶"的重要性。傳統(tǒng)的AI每次都是從零開(kāi)始工作,就像每天都失憶的員工。新框架讓AI具備了"項(xiàng)目記憶",能夠記住之前的工作經(jīng)驗(yàn)、學(xué)到的教訓(xùn)、團(tuán)隊(duì)的偏好等。這樣AI就能像真正的團(tuán)隊(duì)成員一樣,隨著時(shí)間的推移變得越來(lái)越了解項(xiàng)目和團(tuán)隊(duì)的工作方式。
從更廣闊的視角來(lái)看,這種變革反映了人工智能技術(shù)發(fā)展的一個(gè)重要趨勢(shì):從簡(jiǎn)單的工具輔助轉(zhuǎn)向真正的智能協(xié)作。AI不再只是被動(dòng)地執(zhí)行人類的指令,而是成為了能夠主動(dòng)思考、提出問(wèn)題、尋求幫助的合作伙伴。
然而,研究也指出了當(dāng)前技術(shù)的局限性。雖然AI在編寫代碼方面已經(jīng)相當(dāng)出色,但在理解復(fù)雜的業(yè)務(wù)邏輯、做出權(quán)衡決策、處理模糊需求等方面仍然需要人類的智慧。這也是為什么人類工程師的角色不是被替代,而是被提升的原因。
對(duì)于普通人來(lái)說(shuō),這種變革意味著什么呢?首先,軟件開(kāi)發(fā)的成本可能會(huì)大幅降低,因?yàn)锳I能夠處理大量重復(fù)性的編程工作。這可能讓更多的小企業(yè)和個(gè)人開(kāi)發(fā)者能夠負(fù)擔(dān)得起高質(zhì)量的軟件開(kāi)發(fā)服務(wù)。
其次,軟件產(chǎn)品的迭代速度可能會(huì)顯著加快。當(dāng)大部分編程工作由AI完成時(shí),從想法到產(chǎn)品的轉(zhuǎn)化周期可能從幾個(gè)月縮短到幾周甚至幾天。這對(duì)整個(gè)數(shù)字經(jīng)濟(jì)的發(fā)展都將產(chǎn)生深遠(yuǎn)影響。
最后,這種變革也可能催生全新的職業(yè)類型。除了傳統(tǒng)的程序員轉(zhuǎn)型為AI教練,還可能出現(xiàn)專門的AI訓(xùn)練師、人機(jī)協(xié)作設(shè)計(jì)師、智能體質(zhì)量評(píng)估師等新職位。
不過(guò),研究也坦率地承認(rèn),這個(gè)愿景的實(shí)現(xiàn)還需要解決許多技術(shù)和管理挑戰(zhàn)。比如如何確保AI生成代碼的安全性,如何處理AI之間的工作沖突,如何建立有效的責(zé)任追溯機(jī)制等。這些問(wèn)題的解決需要整個(gè)軟件工程社區(qū)的共同努力。
總的來(lái)說(shuō),這項(xiàng)研究為我們描繪了一個(gè)既令人興奮又充滿挑戰(zhàn)的未來(lái)圖景。在這個(gè)未來(lái)中,人類和AI將形成前所未有的深度合作關(guān)系,共同創(chuàng)造出更高質(zhì)量、更具創(chuàng)新性的軟件產(chǎn)品。而成功的關(guān)鍵在于如何設(shè)計(jì)和管理這種新型的人機(jī)協(xié)作模式,確保技術(shù)的進(jìn)步真正服務(wù)于人類的需求和價(jià)值。
Q&A
Q1:結(jié)構(gòu)化智能體軟件工程框架SASE具體是什么?它如何改變傳統(tǒng)編程方式?
A:SASE是Queen's大學(xué)提出的新型軟件開(kāi)發(fā)框架,將工程師角色從直接編寫代碼轉(zhuǎn)變?yōu)橹笓]AI團(tuán)隊(duì)的"教練"。它建立了兩個(gè)專門工作環(huán)境:人類使用的智能體指揮環(huán)境和AI使用的智能體執(zhí)行環(huán)境,通過(guò)標(biāo)準(zhǔn)化文檔和雙向咨詢機(jī)制實(shí)現(xiàn)高效人機(jī)協(xié)作,就像足球教練指揮球隊(duì)一樣管理AI開(kāi)發(fā)團(tuán)隊(duì)。
Q2:目前的AI編程助手如Google Jules、Claude Code的實(shí)際表現(xiàn)如何?
A:這些AI助手已經(jīng)非常活躍,目前負(fù)責(zé)了數(shù)十萬(wàn)個(gè)成功的代碼提交,展現(xiàn)出驚人的生產(chǎn)力。Claude Code生成一個(gè)代碼提交的平均時(shí)間只有13.2分鐘,個(gè)別開(kāi)發(fā)者甚至獲得了100到1000倍的生產(chǎn)力提升。不過(guò)質(zhì)量仍是挑戰(zhàn),約30%被認(rèn)為"可行"的AI代碼在嚴(yán)格審查后存在問(wèn)題。
Q3:這種變革對(duì)普通程序員和軟件工程教育有什么影響?
A:程序員的角色將從"代碼編寫者"轉(zhuǎn)變?yōu)?AI團(tuán)隊(duì)管理者",需要掌握任務(wù)規(guī)劃、質(zhì)量控制、團(tuán)隊(duì)協(xié)調(diào)等技能。軟件工程教育也需要相應(yīng)調(diào)整,重點(diǎn)培養(yǎng)學(xué)生與AI協(xié)作的能力,而不僅僅是編程技能。同時(shí)可能催生AI訓(xùn)練師、人機(jī)協(xié)作設(shè)計(jì)師等全新職業(yè)類型。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專家搜索方法,讓AI能根據(jù)不同問(wèn)題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問(wèn)題偏愛(ài)不同專家配置,為AI推理優(yōu)化開(kāi)辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過(guò)"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問(wèn)題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開(kāi)發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過(guò)滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問(wèn)題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開(kāi)辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過(guò)讓AI模型學(xué)習(xí)解決幾何問(wèn)題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來(lái)顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。