作者|高飛
去年這個(gè)時(shí)候,投資圈曾經(jīng)有過(guò)一個(gè)“投模型還是投應(yīng)用”的辯論。現(xiàn)在看來(lái),這是一個(gè)無(wú)意義的議題,因?yàn)榧夹g(shù)生態(tài)的邏輯已經(jīng)變了。
多數(shù)人仍然習(xí)慣用傳統(tǒng)的“兩層思維”生態(tài)架構(gòu)來(lái)思考大模型:系統(tǒng)基座在下面,面向用戶(hù)的應(yīng)用在上面,二者涇渭分明。
歷史上看,這種二分法是對(duì)的:
1. DOS 操作系統(tǒng)面世時(shí),沒(méi)有可執(zhí)行的 “.com” 或 “.exe” 程序,用戶(hù)根本無(wú)從交互;
2. Windows 問(wèn)世時(shí),也沒(méi)有人會(huì)拿一個(gè)操作系統(tǒng)單獨(dú)“空跑”。哪怕是當(dāng)年經(jīng)典的“紙牌”和“掃雷”,也是微軟為了讓大眾理解并熟悉圖形界面,不得不自己編寫(xiě)的小應(yīng)用;
3. iOS 讓智能手機(jī)成為一種基礎(chǔ)設(shè)施,但首批吸引用戶(hù)使用的,還是紙飛機(jī)、拍照,甚至打電話(huà)這些關(guān)鍵應(yīng)用;
4. 云計(jì)算概念提出來(lái)后,人們談?wù)摰亩际腔谠频?SaaS 和各種網(wǎng)站,用不了多久就變成“這家公司用 AWS 跑后臺(tái)”這樣的陳述。云計(jì)算本身并沒(méi)有變成一個(gè)直接面向大眾的入口。
但是,AI 之所以是一場(chǎng)技術(shù)革命,就意味著它會(huì)顛覆我們已有的常識(shí)。我認(rèn)為,兩層架構(gòu)在這個(gè)時(shí)代已經(jīng)失效。
舉個(gè)例子:OpenAI 的 ChatGPT 從一開(kāi)始發(fā)布時(shí),就既是一個(gè)模型,又是一個(gè)面向大眾的消費(fèi)級(jí)應(yīng)用。
你不需要再去下載任何“子程序”才能讓 ChatGPT 跑起來(lái);只需要在對(duì)話(huà)框輸入文字(提示工程,Prompt Engineering),它就能執(zhí)行推理或生成內(nèi)容。它甚至創(chuàng)造了最快達(dá)到 1 億月活用戶(hù)的新紀(jì)錄。這是一個(gè)毫無(wú)爭(zhēng)議的應(yīng)用。
但它同時(shí)也是一種模型,OpenAI提供了 API 調(diào)用,讓無(wú)數(shù)應(yīng)用可以基于它構(gòu)建。
當(dāng)我們說(shuō) “DeepSeek” 時(shí),既可能指一種在 LMarena、AIME 榜單上排名靠前的前沿推理模型,也可以指一款曾登頂中美等多個(gè)國(guó)家 iOS 應(yīng)用商店的 App。
所以,下次再有人問(wèn):“我們?cè)撏洞笳Z(yǔ)言模型還是應(yīng)用層?”也許可以告訴他,這不是一個(gè)非此即彼的問(wèn)題。在這個(gè)領(lǐng)域里,模型就是應(yīng)用,應(yīng)用也就是模型。
如果你在做模型,你的用戶(hù)并不需要了解多少編譯、鏈接或 SDK 之類(lèi)的東西,就能夠通過(guò)自然語(yǔ)言提示來(lái)使用它。
反過(guò)來(lái),如果你在做 AI 應(yīng)用,其實(shí)最終還是在向用戶(hù)交付一項(xiàng)“大模型”能力,無(wú)論你使用的是提示工程、強(qiáng)化學(xué)習(xí)、工作流、Agent,還是別的“套殼”手段,底層都還是那臺(tái)貫通一切的“大腦”。
模型與應(yīng)用的邊界正在塌陷,用戶(hù)甚至不知道,或者并不在意自己是在“跑模型”還是在“用程序”。
但是,除了投資規(guī)模,做應(yīng)用也并不比做基座模型廉價(jià),因?yàn)?strong>在這個(gè)時(shí)代,切換一個(gè)模型底座并不比換輛車(chē)開(kāi)更難。幾乎你使用的所有 AI 應(yīng)用,都提供了在后臺(tái)切換模型的設(shè)置選項(xiàng)。
你能在云計(jì)算時(shí)代想象這些嗎?一個(gè)網(wǎng)站提供了切換不同云主機(jī)訪(fǎng)問(wèn)?還記得適配安卓、iOS 等不同系統(tǒng)、不同尺寸的手機(jī)有多難嗎?
只不過(guò),應(yīng)用開(kāi)發(fā)者還是需要一點(diǎn)戒備。你的產(chǎn)品最好不要在“智能演化”的延長(zhǎng)線(xiàn)上。就像山姆·奧特曼(Sam Altman)所說(shuō):如果基座模型變得更好,你的應(yīng)用也應(yīng)該同步變得更好,而不是被徹底替代、不再被需要。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專(zhuān)家搜索方法,讓AI能根據(jù)不同問(wèn)題靈活調(diào)整內(nèi)部專(zhuān)家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類(lèi)型問(wèn)題偏愛(ài)不同專(zhuān)家配置,為AI推理優(yōu)化開(kāi)辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過(guò)"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話(huà)多且準(zhǔn)確率低"的問(wèn)題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開(kāi)發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過(guò)滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問(wèn)題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開(kāi)辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過(guò)讓AI模型學(xué)習(xí)解決幾何問(wèn)題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來(lái)顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。