作者 | 周雅
今年的驍龍峰會(huì),與往年有些不同。
不只是頭一次將舉辦地設(shè)在美國(guó)夏威夷、中國(guó)北京的雙會(huì)場(chǎng),而且在峰會(huì)的第一天,高通總裁兼CEO安蒙的整場(chǎng)發(fā)言,不是發(fā)布新品,而是個(gè)性化體驗(yàn)的未來發(fā)展圖。
之所以這么設(shè)計(jì),是這次峰會(huì)所處的特殊節(jié)點(diǎn)——十周年里程碑。
十年前,高通在紐約的第一屆驍龍峰上發(fā)布驍龍835,并雄心勃勃地宣告驍龍開啟一個(gè)新階段。十年后的今天,安蒙再次宣告,驍龍正在迎來又一個(gè)全新的階段。
驍龍是如何誕生的
驍龍的歷史,從高通設(shè)計(jì)一款能支持做更多事情的手機(jī)芯片開始:從將手機(jī)帶入數(shù)字時(shí)代,到將消費(fèi)電子技術(shù)和互聯(lián)網(wǎng)集成進(jìn)口袋,再到如今將驍龍技術(shù)擴(kuò)展至可穿戴設(shè)備、PC乃至汽車等所有設(shè)備,開啟“驍龍無處不在”旅程。
而現(xiàn)在安蒙宣告,一個(gè)全新的旅程即將開啟:就是“驍龍將把AI帶到無處不在”,并明確指出,高通是“與眾多合作伙伴一起,將AI帶到無處不在”。
為了讓AI愿景照進(jìn)現(xiàn)實(shí),高通必須成為“前瞻性”的公司,而過去幾年高通早已打好了地基,比如:
2011年驍龍峰會(huì),高通就判斷“邊緣計(jì)算將是AI未來的核心”,并做出相應(yīng)布局。
2022年,高通首次展示AI如何賦能實(shí)時(shí)體驗(yàn),包括語(yǔ)義分割和始終感知能力,那場(chǎng)演示只能夠,攝像頭能通過AI理解能力支持多模態(tài)輸入。
2023年,高通提出觀點(diǎn)“AI是新的UI”,同年基于手機(jī)端運(yùn)行Stable Diffusion大模型,不到1秒在本地生成圖像。
2024年,高通演示了多模態(tài)助手,以及在安卓手機(jī)上運(yùn)行的多模態(tài)大模型,展示了跨視頻、音頻和文本的AI體驗(yàn)。
這種前瞻性,在今年更是發(fā)揮的淋漓盡致。安蒙說,高通今年的重點(diǎn)是為AI的規(guī)模化落地做好準(zhǔn)備,包括在終端側(cè)進(jìn)行特定領(lǐng)域的模型開發(fā)、情境學(xué)習(xí)、以及利用應(yīng)用數(shù)據(jù)進(jìn)行個(gè)性化處理等。
“我們看到了AI的六大趨勢(shì)”
為了讓AI規(guī)模化愿景更好落地,安蒙闡述了六個(gè)環(huán)環(huán)相扣的技術(shù)趨勢(shì)。他表示,即使只相信其中一個(gè),最終的結(jié)論都是:“AI將演進(jìn)至邊緣AI”。
趨勢(shì)一:AI即新的UI(AI is the New UI)。
這是所有變革的起點(diǎn)。安蒙指出,過去幾十年,我們一直在“學(xué)習(xí)如何使用電腦”。而現(xiàn)在情況相反,“電腦正在學(xué)習(xí)如何與我們互動(dòng)”。因?yàn)锳I能理解我們所說、所見、所寫以及我們所處的情境,這一切都成為了輸入給模型的“提示詞(Prompt)”。
這使得用戶界面(UI)變得“以人為中心”,并且能夠適應(yīng)你。所以結(jié)論是:“邊緣,是一個(gè)必要條件,因?yàn)閁I位于人類所在的地方。”驍龍作為端側(cè)AI芯片的代表,目標(biāo)就是“永遠(yuǎn)在你所在的地方”。
趨勢(shì)二:從"以智能手機(jī)為中心"到"以智能體為中心" (Smartphone-centric to agent-centric)。
基于“AI是新UI”的前提,安蒙提出對(duì)當(dāng)前個(gè)人計(jì)算設(shè)備發(fā)展的斷言——以智能手機(jī)為中心的環(huán)境正在發(fā)生轉(zhuǎn)變。
他說,過去我們用的終端設(shè)備,主要功能是“延伸手機(jī)的功能”(extending functionality of the phone),比如手表接收手機(jī)的通知,耳機(jī)通過手機(jī)接電話和聽音樂。手機(jī)是絕對(duì)的核心,是所有應(yīng)用的存儲(chǔ)庫(kù)和交互中樞。
但安蒙認(rèn)為,這一時(shí)代即將結(jié)束,當(dāng)AI成為新的UI,AI能夠理解人類的意圖,那么用戶體驗(yàn)的核心,就不再是那個(gè)裝滿App的物理設(shè)備,而是能統(tǒng)一調(diào)度且無處不在的“Agent(智能體)”。
這個(gè)智能體,將成為所有個(gè)人設(shè)備交互的核心,打破了過去以手機(jī)App為核心的孤島體驗(yàn)。
新的交互范式必然帶來應(yīng)用形態(tài)的變革。安蒙解釋說,用戶仍然可以選擇使用現(xiàn)有的App,但這些App自身將會(huì)進(jìn)化,它們不再只是手機(jī)的延展,而是可以直接與AI智能體交互,它們將“預(yù)測(cè)你的需求”,并“能夠?yàn)槟阕鍪?rdquo;。
他舉了個(gè)例子:過去,你收到一張名片,需要手動(dòng)掃描、存入聯(lián)系人、再打開日歷看是否有空閑時(shí)間安排會(huì)議。以后,你可以讓AI看到這張名片,然后直接說“把它加入我的聯(lián)系人”,或者AI會(huì)主動(dòng)提示你“你的日歷有沖突,我能幫你處理嗎?”,甚至直接幫你付賬單。這種無縫、主動(dòng)的體驗(yàn),就是“智能體體驗(yàn)”。
這個(gè)論斷引出了兩個(gè)直接的推論:
1、手機(jī)不會(huì)消失,但角色會(huì)改變。安蒙明確表示,手機(jī)作為一個(gè)“相當(dāng)不錯(cuò)的設(shè)備”,并不會(huì)消失,就像PC在手機(jī)出現(xiàn)后沒有消失一樣。手機(jī)將繼續(xù)扮演重要角色,包括為智能體提供關(guān)鍵的“處理能力”和“連接性能”。
2、“你的生態(tài)系統(tǒng)”(Ecosystem of You)將誕生。 隨著所有設(shè)備圍繞智能體協(xié)同工作,技術(shù)將成為“有史以來最個(gè)人化的技術(shù)”。
在此,安蒙提出了一個(gè)他稱之為“挑釁”的觀點(diǎn):“水平平臺(tái)將會(huì)優(yōu)于垂直平臺(tái)”。他解釋說,因?yàn)橛脩魰?huì)自己選擇想要戴什么眼鏡、手表或珠寶,所以一個(gè)能兼容不同品牌設(shè)備的“水平平臺(tái)”會(huì)比“垂直平臺(tái)”更有優(yōu)勢(shì)。
趨勢(shì)三:計(jì)算架構(gòu)的變革 (Changes in computing architectures)。
要支撐上述體驗(yàn),從操作系統(tǒng)、軟件到芯片的整個(gè)計(jì)算架構(gòu)都需要被“完全重新設(shè)計(jì)”。安蒙展示了一個(gè)新的計(jì)算架構(gòu)圖,它不再是傳統(tǒng)的“處理器-操作系統(tǒng)-應(yīng)用”三層模型,而是以“智能體”為核心,包含大量的情境信息(如記憶、屏幕所見內(nèi)容)的新模型。
為了實(shí)現(xiàn)這一點(diǎn),高通明確了它在芯片層面的工作重點(diǎn):
首先,打造智能體式的調(diào)制解調(diào)器(Agentic Modems): 因?yàn)檎Z(yǔ)音交互將變得至關(guān)重要,連接性能也必須為AI優(yōu)化。
其次,打造全新的內(nèi)存架構(gòu):以解決AI應(yīng)用中常見的內(nèi)存瓶頸問題。
接下來,是打造超低功耗、高性能的AI處理器:確保AI可以“永不下線”,隨時(shí)理解用戶意圖。
最后,是打造情境感知能力:芯片必須能夠處理和理解來自周圍環(huán)境的大量情境信息。
安蒙最后總結(jié)說:“這就是驍龍下一階段開始的地方。”
趨勢(shì)四:模型向混合模型演進(jìn)(Models are evolving to hybrid)。
對(duì)于云側(cè)與邊緣側(cè)的爭(zhēng)論,安蒙重申了高通的觀點(diǎn)——兩者兼?zhèn)洌丛?端的“混合AI”。
云端負(fù)責(zé)模型的創(chuàng)造、訓(xùn)練和微調(diào);而邊緣側(cè)作為補(bǔ)充,提供即時(shí)、個(gè)性化和充滿情境的響應(yīng)。他指出,一些AI公司已經(jīng)開始設(shè)計(jì)這種混合架構(gòu)的模型,它們由云端的大模型和一系列在邊緣側(cè)運(yùn)行的小模型組成,協(xié)同工作。
趨勢(shì)五:邊緣側(cè)數(shù)據(jù)的重要性 (Edge data is relevant)。
接下來,安蒙拋出了一個(gè)極具價(jià)值的觀點(diǎn):“邊緣側(cè)數(shù)據(jù)的重要性是巨大的,這是AI世界里保守得最好的秘密。”
他進(jìn)一步說,未來由于邊緣側(cè)設(shè)備能夠理解我們所說、所見、所寫的一切,它產(chǎn)生的數(shù)據(jù)量將“使現(xiàn)有用于訓(xùn)練模型的數(shù)據(jù)量相形見絀”,這些高質(zhì)量的邊緣側(cè)數(shù)據(jù)將持續(xù)優(yōu)化模型,使模型變得更智能、更強(qiáng)大,最終形成一個(gè)“動(dòng)態(tài)的、自適應(yīng)的智能網(wǎng)絡(luò)”。
趨勢(shì)六:連接為AI而進(jìn)化(Connectivity is evolving for AI)。
作為連接云端與邊緣側(cè)的橋梁,連接技術(shù)本身也必須進(jìn)化。安蒙表示,下一代連接技術(shù)——6G,正被設(shè)計(jì)為“AI原生”的6G。它與5G最大的區(qū)別,除了速度提升外,更在于它是一個(gè)“具備感知能力的智能網(wǎng)絡(luò)”。
傳感器數(shù)據(jù)在AI時(shí)代變得至關(guān)重要,而6G的設(shè)計(jì)目標(biāo)就是成為云端和邊緣側(cè)設(shè)備之間的智能連接,融合物理與數(shù)字世界。
安蒙給出明確的時(shí)間表:“我們準(zhǔn)備好最早在2028年就擁有預(yù)商用的6G設(shè)備。”
智能最終要服務(wù)于用戶體驗(yàn)
為了證明這6個(gè)趨勢(shì)不是空中樓閣,安蒙請(qǐng)上了Google設(shè)備與服務(wù)高級(jí)副總裁Rick Osterloh,來了一場(chǎng)“暴露年齡”的對(duì)談。
高通和Google的友誼始于2006年,始于安卓的蠻荒時(shí)代,當(dāng)時(shí)Rick Osterloh還在摩托羅拉,內(nèi)部同時(shí)在開發(fā)8個(gè)不同的操作系統(tǒng),而Android是他們引入的“第9個(gè)系統(tǒng)”,沒想到最后押對(duì)寶了。
談到Gemini怎么重新定義安卓體驗(yàn),Rick的答案是“混合AI”。他說,Google的Gemini大模型被設(shè)計(jì)在Android的內(nèi)核,且已經(jīng)用了混合架構(gòu)。在終端側(cè)運(yùn)行的Gemini Nano V3模型,在驍龍平臺(tái)上進(jìn)行了深度優(yōu)化,以實(shí)現(xiàn)電話詐騙實(shí)時(shí)檢測(cè)、Gboard智能輸入等本地AI功能。他強(qiáng)調(diào):“我們每次制作一個(gè)新模型時(shí),都會(huì)和高通合作,在驍龍上對(duì)它進(jìn)行優(yōu)化。”說到這部分,他用的詞是“Agentic Experience”,足以說明,智能最終要服務(wù)于體驗(yàn)。
當(dāng)然,就像用戶體驗(yàn)不局限于手機(jī),高通和Google的合作也不局限于手機(jī)。在XR領(lǐng)域,雙方與三星合作,打造一系列基于Android XR的設(shè)備。在汽車領(lǐng)域,Android Automotive操作系統(tǒng)與驍龍數(shù)字座艙結(jié)合,并且雙方已宣布將Gemini集成到數(shù)字座艙中,汽車的攝像頭將能與智能體聯(lián)動(dòng),理解車內(nèi)外環(huán)境。
此外在PC領(lǐng)域,雙方已啟動(dòng)一個(gè)新項(xiàng)目,為PC和桌面系統(tǒng)“構(gòu)建一個(gè)通用的技術(shù)基礎(chǔ)”,將Gemini模型、Android系統(tǒng)和開發(fā)者社區(qū)帶入PC領(lǐng)域。
這場(chǎng)對(duì)話也說明,高通講的“以智能體為中心”的趨勢(shì),并非一家之詞,而是與Android生態(tài)的掌控者——谷歌,共同規(guī)劃并在演進(jìn)的戰(zhàn)略。
一場(chǎng)圍繞智能體的預(yù)演
為了將抽象的概念具象化,安蒙現(xiàn)場(chǎng)演示了兩個(gè)智能體——一個(gè)是負(fù)責(zé)規(guī)劃的Pulse,另一個(gè)是負(fù)責(zé)設(shè)計(jì)的Vella,兩者協(xié)同工作。
在演示中,安蒙提出想為峰會(huì)十周年辦一個(gè)派對(duì)。Pulse迅速找到了合適的嘉賓和場(chǎng)地,但發(fā)現(xiàn)安蒙的日程極滿,于是大膽建議“要不現(xiàn)在就把派對(duì)帶到這里”。隨后,Vella根據(jù)指令,即時(shí)生成了派對(duì)的裝飾圖形,并顯示在平板電腦上。同時(shí),Pulse還解釋了它根據(jù)社交渠道信息和興趣偏好挑選嘉賓的過程,而Vella則為嘉賓和安蒙本人創(chuàng)作了個(gè)性化的氣球和飲品。最后,Pulse根據(jù)指令,通過活動(dòng)App向現(xiàn)場(chǎng)所有觀眾發(fā)送了領(lǐng)取特別款待的通知。
這個(gè)演示直觀地展示了安蒙所描述的未來:一個(gè)能夠理解意圖、主動(dòng)規(guī)劃、跨設(shè)備協(xié)作、并高度個(gè)性化的智能體體驗(yàn)。
總之,2025年的驍龍峰會(huì)第一天所傳遞的信息,遠(yuǎn)比發(fā)布一款新芯片要深遠(yuǎn)。它在告訴行業(yè),個(gè)人計(jì)算的規(guī)則正在改變,體驗(yàn)的中心正在轉(zhuǎn)移,而高通已經(jīng)準(zhǔn)備好成為這場(chǎng)變革的核心技術(shù)引擎。安蒙這次的演講,就是一份詳盡的行動(dòng)綱領(lǐng)。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會(huì)友,左手硬核科技,右手浪漫主義。