生成式AI的創(chuàng)新和發(fā)展速度前所未有,而這僅僅是一個開始。人們使用這項技術的方式、場景和原因將會非常廣泛,甚至超乎想象。初步估計顯示,生成式AI市場規(guī)模將達到1萬億美元。
生成式AI不僅有望改變人們搜索和創(chuàng)作內容的方式,還能夠改善日常生活。借助生成式AI,智能手機能夠成為真正的數(shù)字助手,讓用戶自然地溝通交流,并獲得貼切的回答。PC用戶可以利用這項技術閱讀或撰寫電子郵件、起草文檔和自動創(chuàng)建演示文稿。在駕乘汽車時,對話式車內助手可以對汽車充電、購買停車券或在回家途中預訂晚餐提供建議。商店的AI服務臺和智能購物車能夠根據(jù)每周特惠、預算金額和家庭偏好,幫助消費者擬定食譜。
為了釋放這項技術的全部潛能并滿足日益增長的需求,生成式AI既需要云,也需要數(shù)十億能夠以低功耗進行高性能AI計算的網(wǎng)聯(lián)終端,如智能手機、PC和汽車。這就是混合AI?;旌螦I計算架構在云端和終端進行分布式處理,能夠優(yōu)化效率并提升整體用戶體驗。
生成式AI處理可以直接在終端側運行,也可以按需發(fā)送到云端,或者將兩者相結合——無論采取何種方式,對用戶而言都是無縫實現(xiàn)的。
用戶期望擁有與傳統(tǒng)搜索類似的體驗,那就是能夠瞬間顯示搜索結果。要滿足這樣的期望,還要保證服務質量,僅利用云端處理的成本太高,尤其是在需求高峰期,因此難以實現(xiàn)規(guī)?;?。
數(shù)據(jù)中心能耗高且價格昂貴。據(jù)估計,每一次基于生成式AI的網(wǎng)絡搜索查詢(query),其成本是傳統(tǒng)搜索的10倍。以每天超過100億次查詢計算,每年的增量成本可能達到數(shù)十億美元。網(wǎng)絡搜索只是生成式AI變革多個行業(yè)的眾多方式之一。
除成本外,在云端進行全部推理處理還面臨隱私、可靠性和性能方面的挑戰(zhàn)。當請求進入云端、數(shù)據(jù)離開終端時,就會產(chǎn)生潛在的安全問題。事實上,由于收集和存儲個人數(shù)據(jù)等監(jiān)管和合規(guī)問題導致模型被禁用或暫時禁用的情況已經(jīng)出現(xiàn)。
混合AI勢不可擋。隨著人們不斷探尋使用生成式AI的新方式,對云基礎設施的需求將激增?;旌螦I處理將是計算的下一次轉型,正如我們所看到的從大型主機演進到臺式機,再到今天云和我們手中的終端相結合的模式一樣。
利用高性能、低功耗終端的處理能力,將能夠高效推動生成式AI的規(guī)?;瘮U展。云端和終端將協(xié)同工作,通過強大、高效且高度優(yōu)化的AI功能,打造下一代用戶體驗。
本文原載于Fortune.com:https://fortune.com/2023/05/15/qualcomm-ceo-ai-is-going-to-touch-every-corner-of-our-lives-devices-tech-cristiano-amon/
好文章,需要你的鼓勵
浙江大學團隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調整內部專家配置。該方法在數(shù)學、編程等任務上顯著提升推理準確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學研究團隊提出SIRI方法,通過"壓縮-擴張"交替訓練策略,成功解決了大型推理模型"話多且準確率低"的問題。實驗顯示,該方法在數(shù)學競賽題上將模型準確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓練提供了新思路。
南洋理工大學與騰訊聯(lián)合研究團隊開發(fā)出Rolling Forcing技術,實現(xiàn)AI視頻實時流式生成的重大突破。該技術通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質量視頻,延遲僅0.76秒,質量漂移指標從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內容創(chuàng)作開辟新可能。
華中科技大學研究團隊發(fā)現(xiàn),通過讓AI模型學習解決幾何問題,能夠顯著提升其空間理解能力。他們構建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強化學習方法訓練多個AI模型。實驗結果顯示,幾何訓練在四個空間智能測試基準上都帶來顯著提升,其中最佳模型達到49.6%準確率,超越此前最好成績。這項研究揭示了基礎幾何知識對培養(yǎng)AI空間智能的重要價值。