7月6日,2023世界人工智能大會(WAIC)在上海正式開幕。本屆大會的主題是“智聯(lián)世界,生成未來”。來自本屆WAIC首日公開消息:第二代驍龍8移動(dòng)平臺的高通AI引擎榮獲2023世界人工智能大會頂級獎(jiǎng)項(xiàng):SAIL獎(jiǎng)——卓越人工智能引領(lǐng)者獎(jiǎng)。高通公司全球副總裁侯明娟上臺領(lǐng)獎(jiǎng)。
第二代驍龍8憑借面向整個(gè)平臺的開創(chuàng)性AI智能設(shè)計(jì)賦能了非凡用戶體驗(yàn),樹立了網(wǎng)聯(lián)計(jì)算的新標(biāo)桿,其搭載高通技術(shù)公司處理速度最快、最先進(jìn)的高通AI引擎,通過軟硬件的一系列創(chuàng)新,相較上一代帶來4.35倍的AI性能提升和60%的能效提升,從而為越來越多的創(chuàng)新型AI用例和AI增強(qiáng)的用戶體驗(yàn)提供強(qiáng)大的性能基礎(chǔ)。
高通AI引擎由多個(gè)硬件和軟件組件組成,用于在驍龍移動(dòng)平臺上為終端側(cè)AI推理加速。它采用異構(gòu)計(jì)算架構(gòu),包括高通Hexagon處理器、Adreno GPU、Kryo CPU和傳感器中樞,共同支持在終端上快速而有效的運(yùn)行AI應(yīng)用程序。其關(guān)鍵核心Hexagon處理器擁有一系列創(chuàng)新:提供專用供電系統(tǒng)、支持微切片推理、INT4精度、Transformer網(wǎng)絡(luò)加速等,可結(jié)合高通AI軟件棧和AI Studio提供全棧AI能力和優(yōu)化手段,行業(yè)內(nèi)率先在終端側(cè)支持Stable Diffusion、ControlNet等生成式AI用例,并可與云端協(xié)同打造適應(yīng)大模型時(shí)代的混合AI處理框架,助力AI體驗(yàn)創(chuàng)新和生態(tài)繁榮。目前,第二代驍龍8移動(dòng)平臺已經(jīng)可以支持參數(shù)超過10億的AI模型運(yùn)行。未來幾個(gè)月內(nèi),將有望支持參數(shù)超過100億的模型在終端側(cè)運(yùn)行,這也將成為基于高通技術(shù)的產(chǎn)品的一大差異化優(yōu)勢。
終端側(cè)AI處理可以帶來處理時(shí)延,隱私和安全,可靠性等優(yōu)勢,并且在生成式AI場景下可以有效分擔(dān)云端處理的負(fù)載,降低成本和能耗,有助于云端協(xié)同的混合式AI處理架構(gòu)的有效部署。高通AI引擎可提供卓越的終端側(cè)AI處理能力,并可跨越智能手機(jī)賦能更多邊緣移動(dòng)終端類別,比如筆記本電腦、XR頭顯、IoT設(shè)備以及汽車等,引領(lǐng)終端側(cè)AI應(yīng)用的進(jìn)一步發(fā)展。
據(jù)悉,高通深耕AI研發(fā)已超過15年,高通AI Research在基礎(chǔ)研究領(lǐng)域?qū)崿F(xiàn)突破,并跨終端和行業(yè)進(jìn)行擴(kuò)展,以賦能智能網(wǎng)聯(lián)邊緣。高通AI Research不僅在開展全新AI研究工作,也率先在商用終端上展示概念驗(yàn)證,為在現(xiàn)實(shí)世界中的技術(shù)規(guī)模化應(yīng)用鋪平道路。高通AI Research的重要AI研究論文正在影響整個(gè)行業(yè),推動(dòng)高能效AI發(fā)展,并與公司所有團(tuán)隊(duì)通力合作,將最新AI發(fā)展成果和技術(shù)集成到高通產(chǎn)品之中,讓實(shí)驗(yàn)室研究所實(shí)現(xiàn)的AI進(jìn)步能夠更快交付,豐富人們的生活。
在WAIC現(xiàn)場,高通還帶來了Stable Diffusion、ControlNet等生成式AI用例的技術(shù)展示。這是全球首個(gè)運(yùn)行在Android手機(jī)上的Stable Diffusion終端側(cè)演示,和全球最快的手機(jī)上的ControlNet終端側(cè)演示。
全球首個(gè)運(yùn)行在Android手機(jī)上的Stable Diffusion終端側(cè)演示
全球最快的手機(jī)上的ControlNet終端側(cè)演示
Stable Diffusion是一個(gè)非常出色的從文本到圖像的生成式AI模型,能夠基于任何文本輸入,在數(shù)十秒內(nèi)創(chuàng)作出逼真圖像。其參數(shù)超過10億,迄今為止主要限于在云端運(yùn)行。高通采用全棧AI優(yōu)化的方式,通過量化、編譯和硬件加速進(jìn)行優(yōu)化,使其能在搭載第二代驍龍8移動(dòng)平臺的手機(jī)上運(yùn)行,在15秒內(nèi)執(zhí)行20步推理,生成一張512x512像素的圖像。這是在智能手機(jī)上最快的推理速度,能媲美云端時(shí)延,且用戶文本輸入完全不受限制。目前,高通也已經(jīng)將Stable Diffusion這一生成式AI用例擴(kuò)展到搭載驍龍計(jì)算平臺的PC產(chǎn)品上。
ControlNet圖像生成圖像模型是一項(xiàng)語言-視覺模型(LVM),擁有15億參數(shù),能夠通過調(diào)整輸入圖像和輸入文本描述,更精準(zhǔn)地控制生成圖像。在這項(xiàng)演示中,ControlNet能夠在終端側(cè)實(shí)現(xiàn)高效交互運(yùn)行,通過一套跨模型架構(gòu)、AI軟件和神經(jīng)網(wǎng)絡(luò)硬件加速器的全棧式AI優(yōu)化,時(shí)延12秒內(nèi)可完成16步推理,生成AI圖像,無需訪問任何云端,便能提供高效、有趣、可靠且私密的交互式用戶體驗(yàn)。高通AI模型增效工具包、高通AI軟件棧和高通AI引擎在此過程中發(fā)揮了關(guān)鍵作用。
好文章,需要你的鼓勵(lì)
這項(xiàng)研究提出了"高效探測"方法,解決了掩碼圖像建模AI難以有效評估的問題。通過創(chuàng)新的多查詢交叉注意力機(jī)制,該方法在減少90%參數(shù)的同時(shí)實(shí)現(xiàn)10倍速度提升,在七個(gè)基準(zhǔn)測試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質(zhì)量與分類性能的強(qiáng)相關(guān)性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應(yīng)性。團(tuán)隊(duì)承諾開源全部代碼,推動(dòng)技術(shù)普及應(yīng)用。
伊利諾伊大學(xué)研究團(tuán)隊(duì)開發(fā)了CLAIMSPECT系統(tǒng),通過層次化分解復(fù)雜爭議、智能檢索相關(guān)文獻(xiàn)、多角度收集觀點(diǎn)的方法,將傳統(tǒng)的"真假"判斷轉(zhuǎn)變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動(dòng)構(gòu)建爭議話題的分析框架,識別不同觀點(diǎn)及其支撐證據(jù),為科學(xué)和政治爭議提供更全面客觀的分析,已在生物醫(yī)學(xué)和國際關(guān)系領(lǐng)域驗(yàn)證有效性。
清華大學(xué)研究團(tuán)隊(duì)首次提出情感認(rèn)知融合網(wǎng)絡(luò)(ECFN),讓AI能像人類一樣理解和表達(dá)情感。該系統(tǒng)通過多層次情感處理架構(gòu),在情感識別準(zhǔn)確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達(dá)自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實(shí)現(xiàn)了跨模態(tài)情感融合、動(dòng)態(tài)情感追蹤和個(gè)性化情感建模,為醫(yī)療、教育、客服等領(lǐng)域帶來革命性應(yīng)用前景。
哈佛大學(xué)研究團(tuán)隊(duì)通過創(chuàng)新的多智能體強(qiáng)化學(xué)習(xí)方法,讓AI在戰(zhàn)略游戲中學(xué)會復(fù)雜推理。研究發(fā)現(xiàn)AI通過游戲競爭能發(fā)展出類人思維能力,在邏輯推理、創(chuàng)造性解決問題等方面表現(xiàn)顯著提升。這項(xiàng)突破性成果為未來AI在醫(yī)療、教育、城市管理等領(lǐng)域的應(yīng)用奠定基礎(chǔ),展現(xiàn)了通過模擬人類學(xué)習(xí)過程培養(yǎng)真正智能AI的新路徑。