10月21日,夏威夷——驍龍峰會(huì)首日,智譜與高通技術(shù)公司宣布合作將GLM-4V端側(cè)視覺(jué)大模型,面向驍龍8至尊版進(jìn)行深度適配和推理優(yōu)化,支持豐富的多模態(tài)交互方式,進(jìn)一步推動(dòng)多模態(tài)生成式AI在終端側(cè)的部署和推廣,賦能更加情境化、個(gè)性化的終端側(cè)智能體驗(yàn)。
驍龍8至尊版移動(dòng)平臺(tái)搭載全新第二代高通®Oryon CPU和高通®Hexagon™ NPU,終端側(cè)AI能力再次實(shí)現(xiàn)突破,能夠賦能規(guī)模更大且更加復(fù)雜的多模態(tài)生成式AI用例在終端側(cè)高效運(yùn)行。充分利用驍龍8至尊版的強(qiáng)大終端側(cè)AI性能和高通AI軟件棧為模型帶來(lái)的性能優(yōu)化,GLM-4V端側(cè)視覺(jué)大模型能夠?qū)崿F(xiàn)令人驚嘆的處理能力,以超過(guò)70 tokens/秒的速度在終端側(cè)高速運(yùn)行。
改善情境化和定制化一直是用戶(hù)體驗(yàn)的長(zhǎng)期需求。多模態(tài)生成式AI模型能夠利用終端側(cè)豐富的傳感器數(shù)據(jù),例如文本、圖像、音頻、視頻等,打造更加直觀(guān)、無(wú)縫的智能交互體驗(yàn)。通過(guò)與驍龍8至尊版進(jìn)行深度適配和推理優(yōu)化,終端側(cè)多模態(tài)應(yīng)用ChatGLM能夠支持三種終端側(cè)交互方式:使用相機(jī)進(jìn)行實(shí)時(shí)語(yǔ)音對(duì)話(huà)、上傳照片進(jìn)行對(duì)話(huà)、上傳視頻進(jìn)行對(duì)話(huà)。豐富的多模態(tài)輸入輸出方式賦能智能助手ChatGLM實(shí)現(xiàn)了跨家庭、出行、工作和教育等多個(gè)場(chǎng)景的應(yīng)用,例如通過(guò)手機(jī)攝像頭獲取穿搭建議,利用視覺(jué)信息實(shí)現(xiàn)智能導(dǎo)航,通過(guò)車(chē)內(nèi)攝像頭識(shí)別遺留物品,拍攝畫(huà)作進(jìn)行風(fēng)格解析等。
高通技術(shù)公司高級(jí)副總裁兼技術(shù)規(guī)劃和邊緣解決方案業(yè)務(wù)總經(jīng)理馬德嘉表示:“高通與智譜共同致力于推動(dòng)生成式AI在邊緣終端上的應(yīng)用和普及,并已經(jīng)在手機(jī)、PC、汽車(chē)等領(lǐng)域展開(kāi)了緊密合作。結(jié)合高通在終端側(cè)AI領(lǐng)域的長(zhǎng)期領(lǐng)導(dǎo)力,跨不同邊緣終端的廣泛市場(chǎng)布局,以及驍龍8至尊版的AI創(chuàng)新,我們?cè)谕苿?dòng)終端側(cè)生成式AI發(fā)展方面獨(dú)具優(yōu)勢(shì)。多模態(tài)是發(fā)揮終端生成式AI潛力的重要技術(shù)發(fā)展方向,我們期待攜手智譜,探索多模態(tài)在終端側(cè)AI應(yīng)用上的更多可能。”
智譜COO張帆表示:“驍龍8至尊版移動(dòng)平臺(tái)提供了卓越的AI算力,結(jié)合高通AI軟件棧推理框架的性能優(yōu)化,使得智譜的終端側(cè)大模型可以在設(shè)備端實(shí)現(xiàn)高速推理。我們相信,終端側(cè)算力平臺(tái)的性能躍遷結(jié)合大模型能力的進(jìn)步,會(huì)將生成式AI帶入新的時(shí)代。終端側(cè)運(yùn)行的生成式AI,在為用戶(hù)提供變革性體驗(yàn)的同時(shí),能更好地保護(hù)用戶(hù)隱私安全,真正讓AI變革用戶(hù)的日常生活。”
GLM-4V-Mini、GLM-4V-Nano端側(cè)視覺(jué)大模型和GLM-4-9B模型即將在高通AI Hub上線(xiàn),搭載驍龍8至尊版的商用手機(jī)均可支持。
好文章,需要你的鼓勵(lì)
這項(xiàng)研究提出了"高效探測(cè)"方法,解決了掩碼圖像建模AI難以有效評(píng)估的問(wèn)題。通過(guò)創(chuàng)新的多查詢(xún)交叉注意力機(jī)制,該方法在減少90%參數(shù)的同時(shí)實(shí)現(xiàn)10倍速度提升,在七個(gè)基準(zhǔn)測(cè)試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質(zhì)量與分類(lèi)性能的強(qiáng)相關(guān)性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應(yīng)性。團(tuán)隊(duì)承諾開(kāi)源全部代碼,推動(dòng)技術(shù)普及應(yīng)用。
伊利諾伊大學(xué)研究團(tuán)隊(duì)開(kāi)發(fā)了CLAIMSPECT系統(tǒng),通過(guò)層次化分解復(fù)雜爭(zhēng)議、智能檢索相關(guān)文獻(xiàn)、多角度收集觀(guān)點(diǎn)的方法,將傳統(tǒng)的"真假"判斷轉(zhuǎn)變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動(dòng)構(gòu)建爭(zhēng)議話(huà)題的分析框架,識(shí)別不同觀(guān)點(diǎn)及其支撐證據(jù),為科學(xué)和政治爭(zhēng)議提供更全面客觀(guān)的分析,已在生物醫(yī)學(xué)和國(guó)際關(guān)系領(lǐng)域驗(yàn)證有效性。
清華大學(xué)研究團(tuán)隊(duì)首次提出情感認(rèn)知融合網(wǎng)絡(luò)(ECFN),讓AI能像人類(lèi)一樣理解和表達(dá)情感。該系統(tǒng)通過(guò)多層次情感處理架構(gòu),在情感識(shí)別準(zhǔn)確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達(dá)自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實(shí)現(xiàn)了跨模態(tài)情感融合、動(dòng)態(tài)情感追蹤和個(gè)性化情感建模,為醫(yī)療、教育、客服等領(lǐng)域帶來(lái)革命性應(yīng)用前景。
哈佛大學(xué)研究團(tuán)隊(duì)通過(guò)創(chuàng)新的多智能體強(qiáng)化學(xué)習(xí)方法,讓AI在戰(zhàn)略游戲中學(xué)會(huì)復(fù)雜推理。研究發(fā)現(xiàn)AI通過(guò)游戲競(jìng)爭(zhēng)能發(fā)展出類(lèi)人思維能力,在邏輯推理、創(chuàng)造性解決問(wèn)題等方面表現(xiàn)顯著提升。這項(xiàng)突破性成果為未來(lái)AI在醫(yī)療、教育、城市管理等領(lǐng)域的應(yīng)用奠定基礎(chǔ),展現(xiàn)了通過(guò)模擬人類(lèi)學(xué)習(xí)過(guò)程培養(yǎng)真正智能AI的新路徑。