10月21日,夏威夷——驍龍峰會(huì)期間,高通技術(shù)公司宣布與騰訊混元合作,基于驍龍8至尊版移動(dòng)平臺(tái),共同推動(dòng)了騰訊混元大模型7B和3B版本的終端側(cè)部署,展示了此合作實(shí)現(xiàn)出色的運(yùn)行表現(xiàn)。這將有助于騰訊混元大模型為廣泛的業(yè)務(wù)場(chǎng)景提供技術(shù)支持,通過(guò)利用終端側(cè)AI加速產(chǎn)品創(chuàng)新,有效降低運(yùn)營(yíng)成本,并進(jìn)一步擴(kuò)展生成式AI在終端側(cè)的應(yīng)用和普及。
驍龍8至尊版移動(dòng)平臺(tái)搭載全新的第二代定制高通®Oryon CPU和增強(qiáng)的高通®Hexagon™ NPU,充分利用高通®AI引擎優(yōu)勢(shì),能夠帶來(lái)更強(qiáng)大的終端側(cè)生成式AI處理能力。驍龍8至尊版的強(qiáng)大AI算力,結(jié)合高通®AI軟件棧以及行業(yè)領(lǐng)先的工具套件,包括高通®AI模型增效工具包(AIMET)等,為模型提供了全棧優(yōu)化能力。通過(guò)使用基于硬件的INT4量化技術(shù),可以大幅提升騰訊混元大模型在終端側(cè)的運(yùn)行效率,端側(cè)推理實(shí)現(xiàn)首個(gè)token生成時(shí)延達(dá)到150ms,解碼速率達(dá)到超過(guò)30 tokens/秒。
騰訊混元大模型已為騰訊內(nèi)部超過(guò)700個(gè)業(yè)務(wù)場(chǎng)景和C端應(yīng)用提供底層技術(shù)支持,包括微信輸入法、騰訊手機(jī)管家、QQ、騰訊視頻、QQ瀏覽器、企業(yè)微信、騰訊會(huì)議等,通過(guò)實(shí)現(xiàn)面向驍龍8至尊版的終端側(cè)部署,能夠利用終端側(cè)生成式AI的豐富優(yōu)勢(shì),更好地滿(mǎn)足廣泛的終端側(cè)業(yè)務(wù)需求。例如,騰訊手機(jī)管家短信智能識(shí)別功能率先利用騰訊混元的終端側(cè)模型能力,通過(guò)海量數(shù)據(jù)結(jié)合深度神經(jīng)網(wǎng)絡(luò)與預(yù)訓(xùn)練,讓模型具備極強(qiáng)的語(yǔ)義理解能力,通過(guò)結(jié)合上下文語(yǔ)境信息更準(zhǔn)確地理解短信意圖,使短信召回率大幅提高將近200%,識(shí)別準(zhǔn)確率提升20%。由于部分短信涉及用戶(hù)個(gè)人敏感信息,端側(cè)AI還可以在保證出色性能表現(xiàn)的同時(shí),有效保護(hù)用戶(hù)的個(gè)人信息隱私安全。
高通技術(shù)公司高級(jí)副總裁兼技術(shù)規(guī)劃和邊緣解決方案業(yè)務(wù)總經(jīng)理馬德嘉表示:“高通與騰訊混元大模型團(tuán)隊(duì)長(zhǎng)期攜手推動(dòng)前沿終端側(cè)技術(shù)創(chuàng)新在移動(dòng)應(yīng)用中的部署和推廣,為廣大用戶(hù)和消費(fèi)者打造創(chuàng)新的應(yīng)用體驗(yàn)。高通公司致力于賦能廣大ISV合作伙伴和開(kāi)發(fā)者,利用高通強(qiáng)大的異構(gòu)計(jì)算、行業(yè)領(lǐng)先的CPU、GPU、NPU和軟件解決方案,在搭載驍龍平臺(tái)的終端上推動(dòng)生成式AI應(yīng)用的普及,惠及全球更多用戶(hù)。”
騰訊機(jī)器學(xué)習(xí)平臺(tái)部總經(jīng)理,騰訊混元大模型負(fù)責(zé)人王迪表示:“騰訊混元已經(jīng)構(gòu)建起了全鏈路的大模型矩陣和應(yīng)用平臺(tái)。同時(shí),騰訊混元不斷完善部署生態(tài)。在云服務(wù)場(chǎng)景,我們通過(guò)多種技術(shù)在提升效果的同時(shí)調(diào)用價(jià)格持續(xù)降低。在智能終端場(chǎng)景,騰訊和高通持續(xù)深入合作,賦能不同業(yè)務(wù)對(duì)端側(cè)模型的部署需求,并在騰訊豐富的生態(tài)中持續(xù)迭代能力,讓更多的B端和C端用戶(hù)獲得實(shí)用大模型的非凡體驗(yàn)。”
好文章,需要你的鼓勵(lì)
這項(xiàng)研究提出了"高效探測(cè)"方法,解決了掩碼圖像建模AI難以有效評(píng)估的問(wèn)題。通過(guò)創(chuàng)新的多查詢(xún)交叉注意力機(jī)制,該方法在減少90%參數(shù)的同時(shí)實(shí)現(xiàn)10倍速度提升,在七個(gè)基準(zhǔn)測(cè)試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質(zhì)量與分類(lèi)性能的強(qiáng)相關(guān)性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應(yīng)性。團(tuán)隊(duì)承諾開(kāi)源全部代碼,推動(dòng)技術(shù)普及應(yīng)用。
伊利諾伊大學(xué)研究團(tuán)隊(duì)開(kāi)發(fā)了CLAIMSPECT系統(tǒng),通過(guò)層次化分解復(fù)雜爭(zhēng)議、智能檢索相關(guān)文獻(xiàn)、多角度收集觀(guān)點(diǎn)的方法,將傳統(tǒng)的"真假"判斷轉(zhuǎn)變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動(dòng)構(gòu)建爭(zhēng)議話(huà)題的分析框架,識(shí)別不同觀(guān)點(diǎn)及其支撐證據(jù),為科學(xué)和政治爭(zhēng)議提供更全面客觀(guān)的分析,已在生物醫(yī)學(xué)和國(guó)際關(guān)系領(lǐng)域驗(yàn)證有效性。
清華大學(xué)研究團(tuán)隊(duì)首次提出情感認(rèn)知融合網(wǎng)絡(luò)(ECFN),讓AI能像人類(lèi)一樣理解和表達(dá)情感。該系統(tǒng)通過(guò)多層次情感處理架構(gòu),在情感識(shí)別準(zhǔn)確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達(dá)自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實(shí)現(xiàn)了跨模態(tài)情感融合、動(dòng)態(tài)情感追蹤和個(gè)性化情感建模,為醫(yī)療、教育、客服等領(lǐng)域帶來(lái)革命性應(yīng)用前景。
哈佛大學(xué)研究團(tuán)隊(duì)通過(guò)創(chuàng)新的多智能體強(qiáng)化學(xué)習(xí)方法,讓AI在戰(zhàn)略游戲中學(xué)會(huì)復(fù)雜推理。研究發(fā)現(xiàn)AI通過(guò)游戲競(jìng)爭(zhēng)能發(fā)展出類(lèi)人思維能力,在邏輯推理、創(chuàng)造性解決問(wèn)題等方面表現(xiàn)顯著提升。這項(xiàng)突破性成果為未來(lái)AI在醫(yī)療、教育、城市管理等領(lǐng)域的應(yīng)用奠定基礎(chǔ),展現(xiàn)了通過(guò)模擬人類(lèi)學(xué)習(xí)過(guò)程培養(yǎng)真正智能AI的新路徑。