最近AI芯片領(lǐng)域的新聞層出不窮,借助今天文章為大家做一番簡單的整理。篇幅有限,內(nèi)容可能較為簡短,后續(xù)也將在其他文章中做進(jìn)一步補(bǔ)充。
先從幾條大新聞開始。Amazon AWS于12月1日的年度AWS re: Invent大會(huì)上發(fā)布了兩項(xiàng)重要的AI聲明。首先,AWS掌門人Andy Jassy宣布將在其彈性云體系中提供英特爾的Gaudi訓(xùn)練芯片。AWS的實(shí)際部署,也讓我們第一次對(duì)Gaudi給予確切關(guān)注。對(duì)于英特爾來說,在去年投入20億美元收購Habana Labs并由此拿下Gaudi項(xiàng)目之后,這也代表著一個(gè)期待已久的好消息。
圖一:Amazon AWS的全面部署,堪稱Habana Gaudi訓(xùn)練芯片設(shè)計(jì)成果的首次公開亮相。
第二點(diǎn),也是更令人驚訝的一點(diǎn):Jassy宣布AWS將在2021年下半年推出其內(nèi)部開發(fā)的訓(xùn)練專用芯片,即“Trainium”。AWS宣稱Trainium將成為云端速度最快的AI芯片。對(duì)Trainium、Gaudi以及英偉達(dá)GPU的全面支持,也代表著AWS繼續(xù)踐行其為客戶提供多種技術(shù)選項(xiàng)以滿足特定需求的長期發(fā)展策略。從定位上看,Trainium似乎將成為Inferentia的完美搭檔——后者由AWS于去年發(fā)布,而且已經(jīng)成為實(shí)際部署的專用推理芯片。
圖二:AWS宣布將部署AI專用型Trainium訓(xùn)練芯片。
高通公司在12月1日召開的年度驍龍峰會(huì)上發(fā)布了最新一代驍龍?zhí)幚砥鳎打旪?88。新款移動(dòng)芯片采用高通的第六代AI引擎,此引擎已經(jīng)成為AI融合處理單元,在Int-8性能方面可達(dá)到26 TOPS。這套引擎還簡化了此前的三域設(shè)備,可支持標(biāo)量、張量與矢量運(yùn)算。此外,該引擎還將片上內(nèi)存提升達(dá)16倍,用以處理體量更大的模型。
接下來,讓我們把目光投向初創(chuàng)企業(yè)。
• SimpleMachines公布用于低功耗推理的芯片。根據(jù)目前的規(guī)格數(shù)字來看,這家初創(chuàng)企業(yè)的芯片似乎頗具吸引力:僅需4瓦功率即可實(shí)現(xiàn)35 TOPS(8-bit)。該公司稱這款芯片的核心優(yōu)勢(shì)在于其“可組合行為執(zhí)行”技術(shù),意味著芯片能夠操縱并理解程序?qū)傩裕ɡ鐢?shù)據(jù)大小與程序大?。┎?jù)此進(jìn)行存儲(chǔ)與執(zhí)行優(yōu)化。
• Mythic是一家位于得克薩斯州奧斯汀市的初創(chuàng)公司,其采用模擬處理路線進(jìn)行推理。該公司最近宣布開始向部分選定客戶提供芯片樣品。Mythic宣稱其計(jì)算密度可達(dá)數(shù)字式同類產(chǎn)品(我們姑且認(rèn)為這里指的是T4芯片)的50倍,而成本僅為二十分之一。Mythic Analog Compute Engine則用于解決4-bit與8-bit推理作業(yè)的嵌入式及邊緣推理應(yīng)用。我們將持續(xù)關(guān)注相關(guān)消息,并為大家及時(shí)帶來最新報(bào)道。
• Imagination是一家位于英國的中國企業(yè),專門提供手機(jī)GPU及其他IP方案。該公司剛剛公布了其AI Series 4多核心NNA芯片IP。根據(jù)發(fā)言人的表述,其目標(biāo)主要針對(duì)汽車智能這一尚未被科技巨頭明確占領(lǐng)的市場。SoC設(shè)計(jì)人員可以獲取許可,并將這套極為強(qiáng)大的高可擴(kuò)展IP方案嵌入自家芯片。據(jù)我所知,其每瓦性能可達(dá)到30 TOPS,這也使其成為當(dāng)前單位功率性能最高的DNN處理器。期待這一令人振奮的項(xiàng)目能夠發(fā)布更多后續(xù)消息。
總結(jié)
AI領(lǐng)域的“寒武紀(jì)生物大爆炸”終于來臨,知名芯片廠商、云服務(wù)供應(yīng)商以及初創(chuàng)企業(yè)的新款芯片正全力沖擊推理與訓(xùn)練等目標(biāo)。但這還只是第二輪比拼,希望明年會(huì)發(fā)布更多相關(guān)消息。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長視頻生成中的錯(cuò)誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測試基準(zhǔn)上都帶來顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。