
首先與大家分享一個場景:“……哈巴狗一般大小、名叫‘先鋒’的機(jī)器人慢慢向前翻滾著,逐漸靠近地毯上的玩具‘美國隊長’,它們對峙站立的地方是一間兒童臥室,Qualcomm在一輛房車中搭建了這個空間。“先鋒”的動作停頓了下來,好像在評估周遭環(huán)境,然后,它用自己身前像雪鏟一樣的工具把美國隊長攬入懷中,轉(zhuǎn)個身,把它向三個矮矮的玩具箱推去。 高級工程師Ilwoo Chang抬起兩只手臂,指向應(yīng)該投放‘美國隊長’的那個箱子。‘先鋒’的攝像頭看到了這個動作,乖乖地照做了。然后它又翻滾著折返,發(fā)現(xiàn)了另一個動作片人物‘蜘蛛俠’。”
(圖片來自于《麻省理工科技評論》)
這個演示完成于Qualcomm圣迭戈總部,Qualcomm稱其為Zeroth項目,描述來自科技期刊《麻省理工科技評論》(MIT Technology Review)的記者。近日這家期刊評選出2014年全球十大突破技術(shù):Qualcomm神經(jīng)形態(tài)芯片(即Zeroth項目)、基因編輯、靈巧性機(jī)器人、超私密智能手機(jī)、微距3D打印、移動協(xié)作、智能風(fēng)能和太陽能、虛擬現(xiàn)實(shí)、農(nóng)用無人機(jī)和腦部圖譜。
“通過Qualcomm Zeroth項目,你可以窺見計算的未來。 機(jī)器人完成的這些任務(wù)過去通常需要強(qiáng)大的、經(jīng)過專門編程的計算機(jī)完成,耗費(fèi)的電力也多得多。而‘先鋒’只是配備了一個智能手機(jī)芯片和專門的軟件,就能識別從前機(jī)器人無法識別的物體,根據(jù)它們與相關(guān)物體的相似程度來做分類,再把它們傳送到房間中正確的位置。 這一切并不是源于繁復(fù)的編程,而只是因為人向它演示過一次它該往哪里走。機(jī)器人可以做到這些,是因為它模仿了人腦的運(yùn)作,盡管這種模仿非常有限。” 《麻省理工科技評論》如此評論這次演示。
關(guān)于Zeroth,過去幾年中,Qualcomm研發(fā)團(tuán)隊一直致力于開發(fā)一種突破傳統(tǒng)模式的全新計算架構(gòu)。他們希望打造一個全新的計算處理器,模仿人類的大腦和神經(jīng)系統(tǒng),使終端擁有大腦模擬計算驅(qū)動的嵌入式認(rèn)知——這就是Zeroth。也就是說,Qualcomm正在把硅片和生物系統(tǒng)間的界限變模糊,未來你的智能手機(jī)等終端將預(yù)期你下一步想干什么。
“仿生式學(xué)習(xí)”、“使終端能夠像人類一樣觀察和感知世界”、“神經(jīng)處理單元(NPU)的創(chuàng)造和定義”是Zeroth的三個目標(biāo)。關(guān)于“仿生式學(xué)習(xí)”,值得注意的是,Qualcomm實(shí)現(xiàn)其是通過基于神經(jīng)傳導(dǎo)物質(zhì)多巴胺的學(xué)習(xí)(又名“正強(qiáng)化”)完成的——而非編寫代碼。
稍早前,基于Zeroth,Qualcomm研發(fā)部門參與了一個突破性的研究,并將其發(fā)現(xiàn)發(fā)表在《自然》雜志上,解釋哺乳動物的大腦是如何對運(yùn)動進(jìn)行探測的。其工程師說,“Qualcomm研發(fā)部門的工作人員以解決重大挑戰(zhàn)為榮,其中一項挑戰(zhàn)是認(rèn)識人腦——最復(fù)雜、最多面的進(jìn)化產(chǎn)物。作為這項先驅(qū)工作的一部分,我們還建立了模擬視網(wǎng)膜和神經(jīng)元的數(shù)學(xué)模型和算法,讓整個科學(xué)界能夠在進(jìn)一步的研究和測試中使用和利用。”這樣的表述與Qualcomm執(zhí)行董事長保羅·雅各布日前在中國南京發(fā)表的演講相呼應(yīng),雅各布說,“(科技進(jìn)步)這一切背后的推動力是什么?我相信是發(fā)明創(chuàng)造,是創(chuàng)新為這個市場帶來了增長,為消費(fèi)者帶來了新的服務(wù)和新的能力。”
好文章,需要你的鼓勵
浙江大學(xué)團(tuán)隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團(tuán)隊提出SIRI方法,通過"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實(shí)驗顯示,該方法在數(shù)學(xué)競賽題上將模型準(zhǔn)確率提升43.2%的同時,輸出長度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊開發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團(tuán)隊發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個AI模型。實(shí)驗結(jié)果顯示,幾何訓(xùn)練在四個空間智能測試基準(zhǔn)上都帶來顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績。這項研究揭示了基礎(chǔ)幾何知識對培養(yǎng)AI空間智能的重要價值。