據(jù)中國之聲《央廣新聞》報道,隨著科技水平的不斷提高,智能電子設(shè)備所具有的能力也越來越豐富。IBM甚至預(yù)言,5年內(nèi)智能電腦將具備人類味覺等五種感覺。
其實現(xiàn)在只要一部智能手機在手,你可以完成很多事情,比如說像瀏覽新聞、觀看視頻、訂餐訂票、快捷支付等等,很大程度方便了我們的生活。但是如果想要知道眼前的這道菜是不是好吃,想買的這件衣服材質(zhì)是否優(yōu)質(zhì),目前的大部分電子設(shè)備是不能夠完成的?,F(xiàn)在這種情況就有可能發(fā)生改變了。
據(jù)美國IBM公司的估計,這種情況在五年之內(nèi)就會發(fā)生改變。到了那個時候,電腦將更加了解周圍的世界,并懂得如何去理解不同的事物。IBM還提出了電腦要實現(xiàn)的5種人類才有的感覺能力,也就是視覺、聽覺、味覺、嗅覺和觸覺。綜合起來,這5種感覺其實源于同一個大的概念,即也就是認(rèn)知計算能力。電腦等機器將越來越像人一樣去感受這個世界。比如說具有認(rèn)知能力的電腦在觀看一幅畫的時候,并不僅僅將其當(dāng)作一組描述顏色的數(shù)據(jù)點、色素和線條,相反,它會將畫作為整體來看,并能夠理解畫作所表達(dá)的含義。
IBM公司負(fù)責(zé)創(chuàng)新的副總裁伯尼表示這是計算思維在本質(zhì)上的改變,你必須從新的角度來思考如何獲取數(shù)據(jù),不能僅僅拍一張照片然后存儲起來。你必須在更高的層次上將這張圖像看成實體,而不僅僅是一堆數(shù)據(jù)的位點。他補充說,認(rèn)知計算將促進一些非常有趣的功能轉(zhuǎn)變,這是一個相當(dāng)深刻的技術(shù)進步。也就是說其實具備認(rèn)知能力的電腦與傳統(tǒng)電腦相比最關(guān)鍵的差別在于,后者能夠接受“訓(xùn)練”。而認(rèn)知系統(tǒng)不會簡單地重復(fù)給出錯誤或者是無用的答案,一旦知道結(jié)論錯誤之后,他們能夠改變方法重新嘗試。
好文章,需要你的鼓勵
浙江大學(xué)團隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團隊提出SIRI方法,通過"壓縮-擴張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實驗顯示,該方法在數(shù)學(xué)競賽題上將模型準(zhǔn)確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團隊開發(fā)出Rolling Forcing技術(shù),實現(xiàn)AI視頻實時流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓(xùn)練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團隊發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強化學(xué)習(xí)方法訓(xùn)練多個AI模型。實驗結(jié)果顯示,幾何訓(xùn)練在四個空間智能測試基準(zhǔn)上都帶來顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績。這項研究揭示了基礎(chǔ)幾何知識對培養(yǎng)AI空間智能的重要價值。