百度美研要做的第三件事則是做最有挑戰(zhàn)的項(xiàng)目,這些項(xiàng)目包括:山西陽泉的新數(shù)據(jù)中心;大數(shù)據(jù)預(yù)測(cè);百度天眼;醫(yī)療大數(shù)據(jù)分析;語音識(shí)別技術(shù)等。
其中,百度天眼項(xiàng)目受到極大關(guān)注。這是一款可以實(shí)時(shí)知曉飛機(jī)航線的產(chǎn)品,其數(shù)據(jù)通過地面設(shè)備得到,而非官方渠道獲取信息,這解決了拿不到數(shù)據(jù)以及信息滯后這兩大問題。此外,百度的語音識(shí)別技術(shù)也獲得突破,在一項(xiàng)識(shí)別錯(cuò)誤率的比較中,百度無論在安靜環(huán)境還是噪音環(huán)境中,識(shí)別正確率都高于谷歌。百度高級(jí)技術(shù)總監(jiān)呂厚昌表示:“盡管有這些成果,但還只是一小步,百度美研未來任重而道遠(yuǎn)。”
對(duì)于中國(guó)如何學(xué)習(xí)硅谷精神,百度The Big Talk特意邀請(qǐng)到Apple的聯(lián)合創(chuàng)始人沃茲尼亞克來談此話題。沃茲尼亞克說,“硅谷已經(jīng)從硬變軟,硅谷精神是內(nèi)生的,這些科技人士在此學(xué)習(xí)長(zhǎng)大。”值得注意的是,在他看來,創(chuàng)業(yè)是一種空前的快樂。這或許就是硅谷為何能持續(xù)創(chuàng)新和擁有激情的本質(zhì)。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。