北京時(shí)間5月6日上午消息,本周,The Intercept網(wǎng)站再次發(fā)布了愛(ài)德華·斯諾登(Edward Snowden)曝光的美國(guó)政府文件。其中顯示,美國(guó)國(guó)家安全局(NSA)在近10年的時(shí)間里持續(xù)將監(jiān)聽(tīng)的語(yǔ)音通話轉(zhuǎn)換為可搜索的文本文檔。
長(zhǎng)期以來(lái),NSA一直監(jiān)控著全球范圍內(nèi),尤其是阿富汗和伊拉克等沖突地區(qū)的“信號(hào)情報(bào)”,這也是NSA的主要職能。以往,這樣的數(shù)據(jù)收集活動(dòng)需要人工操作員監(jiān)聽(tīng)通話,并進(jìn)行實(shí)時(shí)的翻譯。
然而最新曝光的文件顯示,NSA開(kāi)發(fā)出了一種被稱作“語(yǔ)音版谷歌”的技術(shù)。這一自動(dòng)化系統(tǒng)能提供粗略的、同時(shí)可通過(guò)關(guān)鍵詞進(jìn)行搜索的語(yǔ)音實(shí)錄。與此同時(shí),NSA還開(kāi)發(fā)了數(shù)據(jù)分析項(xiàng)目和復(fù)雜的算法,以標(biāo)記出需要人工審閱的通話。
此外,這一技術(shù)實(shí)現(xiàn)了自動(dòng)化和工業(yè)級(jí)規(guī)模,從而幫助NSA監(jiān)控特定地區(qū)的龐大通話流量。這些自動(dòng)轉(zhuǎn)換的文本十分粗略,但根據(jù)來(lái)自NSA的托馬斯·德拉科(Thomas Drake)的說(shuō)法,“即使并不是100%完美,我仍可以獲得大量信息。這樣的情報(bào)更容易讀取,我可以進(jìn)行搜索。真正的突破在于實(shí)現(xiàn)了龐大的規(guī)模。”
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專家搜索方法,讓AI能根據(jù)不同問(wèn)題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問(wèn)題偏愛(ài)不同專家配置,為AI推理優(yōu)化開(kāi)辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過(guò)"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問(wèn)題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開(kāi)發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過(guò)滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問(wèn)題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開(kāi)辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過(guò)讓AI模型學(xué)習(xí)解決幾何問(wèn)題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來(lái)顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。