圖片分享社交平臺(tái)Pinterest周一宣布,其已收購了圖像識(shí)別及視覺搜索技術(shù)初創(chuàng)企業(yè)VisualGraph。
圖:VisualGraph的圖片識(shí)別技術(shù)可檢測到人臉、身體、汽車及其他物體
VisualGraph成立于2013年,VisualGraph公司為一家二人公司,兩名員工分別為Kevin Jing和David Liu,其中前者曾為谷歌前員工。VisualGraph的圖片識(shí)別技術(shù)可識(shí)別圖片上人臉、汽車、服裝、紋理圖案及人體的體貌特征。對(duì)于Pinterest來說,收購VisualGraph技術(shù)能夠幫助Pinterest將用戶貼圖分門別類;反之,VisualGraph技術(shù)可幫助用戶實(shí)現(xiàn)圖片的精準(zhǔn)搜索。
Pinterest的這一并購交易實(shí)為獲得VisualGraph技術(shù)和人才。未來Kevin Jing和David Liu將加入到Pinterest的工程師團(tuán)隊(duì),其中Kevin Jing將加入到Pinterest新的“視覺發(fā)現(xiàn)”團(tuán)隊(duì)。
Kevin Jing和David Liu在一份聲明中表示:“我們感到十分激動(dòng),未來將有機(jī)會(huì)把機(jī)器視覺與人類視覺結(jié)合,創(chuàng)造兼具審美和實(shí)用功能的視覺發(fā)現(xiàn)體驗(yàn)。”
Pinterest公司一位發(fā)言人稱:“收購VisualGraph將有助于我們創(chuàng)建方便用戶使用理解圖片的技術(shù)。通過創(chuàng)建新技術(shù),希望用戶更加便捷的找到他們所喜歡的東西。”Pinterest發(fā)言人還稱,VisualGraph已關(guān)閉了其原有向少數(shù)人開放的服務(wù)。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長視頻生成中的錯(cuò)誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測試基準(zhǔn)上都帶來顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。