科技行者 3月28日 北京消息:今日,在華為開發(fā)者大會2020(Cloud)第二天,華為全面分享在計算視覺領域的基礎研究成果,全球開發(fā)者可通過公開發(fā)表的論文及開源代碼,進一步開展AI的研究、開發(fā)和部署。同時,華為發(fā)布計算視覺研究計劃(以下簡稱視覺計劃),并邀請全球AI專家參與研究?;谌A為昇騰AI處理器的Atlas人工智能計算平臺將為該計劃提供強大算力支撐,研究成果將在華為全場景AI計算框架MindSpore實現(xiàn)并開源給業(yè)界,讓全球AI開發(fā)者以此為基礎持續(xù)創(chuàng)新、不斷突破邊界、共同打造無所不及的智能。
開放華為計算視覺基礎研究成果
投資基礎研究是華為AI戰(zhàn)略的重要部分,華為致力于在計算視覺、自然語言處理、決策推理等領域構筑數(shù)據(jù)高效、能耗高效、安全可信、自動自治的機器學習基礎能力。
面向全球開發(fā)者,華為諾亞方舟實驗室計算視覺首席科學家、IEEE Fellow田奇教授分享了計算視覺領域的最新研究進展:“華為在計算視覺領域圍繞數(shù)據(jù)、知識和模型三大方向,大力投入基礎研究,過去兩年已在AI頂會CVPR、ICCV、NeurIPS、ICLR等發(fā)表80余篇論文,并取得多項業(yè)界領先的成果,這些研究成果已通過學術論文和算法代碼開源等形式公開給業(yè)界,我們歡迎全球AI開發(fā)者基于華為已有的研究成果,進一步開展AI的研究、開發(fā)和部署”。
發(fā)布華為計算視覺研究計劃、助力每一位AI開發(fā)者
華為計算視覺研究計劃
在當前研究基礎上,田奇教授發(fā)布了華為計算視覺計劃,“華為將繼續(xù)加大投入計算視覺的基礎研究,不斷挑戰(zhàn)計算視覺領域三大問題,包括如何從海量數(shù)據(jù)中高效挖掘有用的信息、設計高效的萬物識別視覺模型,以及表達并存儲知識以邁向通用智能“。華為視覺計劃圍繞三大方向,共有六大子計劃,包括:
同時,田奇教授表示,“我們歡迎全球AI研究者加入華為視覺計劃,共同創(chuàng)新、探索未來。華為Atlas人工智能計算平臺的超強算力將全面加速視覺計劃開展,研究成果將在華為全場景AI計算框架MindSpore上充分實現(xiàn)并開源給業(yè)界,助力每一位AI開發(fā)者“。
華為在2018年華為全聯(lián)接大會上首次發(fā)布AI戰(zhàn)略,重點投資AI基礎研究,并協(xié)同全球科研機構和開發(fā)者共同構建AI生態(tài)。本次開發(fā)者大會上,華為系統(tǒng)展示計算視覺領域基礎研究成果并發(fā)布視覺計劃,以AI基礎研究和開放創(chuàng)新全面支持全球開發(fā)者探索未來,不斷突破邊界,共同打造無所不及的智能。
好文章,需要你的鼓勵
浙江大學團隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學、編程等任務上顯著提升推理準確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學研究團隊提出SIRI方法,通過"壓縮-擴張"交替訓練策略,成功解決了大型推理模型"話多且準確率低"的問題。實驗顯示,該方法在數(shù)學競賽題上將模型準確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓練提供了新思路。
南洋理工大學與騰訊聯(lián)合研究團隊開發(fā)出Rolling Forcing技術,實現(xiàn)AI視頻實時流式生成的重大突破。該技術通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學研究團隊發(fā)現(xiàn),通過讓AI模型學習解決幾何問題,能夠顯著提升其空間理解能力。他們構建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強化學習方法訓練多個AI模型。實驗結果顯示,幾何訓練在四個空間智能測試基準上都帶來顯著提升,其中最佳模型達到49.6%準確率,超越此前最好成績。這項研究揭示了基礎幾何知識對培養(yǎng)AI空間智能的重要價值。