2021年7月7日, 2021世界人工智能大會(WAIC)唯一外場活動——第八屆中國產(chǎn)業(yè)互聯(lián)網(wǎng)高峰論壇在上海舉行,近400家企業(yè)代表以產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型作為核心議題,依托人工智能、智能制造等新科技與新技術(shù),圍繞人工智能、5G、互聯(lián)網(wǎng)、大數(shù)據(jù)、區(qū)塊鏈等智能交互技術(shù)展開討論,共同探討未來產(chǎn)業(yè)升級的新機遇。
澳大利亞科學(xué)院院士、京東探索研究院院長陶大程博士在大會開場發(fā)表了題為《超級模型生態(tài)系統(tǒng)引領(lǐng)新一輪產(chǎn)業(yè)變革》的主題演講,他認(rèn)為,通過構(gòu)建超級模型生態(tài)系統(tǒng)可以推動人工智能技術(shù)更高效地落地,應(yīng)用涵蓋科技創(chuàng)新、經(jīng)濟發(fā)展、文化融合等多個維度,以此引領(lǐng)新一輪產(chǎn)業(yè)變革。
澳大利亞科學(xué)院院士、京東探索研究院院長陶大程博士
陶大程博士認(rèn)為,目前人工智能技術(shù)在落地的過程中存在應(yīng)用場景復(fù)雜、模型單一、算力分布較為分散、基礎(chǔ)理論層面缺乏可解釋性等難點,導(dǎo)致中小企業(yè)在數(shù)據(jù)和算力都有限的情況下,更易面臨人工智能的應(yīng)用困境。在這種背景下,超級模型生態(tài)系統(tǒng)應(yīng)運而生。在陶大程博士看來,超級深度學(xué)習(xí)模型是超級模型生態(tài)系統(tǒng)的核心,針對各個領(lǐng)域中存在的普遍問題,包括數(shù)據(jù)不足、數(shù)據(jù)孤島問題以及模型性能有限等問題,提出了有效的解決方案,包括利用超大規(guī)模無標(biāo)注數(shù)據(jù)進行自監(jiān)督預(yù)訓(xùn)練、知識蒸餾、遷移學(xué)習(xí)等,同時通過構(gòu)建完備的數(shù)學(xué)理論等模式,增強了模型的可解釋性,使人工智能算法做出的決策更易于評估。
目前,超級深度學(xué)習(xí)的發(fā)展趨勢主要體現(xiàn)在三個方面,包括訓(xùn)練模型的數(shù)據(jù)量日益增大、數(shù)據(jù)種類愈發(fā)豐富;模型規(guī)模增大、參數(shù)量以指數(shù)倍增加;計算資源更充足、模型訓(xùn)練的計算開銷大幅上升等。超級深度學(xué)習(xí)模型已在一些領(lǐng)域?qū)崿F(xiàn)了相應(yīng)的實踐,衍生了許多超級模型,在NLP領(lǐng)域如GPT-3,可以用于機器翻譯或智能問答等下游任務(wù);在多模態(tài)領(lǐng)域如DALL.E,可以用于視覺信息問答或圖像描述等下游任務(wù)。
陶大程博士認(rèn)為,超級深度學(xué)習(xí)將會引領(lǐng)產(chǎn)業(yè)的下一輪變革,它能有效地整合不同模態(tài)、不同來源、不同任務(wù)的數(shù)據(jù)和信息,進而滿足新的生產(chǎn)需求、新的應(yīng)用場景、新的商業(yè)模式,實現(xiàn)數(shù)字經(jīng)濟變革??梢灶A(yù)見的是,超級深度學(xué)習(xí)將會進一步促進智能制造、數(shù)智健康、智慧文旅等產(chǎn)業(yè)應(yīng)用落地,成為引領(lǐng)產(chǎn)業(yè)變革的重要力量。
比如,在數(shù)智健康領(lǐng)域,超級深度學(xué)習(xí)(超級GNN網(wǎng)絡(luò))可以表征海量分子結(jié)構(gòu),能夠加速新藥物研發(fā);還可以對全棧醫(yī)學(xué)影像表征,實現(xiàn)自動診斷、治療方案推薦、預(yù)后分析、復(fù)健助理、全周期呵護,更能對大量多模態(tài)公共服務(wù)數(shù)據(jù)聚合分析,全方位多角度實現(xiàn)公共健康監(jiān)控,助力人工智能在公共衛(wèi)生、疫情研判、情緒管理、地圖服務(wù)、基因檢測、藥物研發(fā)、互聯(lián)網(wǎng)醫(yī)院等多種具體場景中發(fā)揮重要的作用。
此外,針對制造產(chǎn)業(yè),超級深度學(xué)習(xí)可以實現(xiàn)全生命周期數(shù)字產(chǎn)業(yè)升級,提升效率、降低成本、敏捷制造,實現(xiàn)數(shù)智化的生產(chǎn)方式變革;在文化產(chǎn)業(yè)方面,超級深度學(xué)習(xí)可以促進國際文化產(chǎn)業(yè)變革,以多語言識別翻譯技術(shù)為基礎(chǔ),實現(xiàn)多文化的遺產(chǎn)保護與溝通交流,促進多個國家文化和商業(yè)的融合和發(fā)展。
陶大程博士表示,各個國家都在布局超級深度學(xué)習(xí),預(yù)計超級深度學(xué)習(xí)在未來5到10年將會對數(shù)智化社會供應(yīng)鏈體系起到關(guān)鍵性的支撐作用,從而賦能全產(chǎn)業(yè)鏈,其中包括智能零售、智能物流、智能供應(yīng)鏈等多個與人類需求密切相關(guān)的產(chǎn)業(yè)。京東探索研究院將會繼續(xù)在超級深度學(xué)習(xí)領(lǐng)域深耕,與行業(yè)共探產(chǎn)業(yè)升級新機遇,賦能產(chǎn)業(yè)數(shù)智化發(fā)展,為數(shù)字經(jīng)濟變革貢獻一份“超級”力量,最終做到理論有支撐,實際有應(yīng)用,技術(shù)有突破,讓超級模型生態(tài)系統(tǒng)最終“以人為本、為人類造福”。
好文章,需要你的鼓勵
浙江大學(xué)團隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團隊提出SIRI方法,通過"壓縮-擴張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實驗顯示,該方法在數(shù)學(xué)競賽題上將模型準(zhǔn)確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團隊開發(fā)出Rolling Forcing技術(shù),實現(xiàn)AI視頻實時流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓(xùn)練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團隊發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強化學(xué)習(xí)方法訓(xùn)練多個AI模型。實驗結(jié)果顯示,幾何訓(xùn)練在四個空間智能測試基準(zhǔn)上都帶來顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績。這項研究揭示了基礎(chǔ)幾何知識對培養(yǎng)AI空間智能的重要價值。