以“智聯(lián)世界、元生無(wú)界”為主題的2022 世界人工智能大會(huì)(WAIC)于9月3日在上海圓滿落幕。WAIC作為全球人工智能的“科技風(fēng)向標(biāo)、應(yīng)用展示臺(tái)、產(chǎn)業(yè)加速器、治理議事廳”,是全球人工智能領(lǐng)域最具影響力的行業(yè)盛會(huì)。
「WAIC 2022 · AI 開發(fā)者日」作為WAIC大會(huì)最重要的技術(shù)論壇之一,以“AI開發(fā)者所真正關(guān)注的”為主題,匯聚了2021 年圖靈獎(jiǎng)得主、中外院士、世界級(jí)技術(shù)專家與科技企業(yè)創(chuàng)始人等 15 位學(xué)術(shù)界和產(chǎn)業(yè)界重磅嘉賓。九章云極DataCanvas公司開源技術(shù)副總裁、D-Lab主任楊健受邀出席論壇,并圍繞如何運(yùn)用完整的、綜合性、端到端因果學(xué)習(xí)工具包解決“因果發(fā)現(xiàn)、因果量識(shí)別、因果效應(yīng)估計(jì)、反事實(shí)推斷和策略學(xué)習(xí)”五大關(guān)鍵問(wèn)題,發(fā)表了《YLearn:因果學(xué)習(xí),從預(yù)測(cè)到?jīng)Q策》的精彩主題演講。
因果學(xué)習(xí):人工智能發(fā)展的技術(shù)突破口
隨著機(jī)器學(xué)習(xí)和深度學(xué)習(xí)在發(fā)展過(guò)程中遇到技術(shù)瓶頸,人工智能發(fā)展速度逐漸放緩,究其原因,一方面是機(jī)器學(xué)習(xí)存在著泛化能力較弱、解釋性不強(qiáng)、決策支持能力不足的關(guān)鍵性問(wèn)題;另一方面政府和企業(yè)提出“智能決策”的需求,即以數(shù)據(jù)驅(qū)動(dòng)的方式實(shí)現(xiàn)自動(dòng)化決策來(lái)提高整體運(yùn)營(yíng)效率。
隨著機(jī)器學(xué)習(xí)建模越來(lái)越多的應(yīng)用,人工智能技術(shù)從預(yù)測(cè)性分析向指導(dǎo)性分析升級(jí)轉(zhuǎn)移,自動(dòng)化“決策”成為政府和企業(yè)在數(shù)智化時(shí)代的核心需求,決策者需要一個(gè)可理解的AI決策邏輯以及具有可信度、可解釋的決策結(jié)果。而當(dāng)前機(jī)器學(xué)習(xí)主要是完成預(yù)測(cè)性任務(wù),難以滿足政府和企業(yè)自動(dòng)化決策的需求。
Gartner發(fā)布的《2022年新興技術(shù)成熟度曲線》中提到,因果人工智能是加速AI自動(dòng)化的關(guān)鍵技術(shù)之一。因果學(xué)習(xí)成為補(bǔ)充機(jī)器學(xué)習(xí)問(wèn)題的關(guān)鍵技術(shù),人工智能發(fā)展極具潛力的技術(shù)突破口,引發(fā)業(yè)界的廣泛關(guān)注和熱點(diǎn)研究。
YLearn:因果學(xué)習(xí),從預(yù)測(cè)到?jīng)Q策
2019年圖靈獎(jiǎng)得主Yoshua Bengio先生曾提到,“因果關(guān)系對(duì)于機(jī)器學(xué)習(xí)的下一步進(jìn)展非常重要”。從2019年開始,因果學(xué)習(xí)的學(xué)術(shù)研究新成果不斷出現(xiàn),發(fā)表的相關(guān)論文數(shù)量每年都在翻倍增長(zhǎng)。目前,從國(guó)內(nèi)外關(guān)于因果學(xué)習(xí)的研發(fā)來(lái)看,出現(xiàn)了很多因果學(xué)習(xí)的工具,例如DoWhy、圍繞解決因果效應(yīng)評(píng)估類問(wèn)題的EconML,用來(lái)完成uplift建模的CausalML以及專注解決因果發(fā)現(xiàn)問(wèn)題的Causal Learn。但這些工具都只能解決因果學(xué)習(xí)中的部分問(wèn)題,又因?yàn)椴煌墓ぞ咚蕾嚨睦碚摽蚣芎徒Y(jié)構(gòu)體系不同,導(dǎo)致工具包之間也難以融合使用。因果學(xué)習(xí)領(lǐng)域則是缺少系統(tǒng)、完整的、綜合性、端到端的工具包。
九章云極DataCanvas公司自主研發(fā)的一站式處理因果學(xué)習(xí)完整流程的開源算法工具包YLearn,是目前首款端到端、較完整、較系統(tǒng)的因果學(xué)習(xí)算法工具包,率先解決了因果學(xué)習(xí)中“因果發(fā)現(xiàn)、因果量識(shí)別、因果效應(yīng)估計(jì)、反事實(shí)推斷和策略學(xué)習(xí)”五大關(guān)鍵問(wèn)題,降低“決策者”使用門檻,不斷滿足政府和企業(yè)自動(dòng)化“決策”的需求。
GitHub 地址:https://github.com/DataCanvasIO/YLearn
YLearn由CausalDiscovery、CausalModel、EstimatorModel、Policy、Interpreter、Whatif等部件組成,各部件支持獨(dú)立使用,也支持統(tǒng)一封裝。為幫助用戶更直觀地理解數(shù)據(jù)、調(diào)整策略,YLearn提供了因果圖、因果效應(yīng)解釋、決策樹等重要模塊的可視化輸出。
與國(guó)內(nèi)外因果學(xué)習(xí)工具相比,九章云極DataCanvas公司的YLearn具有一站式、新而全、用途廣的特點(diǎn)。
結(jié)合政府和企業(yè)在決策任務(wù)上的需求,YLearn將與九章云極DataCanvas公司的自動(dòng)機(jī)器學(xué)習(xí)平臺(tái)相結(jié)合,通過(guò)與AutoML技術(shù)的融合,提高機(jī)器學(xué)習(xí)的魯棒性、泛化能力和解釋性,實(shí)現(xiàn)因果學(xué)習(xí)的自動(dòng)調(diào)參和優(yōu)化,進(jìn)一步降低使用門檻。同時(shí),YLearn解決了市場(chǎng)上缺失功能強(qiáng)大且完整的因果學(xué)習(xí)工具包這一“卡脖子”難題,將技術(shù)回歸業(yè)務(wù),支持決策類業(yè)務(wù)場(chǎng)景,為客戶提供多種決策方案。
因果學(xué)習(xí)助力人工智能邁向新階段
人工智能技術(shù)作為新一輪科技革命和產(chǎn)業(yè)變革的核心力量,正處于從預(yù)測(cè)邁向決策的新發(fā)展階段。因果學(xué)習(xí)在這一階段發(fā)揮著重要作用,彌補(bǔ)機(jī)器學(xué)習(xí)的理論缺陷,逐步解決從“是什么”到“為什么”的問(wèn)題,從政府和企業(yè)的需求出發(fā),提升“AI決策”的可信度和可用度,將AI能力更進(jìn)一步交為業(yè)務(wù)所用。
為了更好的帶動(dòng)國(guó)內(nèi)因果學(xué)習(xí)領(lǐng)域的發(fā)展,推動(dòng)因果學(xué)習(xí)的多元化發(fā)展,九章云極DataCanvas公司聯(lián)合世界人工智能大會(huì)組委會(huì)辦公室、機(jī)器之心、上海市人工智能行業(yè)協(xié)會(huì)、天池共同舉辦黑客松「因果學(xué)習(xí)和決策優(yōu)化挑戰(zhàn)賽」,為全球各路開發(fā)者精英們提供同臺(tái)競(jìng)技的平臺(tái)。挑戰(zhàn)賽以“如何優(yōu)化干預(yù)方案能使因果效應(yīng)最大”為主題,將因果學(xué)習(xí)中的普適性問(wèn)題具化,旨在考察選手使用因果推斷在決策方案制定問(wèn)題上的估計(jì)能力。
作為業(yè)界首個(gè)面向「因果推斷全流程」的賽事,收到來(lái)自全國(guó)各地包括運(yùn)用人工智能相關(guān)技術(shù)賦能數(shù)智化升級(jí)的企業(yè)、結(jié)合人工智能技術(shù)進(jìn)行創(chuàng)新探索的科研單位、高等院校的團(tuán)隊(duì)及專業(yè)開發(fā)者等近四千支隊(duì)伍報(bào)名參賽。參賽隊(duì)伍經(jīng)過(guò)23天的同臺(tái)競(jìng)技,不斷探索因果學(xué)習(xí)領(lǐng)域的技術(shù)高峰,刷新成績(jī)紀(jì)錄,角逐出TOP18具有雄厚的AI技術(shù)實(shí)力以及富有創(chuàng)造力的優(yōu)勝隊(duì)伍。
未來(lái),九章云極DataCanvas公司將不斷創(chuàng)新研發(fā)開源工具,將政府和企業(yè)的業(yè)務(wù)需求與技術(shù)實(shí)踐相結(jié)合,助力政府和企業(yè)數(shù)智化升級(jí),推動(dòng)人工智能向新階段。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專家搜索方法,讓AI能根據(jù)不同問(wèn)題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問(wèn)題偏愛(ài)不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過(guò)"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問(wèn)題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過(guò)滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問(wèn)題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過(guò)讓AI模型學(xué)習(xí)解決幾何問(wèn)題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來(lái)顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。