5月31日,由中國信息通信研究院、中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟主辦,北京九章云極科技有限公司聯(lián)合主辦的【創(chuàng)造智能·探索未知】杭州通用人工智能論壇-AI基礎軟件前沿技術(shù)分論壇在杭州成功舉辦。大會聚焦AI基礎軟件前沿技術(shù),挖掘人工智能基礎軟件+大模型為人工智能產(chǎn)業(yè)帶來的新增長,探討AI工程化在實際應用中所面臨的挑戰(zhàn)與機遇,切實推動我國AI基礎設施的融合發(fā)展。
大會同期舉行了中國信通院云大所和九章云極DataCanvas公司深化“高質(zhì)量AI基礎設施產(chǎn)業(yè)化”合作簽約儀式,雙方將在此前標準制定、評估評測、技術(shù)創(chuàng)新、產(chǎn)業(yè)研究等豐富合作的基礎上,發(fā)揮各自在AI基礎設施方向理論研究、技術(shù)創(chuàng)新和應用實踐的資源優(yōu)勢,打通AI基礎設施上下游生態(tài)鏈,共建開放、強大、靈活的AI基礎設施生態(tài)。中國信通院云大所副所長魏凱表示,九章云極DataCanvas公司和中國信通院云大所再度攜手,將聚焦大模型產(chǎn)業(yè)體系的搭建,加速大模型在金融、通信、交通等垂直行業(yè)的應用賦能。
圖:中國信通院云大所和九章云極DataCanvas公司
深化“高質(zhì)量AI基礎設施產(chǎn)業(yè)化”合作簽約儀式
大模型新時代開啟,AI基礎軟件核心地位凸顯
九章云極DataCanvas公司聯(lián)合創(chuàng)始人尚明棟在會上表示,未來大模型將呈現(xiàn)多樣化的發(fā)展路徑。“算力、數(shù)據(jù)和基礎軟件是影響大模型多樣化路徑發(fā)展的三大重要因素”,未來隨著算力性能逐漸同質(zhì)化和標準化,數(shù)據(jù)的差異性和企業(yè)需求的個性化逐漸加大,“AI基礎軟件”將成為模型訓練效率和算力使用效率的決定性因素。作為模型生態(tài)系統(tǒng)的中堅力量,AI基礎軟件將會成為大模型應用落地的最主要的效率支撐,并通過大模型+小模型的方式,形成模型訓練新范式。
圖:九章云極DataCanvas公司聯(lián)合創(chuàng)始人 尚明棟
“底層海量的多模態(tài)數(shù)據(jù)管理與上層更加精準的分析決策需求,將推動數(shù)智融合進入深水區(qū),為打造AI基礎軟件帶來新的機遇。”IDC中國人工智能和大數(shù)據(jù)高級分析師李浩然預判,對于客戶更加關(guān)注的開發(fā)服務平臺這一基礎軟件,科技企業(yè)應從全生命周期組件、低代碼/無代碼、自動機器學習、算法模型庫、可視化、部署運維六個方面進行建設,并注重與云服務、大數(shù)據(jù)組件的融合。
圖:IDC中國人工智能和大數(shù)據(jù)高級分析師 李浩然
技術(shù)應用是終極目標,千行百業(yè)提速AI規(guī)?;瘧?/strong>
對于IDC提出的AI基礎軟件六大方面的重點建設,九章云極DataCanvas公司副總裁周曉凌表示,公司長期布局這些重要技術(shù)能力,并通過一整套成體系的AI基礎軟件產(chǎn)品應用在金融、通信、交通、制造、能源等行業(yè)中。他表示,AI技術(shù)從分散模型到融合智能,再邁向通用人工智能的發(fā)展路程上極大的推動了政府和企業(yè)數(shù)智化浪潮;各行業(yè)有各自發(fā)展特點和轉(zhuǎn)型階段化差異,在云化、自動化、多模態(tài)、分布式等技術(shù)領(lǐng)域迭代升級AI平臺和AI應用能力方面存在可觀需求,從運營到經(jīng)營的AI應用發(fā)展空間依然巨大。
圖:九章云極DataCanvas公司副總裁 周曉凌
銀行業(yè)是數(shù)字化轉(zhuǎn)型、數(shù)智化升級的領(lǐng)先行業(yè),也是前沿技術(shù)大規(guī)??捎眯缘牡谝坏罊z驗。杭州銀行零售金融部技術(shù)專家趙晨光在會上發(fā)表《AI銀行的賣方與買方》主題演講,從AI技術(shù)的實際使用者角度出發(fā),分享前沿人工智能技術(shù)在銀行多個一線業(yè)務場景的應用洞察。他指出,以模型層、數(shù)據(jù)層和應用層構(gòu)建的AI金字塔為AI銀行提供了堅實基礎,未來將為銀行建立更智能、更高效、更精準的運營和服務能力。
圖:杭州銀行零售金融部技術(shù)專家 趙晨光
自主創(chuàng)新是源動力,開源開放是推動力
隨著數(shù)字化升級過程中所處的數(shù)據(jù)和需求環(huán)境越來越復雜,政府和企業(yè)對基于數(shù)據(jù)所作決策的科學性和效率提出了更高的要求。九章云極DataCanvas公司主任架構(gòu)師楊健稱,在此背景下,以決策智能為代表的人工智能技術(shù),已經(jīng)成為數(shù)智化升級中不可或缺的技術(shù)支撐。九章云極D-lab開源團隊多年來在以結(jié)構(gòu)化數(shù)據(jù)為基底的決策智能領(lǐng)域不斷探索和積累,累計發(fā)布了自動機器學習、深度學習、因果學習等相關(guān)技術(shù)的十余個開源項目,以求賦能政府和企業(yè)更好地實現(xiàn)以數(shù)據(jù)為驅(qū)動的自動化、智能化的決策。在AIGC的技術(shù)熱潮下,九章云極D-lab開源團隊正在開展交叉型研究,加速實現(xiàn)AI前沿技術(shù)的融合創(chuàng)新。
圖:九章云極DataCanvas公司主任架構(gòu)師 楊健
產(chǎn)業(yè)推動技術(shù),技術(shù)賦能產(chǎn)業(yè)。當前產(chǎn)業(yè)應用人工智能技術(shù)的規(guī)模越來越龐大、運作越來越復雜,中國信通院云大所工程師胡慧在會上表示,MLOps將解決AI工程化管理面臨的“難投產(chǎn)、難持續(xù)、難重現(xiàn)、難協(xié)作”等難題。MLOps不僅讓使用者大幅實現(xiàn)降本增效的AI應用,甚至出現(xiàn)MLOps工程師等新興熱門職業(yè),未來發(fā)展趨勢可見一斑。2023年,中國信通院發(fā)布國內(nèi)首份MLOps實踐指南,加上此前發(fā)布的兩項MLOps標準以及后續(xù)即將發(fā)布的大模型運營LMOps標準、模型運營標準等系列標準,中國信通院將為MLOps技術(shù)實現(xiàn)的行業(yè)標準化和應用規(guī)?;龀鲋菐熵暙I。
圖:中國信通院云大所工程師 胡慧
同日,中國信通院重磅發(fā)布了AI開發(fā)平臺系列標準,其中九章云極DataCanvas公司深度參與《人工智能開發(fā)平臺通用能力要求 第2部分:安全要求》《自動機器學習平臺技術(shù)要求和測試方法 第1部分:平臺功能》《面向結(jié)構(gòu)化數(shù)據(jù)的機器學習平臺技術(shù)要求和測試方法 第1部分:功能要求》《深度學習平臺技術(shù)要求和測試方法 第1部分:平臺功能》四項標準的制訂,并獲得核心參編單位授牌。
當前ChatGPT、AIGC掀起的浪潮在工業(yè)界產(chǎn)生巨大影響和實際需求,生成式AI的規(guī)模化出現(xiàn)有望使得2023年成為人工智能真正賦能千行百業(yè)的關(guān)鍵一年。IDC預測,到2026年,大規(guī)模基礎模型將成為大型供應商提供的標準行業(yè)實用程序。AI基礎軟件將在時代推動和產(chǎn)業(yè)帶動下,寫下自強自立科技創(chuàng)新的答案。
好文章,需要你的鼓勵
浙江大學團隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學、編程等任務上顯著提升推理準確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學研究團隊提出SIRI方法,通過"壓縮-擴張"交替訓練策略,成功解決了大型推理模型"話多且準確率低"的問題。實驗顯示,該方法在數(shù)學競賽題上將模型準確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓練提供了新思路。
南洋理工大學與騰訊聯(lián)合研究團隊開發(fā)出Rolling Forcing技術(shù),實現(xiàn)AI視頻實時流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學研究團隊發(fā)現(xiàn),通過讓AI模型學習解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強化學習方法訓練多個AI模型。實驗結(jié)果顯示,幾何訓練在四個空間智能測試基準上都帶來顯著提升,其中最佳模型達到49.6%準確率,超越此前最好成績。這項研究揭示了基礎幾何知識對培養(yǎng)AI空間智能的重要價值。