ChatGPT為代表的AIGC應(yīng)用,正在以“迅雷不及掩耳”之勢(shì),帶來人工智能的新想象,雖然數(shù)據(jù)庫(kù)不處于人工智能的最前沿,但作為人工智能的基礎(chǔ)設(shè)施,都在不由的為這個(gè)快速成長(zhǎng)的“孩子”做好準(zhǔn)備,呵護(hù)AIGC應(yīng)用的大批來襲。
人工智能會(huì)因?yàn)镃hatGPT的火爆而有大量的應(yīng)用涌現(xiàn)出來,數(shù)字化的進(jìn)程會(huì)因此提速,這些應(yīng)用的前提是,要有一個(gè)能為人工智能應(yīng)用普及化到來而準(zhǔn)備的數(shù)據(jù)庫(kù)。這樣的數(shù)據(jù)庫(kù)是否已經(jīng)有了?是否能在AIGC時(shí)代,不拖后腿,還能助一臂之力?
坐在記者面前的阿里云數(shù)據(jù)庫(kù)產(chǎn)品事業(yè)部負(fù)責(zé)人李飛飛,看起來胸有成竹。阿里云瑤池?cái)?shù)據(jù)庫(kù),將云原生數(shù)據(jù)庫(kù)PolarDB和云原生數(shù)據(jù)倉(cāng)庫(kù)AnalyticDB打通融合,形成了“云原生一體化”的HTAP解決方案。阿里云還推出了全新多模數(shù)據(jù)庫(kù)Lindorm AI 引擎,在數(shù)據(jù)庫(kù)內(nèi)集成人工智能能力,對(duì)非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行智能分析和處理,打造AIGC應(yīng)用的數(shù)據(jù)基礎(chǔ)設(shè)施。
圖:阿里云數(shù)據(jù)庫(kù)產(chǎn)品事業(yè)部負(fù)責(zé)人李飛飛
人工智能來襲?已經(jīng)準(zhǔn)備好
AIGC時(shí)代需要能夠支持海量、多模態(tài)數(shù)據(jù)的數(shù)據(jù)庫(kù),因?yàn)锳IGC一定是需要多模態(tài)的數(shù)據(jù)、不是單一形態(tài)的數(shù)據(jù),所以阿里云Lindorm數(shù)據(jù)庫(kù)就非常好地滿足了這個(gè)條件。
“這些應(yīng)用的背后,可能會(huì)是基于用戶自建的數(shù)據(jù)模型,也可能會(huì)是第三方的模型,這種多模態(tài)共存的方式,接下來會(huì)成為普遍存在的現(xiàn)象。支撐海量、多模態(tài)數(shù)據(jù)的低成本、高效率的存儲(chǔ)和處理,這是Lindorm這么多年打造的堅(jiān)實(shí)基礎(chǔ)。但光有這個(gè)不行,還需要能夠支持豐富、靈活、強(qiáng)大的模型導(dǎo)入和使用。”
如此眾多的模型,對(duì)數(shù)據(jù)庫(kù)來說,就好比是“人民戰(zhàn)爭(zhēng)的汪洋大海”。
李飛飛指出,阿里云應(yīng)對(duì)的辦法是——足夠的開放,用平臺(tái)化的方式去賦予數(shù)據(jù)庫(kù)更多的能力,去無縫導(dǎo)入第三方的模型。
把用戶導(dǎo)入的模型放在一個(gè)機(jī)密容器里,保證模型安全。導(dǎo)入模型以后,結(jié)合多模態(tài)數(shù)據(jù),這個(gè)想象空間天花板就非常高。有多模態(tài)數(shù)據(jù)高效低成本的存儲(chǔ),加上第三方靈活開放應(yīng)用的導(dǎo)入,任何事情幾乎都可以干,足以應(yīng)對(duì)AIGC的各種創(chuàng)新需求。
當(dāng)然,隨著AIGC的相關(guān)應(yīng)用推進(jìn),人工智能逐漸的平民化,數(shù)據(jù)庫(kù)在運(yùn)維管控層面,運(yùn)維和調(diào)優(yōu)會(huì)也變得更加智能化。“過去,MySQL和PostgreSQL都是幾百個(gè)參數(shù)起,每個(gè)參數(shù)對(duì)不同場(chǎng)景的影響都不一樣,依賴有經(jīng)驗(yàn)的DBA和開發(fā)者,就像老中醫(yī)開藥方一樣,有的藥方靈,有的藥方吃了就沒有用,”李飛飛說,“這些都會(huì)隨之變得平民化和智能化,運(yùn)維、高可用的檢測(cè)告警、異常的報(bào)警,等等這些都會(huì)智能化。其實(shí)這件事已經(jīng)發(fā)展幾年了,但是接下來的一到兩年會(huì)加速。”
如果人工智能加速變革,那么數(shù)字化必然也會(huì)加快腳步。
李飛飛指出,“過去一二十年,是信息時(shí)代的數(shù)字化,也就是說,是企業(yè)的信息化辦公實(shí)現(xiàn)了數(shù)字化。比如我們實(shí)現(xiàn)了無紙化辦公,比如說電話會(huì)議等等,這叫信息化的數(shù)字化。”
當(dāng)人工智能到了臨界點(diǎn),一定會(huì)催生兩個(gè)趨勢(shì):李飛飛說“一個(gè)叫物理世界數(shù)字化,還有一個(gè)是生物世界數(shù)字化,不管是在中國(guó)、美國(guó)還是歐洲,人類對(duì)長(zhǎng)生不老的追求是生生不息的,所以生物世界數(shù)字化一定會(huì)是非常熱的熱點(diǎn)。還有物理世界數(shù)字化,將整個(gè)物理世界數(shù)字化。”
我們正在經(jīng)歷、見證著這樣的變革。
數(shù)據(jù)中心的“四化”
數(shù)字化的變革時(shí)代,AIGC帶來的智能化浪潮,智能化的趨勢(shì)無可厚非,除了智能化,李飛飛提到了數(shù)據(jù)庫(kù)發(fā)展到現(xiàn)在的發(fā)展階段,云計(jì)算進(jìn)入深水區(qū),就像我們要進(jìn)行“四個(gè)現(xiàn)代化建設(shè)”一樣,數(shù)據(jù)庫(kù)也要實(shí)現(xiàn)“四化”,除了要發(fā)展智能化,數(shù)據(jù)庫(kù)還要大力發(fā)展云原生化、平臺(tái)化、一體化。
站在今天這個(gè)節(jié)點(diǎn),已經(jīng)沒有人再質(zhì)疑數(shù)據(jù)庫(kù)向云原生化演進(jìn)的必要性和現(xiàn)實(shí)的緊迫感,已經(jīng)有非常成熟的存儲(chǔ)計(jì)算分離技術(shù),存儲(chǔ)池化、計(jì)算池化帶來高可用、高可靠彈性,現(xiàn)在進(jìn)入云原生化。
李飛飛說:“隨著數(shù)據(jù)量爆發(fā)式的增長(zhǎng),數(shù)據(jù)形態(tài)的多元化,以及業(yè)務(wù)的多樣化,數(shù)字化深入帶來業(yè)務(wù)多樣化是必然的,傳統(tǒng)的單一的數(shù)據(jù)庫(kù)產(chǎn)品包打天下、解決所有問題的時(shí)代已經(jīng)結(jié)束了,一定是用一個(gè)平臺(tái)化的思維去構(gòu)建可能有多個(gè)引擎,基于平臺(tái)來提供一個(gè)一整套的、一站式的能力和解決方案,這就是數(shù)據(jù)庫(kù)的平臺(tái)化。”
以后的數(shù)據(jù)庫(kù),不用再去管是集中式數(shù)據(jù)庫(kù)、分布式數(shù)據(jù)庫(kù),這個(gè)問題應(yīng)該由數(shù)據(jù)庫(kù)本身來解決,什么時(shí)候用集中式架構(gòu),什么時(shí)候用分布式架構(gòu),是有業(yè)務(wù)需要來抉擇的,自動(dòng)在兩者之間切換,平滑地轉(zhuǎn)化,實(shí)現(xiàn)云原生分布式真正的一體化,集中分布一體化。
阿里云瑤池?cái)?shù)據(jù)庫(kù)卡位“云原生+一站式”的數(shù)據(jù)管理與服務(wù),正在用這樣的理念,做更符合這個(gè)時(shí)代的數(shù)據(jù)庫(kù)產(chǎn)品。
好文章,需要你的鼓勵(lì)
這項(xiàng)研究提出了"高效探測(cè)"方法,解決了掩碼圖像建模AI難以有效評(píng)估的問題。通過創(chuàng)新的多查詢交叉注意力機(jī)制,該方法在減少90%參數(shù)的同時(shí)實(shí)現(xiàn)10倍速度提升,在七個(gè)基準(zhǔn)測(cè)試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質(zhì)量與分類性能的強(qiáng)相關(guān)性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應(yīng)性。團(tuán)隊(duì)承諾開源全部代碼,推動(dòng)技術(shù)普及應(yīng)用。
伊利諾伊大學(xué)研究團(tuán)隊(duì)開發(fā)了CLAIMSPECT系統(tǒng),通過層次化分解復(fù)雜爭(zhēng)議、智能檢索相關(guān)文獻(xiàn)、多角度收集觀點(diǎn)的方法,將傳統(tǒng)的"真假"判斷轉(zhuǎn)變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動(dòng)構(gòu)建爭(zhēng)議話題的分析框架,識(shí)別不同觀點(diǎn)及其支撐證據(jù),為科學(xué)和政治爭(zhēng)議提供更全面客觀的分析,已在生物醫(yī)學(xué)和國(guó)際關(guān)系領(lǐng)域驗(yàn)證有效性。
清華大學(xué)研究團(tuán)隊(duì)首次提出情感認(rèn)知融合網(wǎng)絡(luò)(ECFN),讓AI能像人類一樣理解和表達(dá)情感。該系統(tǒng)通過多層次情感處理架構(gòu),在情感識(shí)別準(zhǔn)確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達(dá)自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實(shí)現(xiàn)了跨模態(tài)情感融合、動(dòng)態(tài)情感追蹤和個(gè)性化情感建模,為醫(yī)療、教育、客服等領(lǐng)域帶來革命性應(yīng)用前景。
哈佛大學(xué)研究團(tuán)隊(duì)通過創(chuàng)新的多智能體強(qiáng)化學(xué)習(xí)方法,讓AI在戰(zhàn)略游戲中學(xué)會(huì)復(fù)雜推理。研究發(fā)現(xiàn)AI通過游戲競(jìng)爭(zhēng)能發(fā)展出類人思維能力,在邏輯推理、創(chuàng)造性解決問題等方面表現(xiàn)顯著提升。這項(xiàng)突破性成果為未來AI在醫(yī)療、教育、城市管理等領(lǐng)域的應(yīng)用奠定基礎(chǔ),展現(xiàn)了通過模擬人類學(xué)習(xí)過程培養(yǎng)真正智能AI的新路徑。
琢磨技術(shù)發(fā)展史,關(guān)注算力產(chǎn)業(yè),關(guān)注數(shù)字經(jīng)濟(jì)。
參與編寫了《開源法則》(人民郵電出版社),《人類計(jì)算簡(jiǎn)史:從中國(guó)算盤到數(shù)字經(jīng)濟(jì)》(中共中央黨校出版社)。