av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

微信掃一掃,關(guān)注公眾號

  • 科技行者

  • 算力行者

見證連接與計(jì)算的「力量」

首頁 阿里云李飛飛:將大模型,裝進(jìn)數(shù)據(jù)庫里

阿里云李飛飛:將大模型,裝進(jìn)數(shù)據(jù)庫里

2025-02-28 11:01
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2025-02-28 11:01 ? 金旺

阿里云李飛飛:將大模型,裝進(jìn)數(shù)據(jù)庫里

作者 | 金旺

來源 | 科技行者

預(yù)計(jì)2027年,云數(shù)據(jù)庫將占據(jù)整個數(shù)據(jù)庫市場份額的70%。

這是Gartner在2019年給出的預(yù)測數(shù)據(jù),從Gartner最新的統(tǒng)計(jì)數(shù)據(jù)來看,截至2023年年底,云數(shù)據(jù)庫在整個數(shù)據(jù)庫市場中占比已經(jīng)高達(dá)61%,這時(shí)的云數(shù)據(jù)庫已經(jīng)成為大勢所趨。

與此同時(shí),人工智能技術(shù)的驟變,開始影響數(shù)據(jù)庫產(chǎn)業(yè),數(shù)據(jù)庫再次成為人工智能從技術(shù)到商業(yè)化的一個關(guān)鍵平臺。

Gartner高級研究總監(jiān)顧星宇指出,“到2028年,80%的生成式AI業(yè)務(wù)應(yīng)用將在企業(yè)現(xiàn)有的數(shù)據(jù)管理平臺上開發(fā),從而將實(shí)施復(fù)雜性和交付時(shí)間縮短50%。”

作為云數(shù)據(jù)庫的堅(jiān)實(shí)擁躉,阿里云智能集團(tuán)副總裁、阿里云智能數(shù)據(jù)庫產(chǎn)品事業(yè)部負(fù)責(zé)人李飛飛則斷言,“第一波人工智能浪潮是由Native AI群體掀起,但在人工智能進(jìn)入下半場后,本質(zhì)上已經(jīng)回歸到系統(tǒng)領(lǐng)域,回到了工程化問題上。”

也是在這時(shí),阿里云PolarDB看到了他們的機(jī)會,進(jìn)行了又一次產(chǎn)品迭代,也面向人工智能推出了PolarDB-Model as an Operator。

01 千機(jī)集群打出一個世界紀(jì)錄

2月26日,在2025阿里云PolarDB開發(fā)者大會上,阿里云官宣,PolarDB登頂全球數(shù)據(jù)庫性能及性價(jià)比排行榜, 并刷新了TPC-C性能和性價(jià)比雙榜的世界紀(jì)錄。

TPC-C測試,是由國際數(shù)據(jù)庫事務(wù)處理性能委員會(TPC)組織制定的模擬電商訂單服務(wù)場景,針對數(shù)據(jù)庫在線事務(wù)處理(OLTP)系統(tǒng)性能的一場長達(dá)40小時(shí)的極限基準(zhǔn)測試。

其中,數(shù)據(jù)庫系統(tǒng)需要在極限壓力下運(yùn)行8小時(shí)以上,在這期間,tpmC的波動率不能超過2%,還要保證數(shù)據(jù)正確率為100%,與此同時(shí),測試模型還會模擬各種硬件故障情況,參與測試的產(chǎn)品需要確保數(shù)據(jù)不丟失,并能快速恢復(fù)正常性能。

阿里云李飛飛:將大模型,裝進(jìn)數(shù)據(jù)庫里

這一基準(zhǔn)測試歷來也有著數(shù)據(jù)庫領(lǐng)域“奧林匹克”之稱。

正是在這樣一個極為嚴(yán)苛的數(shù)據(jù)庫測試中,阿里云PolarDB團(tuán)隊(duì)在2025年1月27日用1170臺物理機(jī)搭建了一個PolarDB集群,這個集群擁有2340個PolarDB主節(jié)點(diǎn)和2340個PolarDB從節(jié)點(diǎn),最終支撐1.6億家商店、16億用戶跑出了每分鐘20.55億筆交易(tpmC),刷新了TPC-C性能排行榜,打破了世界紀(jì)錄。

在這次TPC-C測試過程中,阿里云PolarDB數(shù)據(jù)庫還刷新了另外三項(xiàng)成績:

第一,使用物理機(jī)數(shù)量相較于此前紀(jì)錄保持者(1650臺)少了三分之一;

第二,單虛擬核性能達(dá)到了18297tpmC,是此前紀(jì)錄保持者的1.8倍;

第三,單位成本0.8元(price/tpmC),是此前紀(jì)錄保持者的60%。

阿里云李飛飛:將大模型,裝進(jìn)數(shù)據(jù)庫里

為什么PolarDB能在這場全行業(yè)矚目的基準(zhǔn)測試中打出這樣的成績?

這其中的原因之一是PolarDB集群網(wǎng)絡(luò)部署從去年的25G Lossless RDMA升級到了100G Lossy高性能RDMA網(wǎng)絡(luò),基于這樣的RDMA網(wǎng)絡(luò),PolarDB團(tuán)隊(duì)可以搭建連接數(shù)千臺,乃至上萬臺物理機(jī)的集群,并實(shí)現(xiàn)了高性能事務(wù)一致性執(zhí)行能力,多節(jié)點(diǎn)復(fù)制能力也由此提升了1倍。

具體到TPC-C測試中,這樣的高性能RDMA網(wǎng)絡(luò)帶來的一個變化是,PolarDB的上千臺物理機(jī)集群跨機(jī)業(yè)務(wù)對性能的影響得以被控制到7%以內(nèi)。

據(jù)阿里云智能集團(tuán)數(shù)據(jù)庫產(chǎn)品事業(yè)部PolarDB MySQL及PostgreSQL負(fù)責(zé)人楊辛軍在發(fā)布會上透露,“PolarDB這次打榜最終達(dá)到的20.55億tpmC成績并不是我們的極限,實(shí)際上,PolarDB可以跑得更好。”

阿里云李飛飛:將大模型,裝進(jìn)數(shù)據(jù)庫里

TPC-C是一個相當(dāng)真實(shí)的情景模擬,它會模擬用戶在電商進(jìn)行購買操作,這其中,每個商店能夠支持的客戶人數(shù)和交易速度都有限制,每個商店僅支持10個虛擬用戶同時(shí)進(jìn)行交易,商品數(shù)量也有一定限制,因此,最終交易性能與商品數(shù)量相關(guān)。

據(jù)楊辛軍介紹,“我們打榜后發(fā)現(xiàn),我們的限制并不是單機(jī)性能,而是存儲,由于我們當(dāng)時(shí)并沒有購買足夠的存儲資源,如果當(dāng)時(shí)我們購買了更更存儲資源,我們打出的成績理論上可以再提升,在相同物理機(jī)和節(jié)點(diǎn)數(shù)量下一直可以提升到28億tpmC。”

而之所以會有這次打榜,楊辛軍告訴我們,“這其實(shí)相當(dāng)于是一次檢閱,在PolarDB的新升級的硬件上線給所有用戶用之前進(jìn)行的一次檢閱,而這些硬件在打榜后,最終將會進(jìn)入商用市場,為用戶提供服務(wù)。”

一并在這次發(fā)布會上發(fā)布的,不只有隨PolarDB打破世界紀(jì)錄并將進(jìn)入市場的數(shù)據(jù)庫集群,還有阿里云第一個CXL Switch內(nèi)存池?cái)?shù)據(jù)庫。

02 打破“內(nèi)存墻”,CXL-Powered PolarDB亮相

作為新一代云原生數(shù)據(jù)庫,PolarDB的獨(dú)特之處在哪里?

李飛飛給出的解釋是:

“PolarDB通過三層解耦架構(gòu),在數(shù)據(jù)中心規(guī)模上實(shí)現(xiàn)了馮諾依曼架構(gòu),將擁有成千上萬臺服務(wù)器的數(shù)據(jù)中心變成一臺實(shí)現(xiàn)了計(jì)算、內(nèi)存、存儲三層解構(gòu)的云原生計(jì)算機(jī)。”

基于這樣的技術(shù)架構(gòu),PolarDB此次正式對外預(yù)發(fā)布了第一臺基于CXL Switch的數(shù)據(jù)庫專屬機(jī)型。

阿里云李飛飛:將大模型,裝進(jìn)數(shù)據(jù)庫里

什么是CXL?

CXL是基于PCIe一種新型高速互聯(lián)技術(shù),旨在解決計(jì)算系統(tǒng)中數(shù)據(jù)處理延遲、速度減慢和可擴(kuò)展性問題,提供更高的數(shù)據(jù)吞吐量和更低的延時(shí)的接口標(biāo)準(zhǔn),可以連接CPU、GPU、DRAM、存儲設(shè)備,解決CPU與設(shè)備、設(shè)備與設(shè)備之間的內(nèi)存鴻溝。

在當(dāng)下大模型時(shí)代,內(nèi)存發(fā)展與算力增長速度的不匹配導(dǎo)致了“內(nèi)存墻”問題的出現(xiàn),基于CXL Switch的數(shù)據(jù)庫專屬機(jī)型在硬件上契合了PolarDB的三層解耦架構(gòu),并為解決大模型的“內(nèi)存墻”問題提供了解決思路。

據(jù)楊辛軍介紹,“以配備單根256GB內(nèi)存、連接7臺物理機(jī)的CXL Switch內(nèi)存池的PolarDB數(shù)據(jù)庫為例,一個機(jī)柜可以支持16TB的內(nèi)存容量,這時(shí),每臺物理機(jī)都可以使用這16TB內(nèi)存容量。”

阿里云李飛飛:將大模型,裝進(jìn)數(shù)據(jù)庫里

PolarDB通過使用CXL技術(shù)構(gòu)建三層分離數(shù)據(jù)庫,部署在遠(yuǎn)端的數(shù)據(jù)庫并沒有因?yàn)榭鐧C(jī)和跨地域?qū)е聰?shù)據(jù)庫性能下降,反而擴(kuò)展性提升了3倍,而通過遠(yuǎn)端數(shù)據(jù)庫替代本地?cái)?shù)據(jù)庫的形式,數(shù)據(jù)庫成本也得以下降了50%。

對于基于CXL Switch內(nèi)存池化的機(jī)型,李飛飛在接受媒體采訪時(shí)特別強(qiáng)調(diào),“我們并不是要做線下市場、做一體機(jī),這些機(jī)型最終都將會用到公共云上的PolarDB專屬資源池構(gòu)建中。”

PolarDB在Kernel層有各類壓縮算法,但李飛飛認(rèn)為,“僅做這些還不夠,PolarDB還需要在磁盤SSD的控制上做優(yōu)化,由此才能真正做到軟硬件協(xié)同創(chuàng)新。”

李飛飛指出,“云原生是必然趨勢,任何系統(tǒng)向前演進(jìn)僅做軟件創(chuàng)新是沒有未來的,一定要做軟硬件協(xié)同創(chuàng)新,DeepSeek證明了這一點(diǎn),PolarDB的突破同樣證明了這一點(diǎn)。”

至于此次在發(fā)布會上亮相的CXL-Powered PolarDB,楊辛軍在發(fā)布會也強(qiáng)調(diào),“這次基于CXL Switch內(nèi)存池化的PolarDB數(shù)據(jù)庫只是預(yù)發(fā)布,還沒有正式應(yīng)用到生產(chǎn)環(huán)境中。”

據(jù)悉,接下來PolarDB團(tuán)隊(duì)還將會在GPU+CPU異構(gòu)資源池上繼續(xù)優(yōu)化,滿足大模型對于異構(gòu)算力的應(yīng)用需求。

03 將大模型,裝進(jìn)PolarDB里

隨著DeepSeek在年初的開源,大模型正式進(jìn)入到了人工智能應(yīng)用爆發(fā)的元年。

誰能抓住這波人工智能應(yīng)用爆發(fā)的機(jī)會?

李飛飛認(rèn)為,“只有那些將大模型更好地與現(xiàn)有業(yè)務(wù)流程、數(shù)據(jù)流程結(jié)合,把成本降低、把資源優(yōu)勢打滿、讓數(shù)據(jù)真正發(fā)揮出價(jià)值的企業(yè),才能抓住這波機(jī)會。”

自2025年,以大模型為代表的人工智能時(shí)代被劃分為上下半場,上半場的競爭焦點(diǎn)是大模型的預(yù)訓(xùn)練,接下來大模型的預(yù)訓(xùn)練將會呈現(xiàn)出在線化、集中式的趨勢,而下半場本質(zhì)上又回到了傳統(tǒng)的系統(tǒng)和工程領(lǐng)域。

對于數(shù)據(jù)庫廠商而言,“模型即算子”已經(jīng)不再是一個“if”,而成了正在發(fā)生的事,也是在此次發(fā)布會上,PolarDB-Model as an Operator正式對外發(fā)布。

阿里云李飛飛:將大模型,裝進(jìn)數(shù)據(jù)庫里

李飛飛在發(fā)布會上介紹稱,“我們現(xiàn)在已經(jīng)可以把包括大模型在內(nèi)的各種各樣的模型作為算子內(nèi)嵌到數(shù)據(jù)庫引擎中,這樣為我們從數(shù)據(jù)中發(fā)現(xiàn)價(jià)值帶來了便利,為傳統(tǒng)OLAP的意義和方向會因此得到極大的拓展。”

這是李飛飛堅(jiān)定看好的發(fā)展趨勢。

為此,PolarDB團(tuán)隊(duì)將包括通義千問、DeepSeek等在內(nèi)的大模型作為算子內(nèi)嵌到了PolarDB數(shù)據(jù)庫中,利用PolarDB的三層解耦架構(gòu)和多主多寫能力彈性伸縮出人工智能推理節(jié)點(diǎn)。

這一波操作下來,極大地簡化了企業(yè)部署和應(yīng)用大模型過程中數(shù)據(jù)管道,企業(yè)不再需要將數(shù)據(jù)轉(zhuǎn)移到專有推理平臺上,將推理結(jié)果拿回來再進(jìn)行業(yè)務(wù)判斷。

實(shí)際上,PolarDB-Model as an Operator不僅僅是將大模型內(nèi)嵌到了PolarDB數(shù)據(jù)庫中,還針對大模型做了一系列優(yōu)化。

阿里云李飛飛:將大模型,裝進(jìn)數(shù)據(jù)庫里

楊辛軍告訴我們,“由于PolarDB特有的三層解耦架構(gòu)可以實(shí)現(xiàn)內(nèi)存的解耦,部署在PolarDB中的大模型就可以將CPU和GPU的資源充分利用起來,在同等GPU算力條件下,部署在PolarDB上的DeepSeek并行用戶訪問量可以提升35倍。”

與此同時(shí),將大模型裝進(jìn)數(shù)據(jù)庫也避免了企業(yè)私有數(shù)據(jù)出域,為企業(yè)數(shù)據(jù)安全和大模型應(yīng)用提供了一個新思路。

分享至
0贊

好文章,需要你的鼓勵

金旺

Wille
關(guān)注智造、硬件、機(jī)器人。
推薦文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-