2024年對于OceanBase來說是尤為關鍵的一年。
一方面,這一年,螞蟻集團官宣OceanBase正式獨立運營;
更重要的是,不少頭部企業(yè)核心業(yè)務開始正式轉向OceanBase分布式數(shù)據(jù)庫,一些企業(yè)甚至明確提出了要“All in OceanBase”。
OceanBase CEO楊冰稱,“分布式數(shù)據(jù)庫如今已經(jīng)開始成為現(xiàn)代數(shù)據(jù)庫的標準架構,與此同時,一體化數(shù)據(jù)庫也逐漸成熟、走向商用。”
2024年,在這兩大主流趨勢推動下,OceanBase有了更大的作戰(zhàn)空間。
當然,他們也有了新的思考和目標。
數(shù)據(jù)庫的艱難十年
2014年11月,在AWS re:Invent大會上,亞馬遜官宣發(fā)布了Amazon Aurora,Aurora的發(fā)布,拉開了自研數(shù)據(jù)庫的帷幕。
當時中國數(shù)據(jù)庫商用市場仍處于初期階段,雖然Oracle在1989年就已經(jīng)進入中國市場,并帶動了鐵路、金融、運營商等大型國央企的信息化升級,但由于高昂的售價和運維費用,每年這些企業(yè)都需要巨額費用支出,自研數(shù)據(jù)庫在這時的中國呼之欲出。
2010年,44歲的陽振坤加入阿里,帶隊開啟了阿里的數(shù)據(jù)庫自研之路,更準確的說法是,陽振坤這一年在阿里內(nèi)部開啟了分布式數(shù)據(jù)庫OceanBase的自研之路。
這一年,關系型數(shù)據(jù)庫仍是主流,但行業(yè)中已經(jīng)有了NoSQL有可能取代關系型數(shù)據(jù)庫的熱議,而分布式數(shù)據(jù)庫還只是一個不被看好的小眾路線。
楊冰回憶稱,“十幾年前,由于分布式數(shù)據(jù)庫的技術還很不成熟,就連如何用中間件做分庫、分表都還是一件很復雜的事,因而算是一條很小眾的技術路線。”
不過,這還不是阿里自研數(shù)據(jù)庫之初遇到最大的難題,他們當時遇到最大的難題其實是人才短缺。
當時雖然一些IT技術人員已經(jīng)開始使用數(shù)據(jù)庫,但由于這項技術復雜度高,在國內(nèi)起步較晚,真要做數(shù)據(jù)庫自研,很難招到優(yōu)秀的數(shù)據(jù)庫人才。
這也是OceanBase后來每年召開開發(fā)者大會,在開發(fā)者社群上不斷投入,甚至直接與高校合作,聯(lián)合高校培養(yǎng)人才的原因之一。
當然,這些都是后話,在阿里決定自研數(shù)據(jù)庫時,擺在他們面前的第一個問題是——選擇開源路線,還是純自研路線?
選擇開源路線的話,相當于站在了巨人的肩膀上,不用經(jīng)歷從0到1的冷板凳和痛苦閉關,但問題在于,當時國內(nèi)企業(yè)在實際應用場景中,遇到的很多問題通過開源數(shù)據(jù)庫已經(jīng)無法從根本上得到解決。
例如,隨著企業(yè)對于海量數(shù)據(jù)、高速寫入的需求越來越大,LSM-Tree數(shù)據(jù)結構剛好適合這樣的需求。
然而,在傳統(tǒng)的數(shù)據(jù)庫架構中,基于LSM-Tree構建索引、進行數(shù)據(jù)查詢這樣最基本的需求并不友好。
選擇純自研路線,可以從底層架構上打破傳統(tǒng)規(guī)則,可以設計一個全新的、更適合應用需求的架構,這樣自然也更容易解決數(shù)據(jù)庫行業(yè)當時看似沖突的業(yè)務需求。
但這樣從無到有根技術的突破,是一個痛苦而又煎熬的過程。
當時的OceanBase團隊在二者之間,最終還是選擇了純自研這條“不歸路”。
就是這樣一條純自研、當時看起來又很小眾的技術路線,OceanBase堅持了10年。
楊冰說,“目前,OceanBase已經(jīng)做到了100%根自研。”
“從第一行代碼寫起,我們知道每一行代碼是如何實現(xiàn)的,網(wǎng)絡存儲CPU是如何調(diào)度的,所以我們結合各個專有云、公有云場景做了大量的技術嘗試和自研創(chuàng)新。”
2014年,原生分布式數(shù)據(jù)庫OceanBase取代了原本的集中式數(shù)據(jù)庫,支撐起了支付寶核心交易系統(tǒng),并開始承擔“雙十一”10%的交易流量;
2016年,OceanBase 1.0版本正式發(fā)布,這一年“雙十一”期間支付寶所有支付數(shù)據(jù)鏈和交易數(shù)據(jù)鏈全部運行在了OceanBase上,在阿里內(nèi)部率先實現(xiàn)了核心業(yè)務替代;
2021年,OceanBase發(fā)布HTAP混合引擎,并正式對外開源,客戶數(shù)量超過400家,開始真正成為通用型企業(yè)級分布式數(shù)據(jù)庫。
“All in OceanBase”
當楊冰在2024年站到OceanBase數(shù)據(jù)庫城市行|粵港澳的講臺上時,分布式數(shù)據(jù)庫已經(jīng)不再是十年前那個小眾的技術路線,真正成了數(shù)據(jù)庫領域一條主流技術路線。
來自IDC的統(tǒng)計數(shù)據(jù)顯示,到2022年,中國分布式事務數(shù)據(jù)庫在關系型數(shù)據(jù)庫中的占比已經(jīng)提升到了16.2%。
此外,據(jù)IDC預測,到2027年,中國分布式事務數(shù)據(jù)庫總體市場年復合增長率將達到28.5%,其中在公有云上增長率將達到32.8%。
這樣的增長速度,已經(jīng)超過了公有云本身的增速。
而楊冰在和一些機構分析師交流中也獲悉,以現(xiàn)有的增速來看,到2025年,國內(nèi)使用分布式數(shù)據(jù)庫的企業(yè)和場景占比預計將會突破50%。
今天,用不用分布式數(shù)據(jù)庫已經(jīng)不再是一個問題,作為國內(nèi)最具代表性的分布式數(shù)據(jù)庫,OceanBase如今也已經(jīng)有了超千家客戶,諸如中國移動、交通銀行、理想汽車等一些頭部企業(yè)經(jīng)過測試和準備,核心業(yè)務正在轉向OceanBase分布式數(shù)據(jù)庫。
交通銀行貸記卡系統(tǒng)的分布式改造,是其向全面分布式轉型的關鍵一步,其中就包括在底層使用OceanBase。
通過使用OceanBase,大大提升交通銀行數(shù)據(jù)處理效率和系統(tǒng)可用性,金融TPS(每秒處理事務數(shù))提升6倍、跑批效率提升超過7倍。
據(jù)楊冰在大會上公布的數(shù)據(jù)顯示,如今的OceanBase已經(jīng)服務了中國70%頭部銀行、75%頭部證券、45%頭部基金,以及20%省移動運營商和25%省人社部門。
在這個過程中,分布式數(shù)據(jù)庫逐漸成為現(xiàn)代數(shù)據(jù)庫的標準配置,越來越多企業(yè)開始選擇分布式數(shù)據(jù)庫,開始“All in OceanBase”。
“一體化”新趨勢
2023年11月16日,在OceanBase2023年度發(fā)布會上,OceanBase 4.2.1 LTS正式發(fā)布。
OceanBase 4.2.1 LTS獨特之處在于,這是OceanBase首個長期支持的一體化數(shù)據(jù)庫版本。
什么是分布式一體化數(shù)據(jù)庫?
在傳統(tǒng)概念中,與分布式架構相對應的是集中式架構,然而,企業(yè)往往是線性發(fā)展路線,在不同階段,對兩類數(shù)據(jù)庫可能存在著不同的需求,這就意味著,對于數(shù)據(jù)庫供應商而言,難以從工程和產(chǎn)品設計上將兩類產(chǎn)品完全切分開來。
“分布式和集中式本身不是對立的,”這是楊冰和OceanBase團隊這幾年做數(shù)據(jù)庫產(chǎn)品研發(fā)和工程實踐的切身體會。
這也就有了OceanBase將分布式和單機數(shù)據(jù)庫融合在一起的設計思路來源。
vivo是受益于這類數(shù)據(jù)庫產(chǎn)品的企業(yè)之一,vivo體系與流程部IT部DBA組總監(jiān)鄢楠指出,“vivo現(xiàn)在內(nèi)部業(yè)務系統(tǒng)已經(jīng)從十幾個數(shù)據(jù)庫實例發(fā)展到了數(shù)千個,其中既有使用商業(yè)數(shù)據(jù)庫的業(yè)務系統(tǒng),也有使用開源數(shù)據(jù)庫的業(yè)務系統(tǒng),基于降本增效考慮,在2023年開始基于OceanBase自建數(shù)據(jù)庫。”
在這一過程中,vivo使用的正是OceanBase 4.2.1版本,也就是OceanBase的單機分布式一體化產(chǎn)品。
基于這一版本,在半年時間里,OceanBase已經(jīng)在vivo內(nèi)部15個生產(chǎn)業(yè)務系統(tǒng)上線應用,在vivo原有的MySQL分庫分表架構替換為OceanBase后,總資源占用節(jié)省了80%,極大地降低了vivo團隊的運維成本。
一體化是楊冰篤定的數(shù)據(jù)庫技術趨勢,也是貫穿OceanBase過往十四年研發(fā)歷路中始終如一的方向。
在過往十四年里,OceanBase團隊已經(jīng)基于自家數(shù)據(jù)庫實現(xiàn)了工程一體化、TP/AP一體化、云上云下一體化、單機分布式一體化,這四個“一體化”打造出的數(shù)據(jù)庫,也是楊冰認為接下來新一代數(shù)據(jù)庫該有的樣子。
就在前不久,螞蟻集團官宣,旗下螞蟻國際、OceanBase和螞蟻數(shù)科已成立董事會,開始獨立面向市場。
與此同時,OceanBase在3月20日的大會上官宣升級2022年發(fā)布的珊瑚計劃,提高專有云伙伴簽約占比至70%,伙伴獨立交付占比提高到30%。
OceanBase分布式數(shù)據(jù)庫規(guī)?;逃寐涞毓?jié)奏由此也得以再次加快。
作為自2020年開始獨立商業(yè)化的技術團隊,2024年,當OceanBase正式獨立運營、加快進入市場時,一個數(shù)據(jù)庫行業(yè)新周期也悄然拉開帷幕。
好文章,需要你的鼓勵
這項研究提出了"高效探測"方法,解決了掩碼圖像建模AI難以有效評估的問題。通過創(chuàng)新的多查詢交叉注意力機制,該方法在減少90%參數(shù)的同時實現(xiàn)10倍速度提升,在七個基準測試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質量與分類性能的強相關性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應性。團隊承諾開源全部代碼,推動技術普及應用。
伊利諾伊大學研究團隊開發(fā)了CLAIMSPECT系統(tǒng),通過層次化分解復雜爭議、智能檢索相關文獻、多角度收集觀點的方法,將傳統(tǒng)的"真假"判斷轉變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動構建爭議話題的分析框架,識別不同觀點及其支撐證據(jù),為科學和政治爭議提供更全面客觀的分析,已在生物醫(yī)學和國際關系領域驗證有效性。
清華大學研究團隊首次提出情感認知融合網(wǎng)絡(ECFN),讓AI能像人類一樣理解和表達情感。該系統(tǒng)通過多層次情感處理架構,在情感識別準確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實現(xiàn)了跨模態(tài)情感融合、動態(tài)情感追蹤和個性化情感建模,為醫(yī)療、教育、客服等領域帶來革命性應用前景。
哈佛大學研究團隊通過創(chuàng)新的多智能體強化學習方法,讓AI在戰(zhàn)略游戲中學會復雜推理。研究發(fā)現(xiàn)AI通過游戲競爭能發(fā)展出類人思維能力,在邏輯推理、創(chuàng)造性解決問題等方面表現(xiàn)顯著提升。這項突破性成果為未來AI在醫(yī)療、教育、城市管理等領域的應用奠定基礎,展現(xiàn)了通過模擬人類學習過程培養(yǎng)真正智能AI的新路徑。
關注智造、硬件、機器人。