科技行者 10月15日 杭州消息(文/周雅):Michael “Monty” Widenius 又一次來中國了,身為 MySQL 之父、MariaDB 創(chuàng)始人,50多歲的他仍然奮戰(zhàn)在代碼第一線,他近幾年頻繁活躍于中國數(shù)據(jù)庫圈子,這一切很大程度都是因為開源,因為阿里云。
見到Monty的這天,他剛剛結(jié)束2018杭州云棲大會·數(shù)據(jù)庫開發(fā)者生態(tài)峰會的演講,與阿里云數(shù)據(jù)庫事業(yè)部總經(jīng)理鳴嵩一起,宣布“阿里云正式上線企業(yè)版MairaDB”的消息,此消息意義重大,因為這是MairaDB為阿里云打造的唯一一個企業(yè)版。
未來10年,毫無疑問是數(shù)據(jù)爆炸式增長的10年,面對諸如大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)等應(yīng)用場景,云數(shù)據(jù)庫就是背后的技術(shù)要塞。對企業(yè)而言,如何走在云時代的前列,選對數(shù)據(jù)庫是當務(wù)之急。
熟悉MairaDB的人都知道,它是MySQL源代碼的一個分支。Monty離開自己一手開發(fā)的 MySQL 之后,創(chuàng)辦了MairaDB,兩個數(shù)據(jù)庫管理系統(tǒng)最大的區(qū)別在于,后者更加符合“開源”精神。
而MariaDB的確實表現(xiàn)不俗,連續(xù)5年蟬聯(lián)年度Linux用戶數(shù)據(jù)庫選擇獎(2013年-2017年),在 DB-Engines 的數(shù)據(jù)庫管理系統(tǒng)位列14(2018年9月排名),且一直處于攀升趨勢。
數(shù)據(jù)來自于DB-Engines 數(shù)據(jù)庫管理系統(tǒng)2018年9月榜單
上圖可以總結(jié)出兩個數(shù)據(jù)庫趨勢:
· 目前榜單上的開源數(shù)據(jù)庫系統(tǒng)與商業(yè)數(shù)據(jù)庫系統(tǒng)平分秋色。
· 在通用領(lǐng)域,完全不屬于任何組織的開源數(shù)據(jù)庫與自研數(shù)據(jù)庫將是未來的主流,這也是MariaDB得到廣泛關(guān)注的原因,阿里、英特爾、騰訊都先后贊助了MariaDB。
MariaDB的誕生也與開發(fā)者一脈相承,它在大多數(shù)開發(fā)者眼中既是一個“有情懷”的數(shù)據(jù)庫,也是更友好的數(shù)據(jù)庫——大部分兼容MySQL,堅持開源,擁抱社區(qū)。比如引入FaceBook rocksdb做為主引擎,引入infinidb的columstore作為列存,在server層做行列存的整合,引入spider解決分布問題,貢獻了maxscale中間件,特別是10.3版本動作很大(阿里云上線的正是企業(yè)版MairaDB 10.3版本)。
鳴嵩說MariaDB是“對開發(fā)者更友好的數(shù)據(jù)庫”
開源雖好,但是很多開源平臺也會面臨在企業(yè)應(yīng)用時,不易用、不好用的問題。Monty和鳴嵩都做了強調(diào),企業(yè)版MariaDB會有一些優(yōu)化的功能,領(lǐng)先社區(qū)版三年。
這次雙方共同推出的企業(yè)版MairaDB號稱為“開源價值最大化”,我們可以理解為“一勞永逸的數(shù)據(jù)庫”。在鳴嵩的解讀下,企業(yè)一旦購買MairaDB,阿里云將額外提供備份、診斷、升級等運維服務(wù),相當于擁有了阿里巴巴多年在數(shù)據(jù)庫積累的運維經(jīng)驗。
MariaDB本身也為企業(yè)級市場不斷進化。比如MariaDB在歐洲服務(wù)企業(yè)級客戶時,發(fā)展出窗口函數(shù)等針對性功能。
鳴嵩還介紹了更多針對企業(yè)級數(shù)據(jù)安全方面的優(yōu)化。比如用戶訪問數(shù)據(jù)庫,它的鏈路是要SSL加密的;另外,存儲引擎有兩層加密,一是數(shù)據(jù)庫引擎的加密(原始的數(shù)據(jù)加密后存在存儲介質(zhì)上),第二是存儲介質(zhì)本身自帶加密能力。“這些東西讓你的數(shù)據(jù)庫非常的安全”,鳴嵩說。
這些功能,也讓開發(fā)者更方便的操縱自己的數(shù)據(jù)庫,這就是MariaDB今天的價值,同時也是阿里云在服務(wù)客戶時的追求的核心訴求和理念——優(yōu)秀的產(chǎn)品,便捷的使用。
能和MariaDB實現(xiàn)默契的配合,也和阿里云對開源的熱情和努力分不開。鳴嵩談起阿里云的開源成績,就像數(shù)落自家院子里的果樹。
阿里云多年來在開源市場,過去十年一直致力于中國和世界的開源事業(yè)。在開源中國舉行的“2017年度最受歡迎中國開源軟件Top20”的評選中,阿里巴巴占據(jù)五席;GitHub評選2017年對GitHub貢獻最大的十家公司榜單當中,只有阿里巴巴一家中國公司。
GitHub評選2017年對GitHub貢獻最大的十家公司榜單
阿里云對于開源的熱愛,從它對MariaDB的貢獻可見一斑,也可以從兩者源遠流長的合作歷史說起。
Monty本人與阿里云的合作可謂由來已久。早在2008年,阿里云就一直與MySQL社區(qū)合作不斷。而2012年開始,阿里云就開始了對MariaDB項目的貢獻,當前MariaDB中的多源復制,線程內(nèi)存監(jiān)控,數(shù)據(jù)閃回等重要功能,都是來自阿里云的貢獻。尤其在AliSQL開源之后,大量AliSQL中的先進功能正在快速的合并進入MariaDB。
目前阿里巴巴已經(jīng)有150+個開源項目,其中數(shù)個項目 star 破萬。
做了這么多貢獻,但是據(jù)阿里方面表示,阿里巴巴并沒有開源項目的KPI考核,各個團隊都是發(fā)自內(nèi)心地將踩過的坑和總結(jié)的經(jīng)驗融入到開源項目中,供業(yè)界所有人使用,希望幫助他人解決問題。
Monty也認可阿里云的文化和基因,用他的話來說:“兩個一起合作比單槍匹馬要好一些”,并且毫不掩飾對于阿里云的賞識,他回憶,自己經(jīng)常因為阿里云來到中國,去年還被邀請參加阿里云內(nèi)部的組織開發(fā)會議、了解各個項目:“阿里云的開發(fā)組非常得力,是非常優(yōu)秀的開發(fā)組”。
這正是社區(qū)一致的開源精神,大家都可以站在巨人的肩膀上,每個人都可以既是老師又是學生,這或許可以解釋為什么技術(shù)的發(fā)展能如此充滿活力。
碼代碼之余,Monty也有一顆熱愛生活的心。據(jù)鳴嵩透露,Monty酒量非常的好,上一次來中國給阿里云的同事帶了很多酒,以及“茴香味的巧克力”。Monty聽了之后笑笑說道:“不過,寫代碼的時候不要喝酒”。
好文章,需要你的鼓勵
浙江大學團隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學、編程等任務(wù)上顯著提升推理準確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學研究團隊提出SIRI方法,通過"壓縮-擴張"交替訓練策略,成功解決了大型推理模型"話多且準確率低"的問題。實驗顯示,該方法在數(shù)學競賽題上將模型準確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓練提供了新思路。
南洋理工大學與騰訊聯(lián)合研究團隊開發(fā)出Rolling Forcing技術(shù),實現(xiàn)AI視頻實時流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學研究團隊發(fā)現(xiàn),通過讓AI模型學習解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強化學習方法訓練多個AI模型。實驗結(jié)果顯示,幾何訓練在四個空間智能測試基準上都帶來顯著提升,其中最佳模型達到49.6%準確率,超越此前最好成績。這項研究揭示了基礎(chǔ)幾何知識對培養(yǎng)AI空間智能的重要價值。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會友,左手硬核科技,右手浪漫主義。