文|周雅
若是用技術(shù)的語言來表達,這就是物理世界「圖數(shù)據(jù)庫」的概念。
說到這套技術(shù),就不得不提一家公司——Neo4j。
2000年的某天,瑞典人Emil Eifrem坐飛機飛往孟買,當(dāng)他正在為解決數(shù)據(jù)系統(tǒng)的性能問題發(fā)愁時,突然靈感乍現(xiàn),隨手抓起一張餐巾紙,迅速勾勒出一個圖數(shù)據(jù)庫模型。當(dāng)時的Emil Eifrem或許并不會想到,那張餐巾草圖會是一家公司的開端。
2007年,懷揣「圖數(shù)據(jù)庫」理想的Neo4j公司正式在瑞典成立了。十幾年之后,Neo4j公司已經(jīng)成為全球領(lǐng)先的圖數(shù)據(jù)庫平臺,服務(wù)全球400多家企業(yè)客戶(包括空客、康卡斯特、eBay、美國宇航局、瑞銀、沃爾瑪?shù)龋?,坐擁?shù)百萬社區(qū)用戶。
關(guān)系型數(shù)據(jù)庫沒有關(guān)系,它純粹就是數(shù)據(jù);圖數(shù)據(jù)庫存的不是圖,它存的是關(guān)系。”
「圖數(shù)據(jù)庫」,是以圖的結(jié)構(gòu)形式來存儲數(shù)據(jù),它所存儲的就是聯(lián)系的數(shù)據(jù),是關(guān)聯(lián)數(shù)據(jù)本身。
“圖數(shù)據(jù)庫的美妙之處在于,它基本上適合于每一個行業(yè)。”
此外在Neo4j 社區(qū),也一直在用圖數(shù)據(jù)庫技術(shù)解決一些社會緊迫問題:比如氣候變化、癌癥治療、加速人類的火星之旅、推進性別平等、提高政府透明度、以及推動人類知識的邊界等。
持久互信的商業(yè)關(guān)系,也是職業(yè)與業(yè)務(wù)可持續(xù)發(fā)展的關(guān)鍵。
以下是科技行者訪談Neo4j亞太區(qū)副總裁Nik Vora的實錄(經(jīng)整理):
“關(guān)系型數(shù)據(jù)庫沒有關(guān)系,圖數(shù)據(jù)庫存的是關(guān)系”
科技行者:Neo4j成立于2000年,公司成立之初,整個市場環(huán)境是怎么樣的?
Nik Vora:2000年的時候,Neo4j創(chuàng)始人萌生了一個(做圖數(shù)據(jù)庫的)想法,并成立了公司,但想法只停留在理論階段,而真正把想法付諸于實施、變成商業(yè)化落地的產(chǎn)品是在2007年。當(dāng)時,我們的創(chuàng)始人在飛機上,提出了具體的想法,并且和伙伴們把它付諸實施。
2007年,面臨的第一個挑戰(zhàn)就是,怎么把它做一個技術(shù)的歸類和分類。因為在那個時候,剛開始在美國和歐洲市場,基本上很多客戶無論是大學(xué)里面學(xué)的、還是現(xiàn)實用的都是「關(guān)系型數(shù)據(jù)庫」,他們很疑惑為什么這么一個小公司過來給我講「圖數(shù)據(jù)庫」,它到底是做什么用的?這是當(dāng)時最大一個挑戰(zhàn),在于普及。
Neo4j創(chuàng)始人和初創(chuàng)團隊都是開發(fā)者,所以我們剛開始的產(chǎn)品版本,是OpenSource(開源)的方式,通過發(fā)展社區(qū),社區(qū)的開發(fā)者們都可以對這個OpenSource做貢獻,讓大家更多地去了解什么是圖數(shù)據(jù)庫?,F(xiàn)在在亞洲,可以看到很多開源社區(qū)的貢獻者。
科技行者:既然當(dāng)時市場的主流是「關(guān)系型數(shù)據(jù)庫」,那為什么Neo4j會看好「圖數(shù)據(jù)庫領(lǐng)域」呢?
Nik Vora:當(dāng)初的市場環(huán)境主要是關(guān)系型數(shù)據(jù)庫,但隨著互聯(lián)網(wǎng)尤其是移動互聯(lián)網(wǎng)的發(fā)展,大量數(shù)據(jù)涌現(xiàn),關(guān)系型數(shù)據(jù)庫已滿足不了客戶的需求。Neo4j看到市場的這種需求,并投身到圖數(shù)據(jù)庫這個領(lǐng)域。
在傳統(tǒng)的關(guān)系型數(shù)據(jù)庫里,要找到一個人,需要找數(shù)據(jù)之間的關(guān)系,可能要花費幾天的時間去做關(guān)聯(lián)。但是在圖數(shù)據(jù)庫里,發(fā)現(xiàn)可以做到毫秒級,相對于傳統(tǒng)的關(guān)系型數(shù)據(jù)庫,它的作用在于——發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)系。
所以說,關(guān)系型數(shù)據(jù)庫沒有關(guān)系,它純粹就是數(shù)據(jù);圖數(shù)據(jù)庫存的不是圖,它存的是關(guān)系。
科技行者:目前看來,圖數(shù)據(jù)庫主要用在哪些行業(yè),可否描述一下具體的應(yīng)用場景?
Nik Vora:圖數(shù)據(jù)庫基本上適合于每一個行業(yè)?;乜催^去一兩年,中國變成了這一行業(yè)里的開路先鋒,在圖數(shù)據(jù)庫的推廣方面,很多中國的客戶都在試用。
當(dāng)然了,一些行業(yè)的普及程度會比另外一些行業(yè)高,比如執(zhí)法部門。譬如,A認識B,通過圖數(shù)據(jù)庫,如果A是一個嫌疑人,而A與B之間已經(jīng)有認識關(guān)系的話,那B也很有可能變成一個嫌疑人。通常,執(zhí)法機關(guān)在處理移民工作中,大量地使用了人和人之間的關(guān)系。
還有諸如航空公司、運輸公司(比如滴滴出行),都廣泛的應(yīng)用圖數(shù)據(jù)庫:分析一個乘客從A處到B處,一些航空公司都是用數(shù)據(jù)庫表現(xiàn)出來,非常方便;還有銀行里面欺詐檢測和反洗錢這些場景也非常適合,尤其今天我們看到反欺詐呈一個上升趨勢,欺詐者變得越來越聰明,銀行再用傳統(tǒng)的方式很難發(fā)現(xiàn)他,而通過圖數(shù)據(jù)技術(shù),可以把人和人之間的關(guān)系,把邏輯事件指出來,很容易就發(fā)現(xiàn)新型的欺詐關(guān)系;另外在保險行業(yè),圖數(shù)據(jù)庫也非常流行,因為保險的欺詐也很多。
圖數(shù)據(jù)庫在制造業(yè)也有廣泛的應(yīng)用。比如汽車制造業(yè),一輛汽車有很多的零件,一個零件壞了之后,它會影響上下游的關(guān)系,比如一個小零件壞了,可能影響到發(fā)動機的最大功率,通過圖數(shù)據(jù)庫,很容易把所有零部件之間的各種關(guān)系串起來。
智能手機行業(yè)也同理。手機零部件,如果用圖數(shù)據(jù)庫把它關(guān)聯(lián)起來,很容易發(fā)現(xiàn)中間極小的問題,甚至產(chǎn)生蝴蝶效應(yīng),一個小螺絲釘壞了有可能會影響到顯示屏幕,此前沒有圖數(shù)據(jù)庫,是很難去發(fā)現(xiàn)這些問題的。
其他包括醫(yī)療等很多重要行業(yè)在內(nèi)的千行百業(yè),都在使用圖數(shù)據(jù)庫。
“說明我們當(dāng)時做了一件對的事情”
科技行者:在圖數(shù)據(jù)庫領(lǐng)域,有很多巨頭和玩家先后進入,相比之下,Neo4j的核心優(yōu)勢是什么?
Nik Vora:首先我們很高興看到市場上面有很多的競爭對手出來,這說明我們當(dāng)時做了一件對的事情。
Neo4j的核心優(yōu)勢有三方面:
開源。讓更多人可以使用。
目前在圖數(shù)據(jù)科學(xué)方面,Neo4j已經(jīng)積累了60多種不同的算法,可以幫助用戶獲得最大程度的投資回報。
比如國內(nèi)最大的某個制造廠商,在擴展性、速度方面,只有Neo4j可以滿足它的需求。
科技行者:這些數(shù)據(jù)的隱私安全方面怎么保障呢?
Nik Vora:數(shù)據(jù)的合規(guī)、安全、隱私是一個非常重要的話題,Neo4j也充分地考慮到這一點。
除了開源版,Neo4j還有企業(yè)版,有非常重要的一些安全特性,可以幫助企業(yè)保護隱私和數(shù)據(jù)安全。比如基于角色實現(xiàn)安全控制,什么樣的人可以訪問哪些數(shù)據(jù),什么樣的人只能讀取但不可以修改數(shù)據(jù)等等。還有通過加密保護保存在數(shù)據(jù)中心的一些數(shù)據(jù)。
科技行者:Neo4j的客戶也很強勢,比如NASA、沃爾沃、瑞銀等等,可否舉例描述一下,這些客戶找到你們,主要的訴求是什么?
Nik Vora:我們很榮幸有這些客戶。以NASA為例,NASA有數(shù)以千計的數(shù)據(jù)中心,NASA的科學(xué)家或工程師之前找數(shù)據(jù)非常困難,因為有太多的文檔,查找極其耗時。NASA登陸火星項目應(yīng)用了Neo4j,創(chuàng)建了知識圖譜,把上億信息關(guān)聯(lián)起來,方便工程師,將項目縮短了兩年的時間,能提前完成項目并節(jié)省成本。
中國很多公司也在投入和學(xué)習(xí)知識圖譜。在中國很多大型機構(gòu),知識圖譜都是非常流行的一個應(yīng)用,大家投入很多的精力去學(xué)習(xí),甚至已經(jīng)開始研究知識圖譜如何幫助企業(yè)。Neo4j在中國已經(jīng)積累了很多客戶,包括來自電信、銀行、金融、制造行業(yè)的領(lǐng)先公司。
“中國創(chuàng)新勢頭更強勁”
科技行者:相比之下,在圖數(shù)據(jù)庫領(lǐng)域,中國市場和國外市場存在哪些異同之處?
Nik Vora:在應(yīng)用上差不多。市場方面,中國有幾處不同:1)中國創(chuàng)新勢頭強勁;2)互聯(lián)網(wǎng)的應(yīng)用更廣泛,規(guī)模更大,特別是移動互聯(lián)網(wǎng);3)云。中國70%應(yīng)用在云上。
科技行者:您工作過的幾個國家很有特色,比如新加坡、悉尼、孟買和上海,中國在工作環(huán)境上,與它們有何區(qū)別?
Nik Vora:如果中國客戶喜歡你的產(chǎn)品,會很快采用。而且中國客戶注重產(chǎn)品的本地化,滿足本地化需求。
科技行者:6月份,Neo4j剛剛拿到3.25億美元F輪融資,你們吸引投資人的秘訣是什么?
Nik Vora:投資者對我們都是長期投資。我們把投資者視為合作伙伴。
我們吸引投資人之處主要在于:1)我們是市場上排名第一的廠商; 2) 我們擁有成千上萬的開發(fā)者社區(qū);3)我們和投資人有著共同的價值觀和愿景。
公司最新一輪的3.25億美金的融資,不僅僅是在圖數(shù)據(jù)庫領(lǐng)域,實際上在所有數(shù)據(jù)庫歷史記錄里,這都是最大的一筆融資。
科技行者:Neo4j將如何消化這筆融資?
Nik Vora:1) 加速市場擴張,比如中國和其他市場;2)繼續(xù)投資圖數(shù)據(jù)庫和數(shù)據(jù)科學(xué);3)持續(xù)成為處理萬億節(jié)點的市場領(lǐng)導(dǎo)者。
好文章,需要你的鼓勵
這項研究提出了"高效探測"方法,解決了掩碼圖像建模AI難以有效評估的問題。通過創(chuàng)新的多查詢交叉注意力機制,該方法在減少90%參數(shù)的同時實現(xiàn)10倍速度提升,在七個基準(zhǔn)測試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質(zhì)量與分類性能的強相關(guān)性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應(yīng)性。團隊承諾開源全部代碼,推動技術(shù)普及應(yīng)用。
伊利諾伊大學(xué)研究團隊開發(fā)了CLAIMSPECT系統(tǒng),通過層次化分解復(fù)雜爭議、智能檢索相關(guān)文獻、多角度收集觀點的方法,將傳統(tǒng)的"真假"判斷轉(zhuǎn)變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動構(gòu)建爭議話題的分析框架,識別不同觀點及其支撐證據(jù),為科學(xué)和政治爭議提供更全面客觀的分析,已在生物醫(yī)學(xué)和國際關(guān)系領(lǐng)域驗證有效性。
清華大學(xué)研究團隊首次提出情感認知融合網(wǎng)絡(luò)(ECFN),讓AI能像人類一樣理解和表達情感。該系統(tǒng)通過多層次情感處理架構(gòu),在情感識別準(zhǔn)確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實現(xiàn)了跨模態(tài)情感融合、動態(tài)情感追蹤和個性化情感建模,為醫(yī)療、教育、客服等領(lǐng)域帶來革命性應(yīng)用前景。
哈佛大學(xué)研究團隊通過創(chuàng)新的多智能體強化學(xué)習(xí)方法,讓AI在戰(zhàn)略游戲中學(xué)會復(fù)雜推理。研究發(fā)現(xiàn)AI通過游戲競爭能發(fā)展出類人思維能力,在邏輯推理、創(chuàng)造性解決問題等方面表現(xiàn)顯著提升。這項突破性成果為未來AI在醫(yī)療、教育、城市管理等領(lǐng)域的應(yīng)用奠定基礎(chǔ),展現(xiàn)了通過模擬人類學(xué)習(xí)過程培養(yǎng)真正智能AI的新路徑。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會友,左手硬核科技,右手浪漫主義。