作者|周雅
配圖|扈佃杰
斯蒂芬·茨威格曾在《人類群星閃耀時》書中寫道:一個人命中最大的幸運,莫過于在他的人生中途,即在他年富力強的時候,發(fā)現(xiàn)了自己的使命。
陳運文34歲那年,是2015年,他離開任職多年的大廠,轉(zhuǎn)而投身于“大眾創(chuàng)業(yè)、萬眾創(chuàng)新”的時代浪潮中。從此,他成為達觀數(shù)據(jù)董事長兼CEO,他的使命是“扛起國內(nèi)文本智能處理ToB業(yè)務(wù)這面大旗”。
提到「文本智能處理」,表面理解起來倒不難,但背后的處理卻有很高技術(shù)門檻,它是計算機科學(xué)、AI、語言學(xué)的交叉領(lǐng)域,本質(zhì)在于找出自然語言的規(guī)律。在國內(nèi),百度、搜狗、阿里、騰訊等互聯(lián)網(wǎng)巨頭應(yīng)用的較早,如搜索引擎正是基于該技術(shù),人們在搜索框敲出文字,文本智能處理在后臺搞懂文字的意思,再從海量數(shù)據(jù)中把相關(guān)內(nèi)容找出來。陳運文在創(chuàng)業(yè)之前,就是從事類似的技術(shù)研發(fā)工作,接觸的是大量C端用戶。創(chuàng)業(yè)之后,他意外發(fā)現(xiàn):“文本智能處理技術(shù)在ToB領(lǐng)域的價值更高,且這在國內(nèi)處于真空地帶。”
回望人工智能曲折起伏的60年間,人們曾經(jīng)熱衷于各種人機大戰(zhàn),相較之下,「文本智能處理」——是又難又不易被感知到的“小事”。不過,陳運文創(chuàng)辦的達觀數(shù)據(jù)苦耕7年的成果證明了:無論是哪個賽道,技術(shù)最關(guān)鍵是要落地從而創(chuàng)造價值。
今年3月,達觀數(shù)據(jù)完成了C輪5.8億元融資,刷新了中國自然語言處理與知識圖譜領(lǐng)域的融資紀(jì)錄。資料顯示,達觀數(shù)據(jù)專門為企業(yè)提供各類場景的智能文本機器人,包括辦公流程自動化、文檔智能審閱、文字識別、企業(yè)級垂直搜索、智能推薦等產(chǎn)品,為眾多500強企業(yè)的“智慧辦公”創(chuàng)造了價值。目前,達觀數(shù)據(jù)拿到中國人工智能領(lǐng)域最高獎“吳文俊人工智能獎”,2021年被評為行業(yè)首家國家級“專精特新小巨人”企業(yè),同年入選福布斯科技創(chuàng)新50強。此外,達觀目前已申請100 余項發(fā)明專利,通過國際權(quán)威機構(gòu)的軟件成熟度CMMI5的最高等級認(rèn)證。
同樣在今年,達觀數(shù)據(jù)又入選了英特爾“AI百佳創(chuàng)新激勵計劃”五期優(yōu)秀團隊。在項目中,達觀數(shù)據(jù)的智能文本機器人基于英特爾至強平臺和Intel優(yōu)化版TensorFlow,獲得了1.45倍的性能提升。經(jīng)過英特爾平臺優(yōu)化后,達觀的解決方案在智能制造、智慧城市、智慧金融等企業(yè)數(shù)字化轉(zhuǎn)型場景都可以發(fā)揮明顯的作用。
創(chuàng)業(yè)需要苦行僧的意志,這在陳運文身上體現(xiàn)得淋漓盡致。我們的本次對談,是陳運文在去趕高鐵的路上進行的,他的時間都像奶酪一樣被一份份切割好,一部分對外面向客戶、政府、媒體等,一部分對內(nèi)談戰(zhàn)略、組織管理、協(xié)調(diào)、招聘等,且這些事經(jīng)常填滿他的日常。他說,“腦子要經(jīng)常切換。要把時間更好的利用起來。”
01 做自己擅長的事
科技行者:達觀剛創(chuàng)立那會兒,AI領(lǐng)域已經(jīng)有點風(fēng)生水起了,你是怎么決定要進入文本智能處理這個細分賽道的?
陳運文:術(shù)業(yè)有專攻,人工智能是非常大的一個賽道,我們要看自己擅長做哪塊事情,那時候,“AI四小龍”已經(jīng)創(chuàng)辦了,且已經(jīng)逐漸嶄露頭角了。
我們看到,除了圖像處理這些公司以外,做文本智能處理的,尤其是書面文字資料處理的創(chuàng)業(yè)公司在當(dāng)時幾乎沒有。一方面,我們原先一直在國內(nèi)大企里從事文本處理的技術(shù)研發(fā)工作;另一方面,我們看到整個中國的企業(yè)服務(wù)版圖里,文本智能處理領(lǐng)域的ToB業(yè)務(wù)還是真空地帶,市場潛力巨大。
所以,一是有非常好的市場窗口期,二是我們又具備這樣的技術(shù)能力,三是還有天使輪投資方真格基金鼓勵我們創(chuàng)業(yè)。于是就抱著試一試的想法,希望能夠扛起國內(nèi)文本智能處理ToB業(yè)務(wù)這面大旗。
科技行者:很多創(chuàng)新公司都會講一個技術(shù)護城河的概念,文本智能處理的技術(shù)門檻高么?
陳運文:這個技術(shù)主要有兩方面難點:其一,文字非常抽象與凝練,短短幾個字就能表達豐富含義,計算機解讀高度凝練的中文語言,難度很大;其二,語言文字處理是人類的高級認(rèn)知,機器人要掌握行業(yè)的“知識圖譜”,具備專業(yè)的閱讀能力,才能夠閱讀專業(yè)的文檔資料。這些技術(shù)門檻,使得文本的自動化處理和應(yīng)用存在很多難點。
不過,文本自動化處理的應(yīng)用場景非常廣闊。文字資料普遍存在于每天的工作中,而文字資料的智能化處理技術(shù)可大幅提升日常文字辦公的效率,為很多行業(yè)帶來顛覆。雖然很難,但很有價值,所以我們下決心把它做好。
科技行者:那么要把這件事做好,需要哪些核心競爭力?
陳運文:核心技術(shù)能力分兩大塊:
首先,要有一個非常強大的NLP(自然語言處理)算法模型,它能像人一樣,理解文字背后所蘊含的復(fù)雜語義。比方說,我們訓(xùn)練計算機系統(tǒng)能看懂漢字、能理解漢字的意思、能運用漢字寫作。這些都是需要具備的語言能力基礎(chǔ)。
同時,要有垂直行業(yè)的領(lǐng)域知識,我們一般稱之為“domain knowledge”,也就是行業(yè)的know how。需要讓計算機算法模型像一個行業(yè)專家,去解讀行業(yè)術(shù)語,且能夠靈活運用這些術(shù)語和能力,去完成工作業(yè)務(wù)。
我們經(jīng)常講“三百六十行,行行出狀元”,每個行業(yè)都有自己的文字資料、寫作規(guī)范、行業(yè)術(shù)語、業(yè)務(wù)審核邏輯等等,所以我們要在每個行業(yè)里搭建一個類似專家的知識圖譜系統(tǒng),再用這一系統(tǒng)結(jié)合我們的通用語言模型,最終生成每個行業(yè)的文本智能處理業(yè)務(wù)系統(tǒng)。
這兩部分缺一不可。
陳運文:主要有三類場景:第一類是大量的重復(fù)性工作。如財務(wù)工作,工作人員要理發(fā)票,并將發(fā)票內(nèi)所有詳細信息錄入到系統(tǒng)中。再如海關(guān)報關(guān)工作,每個商品都要填報關(guān)單,工作量非常大,且繁瑣重復(fù),這些量大繁瑣的工作就適合機器人完成。
第二類是對準(zhǔn)確率要求非常高的工作,常見于金融行業(yè)。銀行、證券、基金、保險等領(lǐng)域?qū)ξ谋緮?shù)據(jù)的準(zhǔn)確率要求非常高,由人來處理這些事務(wù)非常辛苦,所以我們可以將復(fù)核等工作交給機器人做。另外,政務(wù)公文對準(zhǔn)確率要求也非常高,姓名、職級、順序不能搞錯,公文的段落篇章都有嚴(yán)格的規(guī)范,機器人也可以完成稿件的復(fù)核或政府公文的復(fù)核工作。
第三類是跨系統(tǒng)的工作。在辦公過程中,我們常常要在 A系統(tǒng)查詢數(shù)據(jù),B系統(tǒng)核驗,再到C系統(tǒng)下載相關(guān)文檔等,需要同時使用多個系統(tǒng)。智能文本機器人可以自動到各個系統(tǒng)完成數(shù)據(jù)的查驗、讀取、分析、錄入等工作,提升需要橫跨多系統(tǒng)的工作的效率。
我們有個常見的評判標(biāo)準(zhǔn),當(dāng)你覺得這份工作非常枯燥,工作時覺得自己像個機器人,那這個工作其實就適合機器人完成,這是這些場景的共性所在。
科技行者:咱們典型行業(yè)客戶是誰,他們當(dāng)初為什么選擇達觀的技術(shù)?
陳運文:金融就是一個典型的行業(yè)。像中信、招商、中信建投等等都是中國最知名的證券公司,它們都是我們的客戶。證券公司的工作關(guān)聯(lián)上市公司數(shù)億數(shù)十億的業(yè)務(wù),非常重要,同時證券的投行部門加班非常多,非常辛苦。他們工作這么重要,對質(zhì)量要求這么高,且工作量又這么大,能不能用一些智能化手段來緩解呢?于是證券公司找到我們,采購達觀的智能文本處理系統(tǒng),一用發(fā)現(xiàn)確實效果很好,大幅減輕工作負擔(dān),提升工作效率。
有一家證券公司的托管業(yè)務(wù),原來是靠大量人工審核托管協(xié)議,協(xié)議動輒上百頁,必須把所有的風(fēng)險點找出來改掉,這是一件極細的活兒。交給我們機器人,半年審核完成了接近20萬份協(xié)議,且確保百分百把風(fēng)險點找出并改掉,這就大幅度提升了工作效率。
科技行者:有沒有關(guān)于工作效率提升的具體數(shù)據(jù),讓大家直觀感受一下?
陳運文:有兩方面的統(tǒng)計,一是處理效率,我們把一份協(xié)議的審核時間從人工需要30分鐘,壓縮到機器只需2分鐘內(nèi),效率提升15倍;二是審核質(zhì)量,人工審核準(zhǔn)確率約96%,會存在遺漏情況,而機器可以做到準(zhǔn)確率99.9%。
還有一件有意思的事。我們在今年C輪融資的投資方新增了證券公司,它們原本就是我們的客戶,非常認(rèn)可我們的產(chǎn)品和技術(shù),覺得我們的技術(shù)未來大有發(fā)展前途,它們決定未來還要投資我們。
科技行者:從買產(chǎn)品,發(fā)展到買股份,這應(yīng)該是最大的認(rèn)可了。另外,我在看咱們公司官網(wǎng)時,發(fā)現(xiàn)達觀的產(chǎn)品有很多,包括RPA、文檔智能審閱、智能搜索、智能推薦、知識圖譜等,這些產(chǎn)品背后的統(tǒng)一的技術(shù)邏輯應(yīng)該就是智能語義處理平臺了。
陳運文:是的,無論是讓我們系統(tǒng)幫你去搜資料,還是審核文檔,或是處理一個流程,底層邏輯都是讓計算機能夠說文解字,看得懂文字資料,且能夠運用文字資料。達觀數(shù)據(jù)的智能語義平臺作為核心技術(shù),承載了上面所有的應(yīng)用場景。
02 七年三大里程碑,與大廠搶人是頭疼事
科技行者:創(chuàng)業(yè)七年來,感覺市場經(jīng)歷了怎樣的變化?
陳運文:原來是天上打雷,現(xiàn)在是地上下雨,把原來可能很高調(diào)宣傳的東西實實在在變成一個個落地的系統(tǒng)和產(chǎn)品,大家也更愿意看到務(wù)實的產(chǎn)品,這是近幾年明顯的發(fā)展趨勢。
科技行者:很多人都喜歡聽創(chuàng)業(yè)公司的成長故事,達觀數(shù)據(jù)這些年有哪些重要里程碑?
陳運文:公司發(fā)展分三個階段:
早期拿到真格基金投資以及后面的一年多發(fā)展過程,叫「初創(chuàng)期」,對我們來說需要調(diào)整心態(tài),深刻了解中國To B產(chǎn)業(yè)運行規(guī)律,一點點學(xué)習(xí),怎么更好把我們的產(chǎn)品和每個行業(yè)的應(yīng)用場景嫁接到一起,去開發(fā)出有競爭力的產(chǎn)品,初創(chuàng)期是非常需要打基礎(chǔ)的時候。
從2017年到2020年,是「發(fā)展期」,過程中我們完成了兩輪融資,公司的規(guī)模每年都翻番增長。在行業(yè)里,我們逐步把達觀的品牌樹立起來了,在國內(nèi)尤其是智能化文本處理領(lǐng)域,我們通過這幾年發(fā)展期聲名鵲起。
第三個階段是2020年往后至今,是我們「練內(nèi)功」的階段。我們通過多年發(fā)展,團隊數(shù)量迅速擴張,公司除了總部在上海以外,在北京、深圳、成都、蘇州、鄭州都開設(shè)了分公司,每個分公司都有幾十號員工,全國的員工數(shù)量加起來大幾百人了,人數(shù)已經(jīng)蠻多了。
當(dāng)組織不斷發(fā)展壯大,怎么樣讓團隊工作效率始終保持創(chuàng)業(yè)期的高效率,需要下功夫思考。尤其是異地配合,比如北京的客戶,本來是北京分公司負責(zé)對接,但客戶用了一些技術(shù)是我們上海公司研發(fā)中心研發(fā)的,可能又同時用到了深圳分公司的一些經(jīng)驗,所以它需要我們?nèi)珖鞯匾槐P棋。其中有很多挑戰(zhàn),不同地區(qū)合作、不同團隊組織文化等方面的挑戰(zhàn)等等。
第三個階段也是我們的平臺發(fā)展期,我們需要克服發(fā)展過程中一些挑戰(zhàn)才能邁向下一個臺階。
科技行者:公司苦練內(nèi)功的時候,正是疫情突然爆發(fā)的時候,這對團隊協(xié)作是一個挑戰(zhàn)吧?
陳運文:沒錯。疫情我們都知道出差不如以前方便了,以前的項目協(xié)作,大家可以隨時出差,隨時到客戶現(xiàn)場,隨時碰頭開會。
疫情以后,大家都是線上交流,人和人的交流在網(wǎng)上和真正面對面感覺還是隔了一層,這種情況下,到底怎樣能讓團隊擰成一股繩,打好配合,把一個復(fù)雜的項目完成,這其實是有很多組織和文化方面的挑戰(zhàn),這對我們來說也是一個考驗,我們想了很多辦法解決問題。
科技行者:你們的解決辦法是?
陳運文:我們組織了很多workshop(內(nèi)部研討會),這種研討會是跨地區(qū)跨部門的,大家組成一個虛擬團隊,每次研討會設(shè)一個主題,主題可能是某個技術(shù)話題、運營話題、或產(chǎn)品話題等,比如用三天時間,讓大家集中在workshop里交流碰撞。
我們組織得很頻繁,過去兩年里,每周都組織一次,每次都是不同的話題,讓不同團隊同事通過這樣的充分交流,互相熟悉起來,在未來的工作中協(xié)同配合,還是非常有效的。
科技行者:剛才提到的公司發(fā)展三個階段,我從外部來看是兩年一個臺階,一直在穩(wěn)步前進,想必背后也有一定的酸楚。創(chuàng)業(yè)以來,有沒有讓你頭疼的事?
陳運文:怎么樣能夠找到優(yōu)秀的人才是一件最頭疼的事。
我們需要的人才,往往來自于某個特定行業(yè),或者他對某個行業(yè)有自己的獨到理解,這樣的人才對于創(chuàng)業(yè)公司非常難得,因為我們面臨著來自大廠的人才競爭。從企業(yè)品牌的知名度、號召力、薪資待遇方面,創(chuàng)業(yè)公司給候選人帶來的光環(huán)是遠不如大廠的,我們明顯處于劣勢。最困難的是,每次當(dāng)我們有一個優(yōu)秀的候選人,前期聊得特別好,在我們和大廠之間二選一時,只能很舍不得喪失了這位候選人,每次都特別可惜。
包括我們公司里很多骨干,都是花了好多精力與之交流,有的候選人到了大廠工作了一年兩年后,我們還跟他保持聯(lián)系,兩年后他總算覺得我們還挺有誠意,做事情似乎還挺靠譜,然后再離開大廠來到我們公司。
這過程挺耗費人的心力,因為你需要說服一個人,需要去改變他的判斷,需要很有耐心,我們能看上的優(yōu)秀人才,他們選擇也多,我們未必會成為他們最終選擇,所以這就特別痛苦。但我們有耐心,希望持續(xù)召喚優(yōu)秀的人才加入,大家一起成長,共同分享成果。
03 人才與有溫度的文化,是企業(yè)的長期主義
科技行者:一個公司的長期發(fā)展,一是要有長期的商業(yè)回報,二是要有核心競爭力。我想先問一下,在AI商業(yè)化方面,我們有什么心得體會?
陳運文:如果要把商業(yè)做好,還是要俯下身去做實實在在的交付服務(wù)工作,即便有很高大上的算法技術(shù),最后落地的這一步是要走得比較扎實才行。
我們公司特別鼓勵工程師到客戶一線去,如果不在客戶現(xiàn)場做實驗,做交付,讓客戶真正用起來,那么很多技術(shù)都在空轉(zhuǎn),并沒有很好落地。所以我們非常強調(diào)落地的工作,我們要求公司管理干部每年至少有一半時間在客戶現(xiàn)場。
我特別欣賞華為任正非的一句話,“要讓在一線聽得到炮火的人來決策”,要在前線才能知道客戶到底需要什么技術(shù),真正往哪個方向去做技術(shù)研發(fā),這才是最有價值的。
科技行者:咱們再來談?wù)労诵母偁幜Α,F(xiàn)在大環(huán)境很鼓勵創(chuàng)新,達觀也拿過很多核心技術(shù)認(rèn)證和獎項,你認(rèn)為提升一家公司核心技術(shù)競爭力的本質(zhì)是什么?
陳運文:首先要尊重人才。因為一家公司的技術(shù),尤其是復(fù)雜的技術(shù),不是一個人能做出來的,需要一個強有力的團隊,且團隊要不斷吸收新鮮血液,新人會帶著新想法、新視角、創(chuàng)新而來,公司要把這些原創(chuàng)的或獨特的想法保護好,讓他們愿意去嘗試,容忍他們創(chuàng)新的失敗,鼓勵他們,這非常重要。說到底,就是培養(yǎng)一個優(yōu)秀的文化氛圍,讓有創(chuàng)新火花的人才在里面發(fā)光發(fā)熱。
其次,一個正能量的企業(yè)文化也很重要。尤其像我們這樣的科技創(chuàng)業(yè)公司里全是年輕人,我們希望從正能量的角度引導(dǎo)大家,讓大家覺得公司是一個積極向上的公司,是一個充滿了人文關(guān)懷的公司。
在這方面,我們組織了很多社會公益活動。比如每年組織同事去貧困山區(qū)做義務(wù)支教,每年組織義務(wù)獻血活動,公司還有殘疾人員工,這些員工都非常優(yōu)秀,在我們公司也發(fā)展得非常好,公司整體都是很有溫度的文化。
就拿義務(wù)支教來說,年輕同事都積極報名,他們?nèi)ヘ毨У貐^(qū)建愛心圖書室,做短期的支教活動,回來都覺得特別有收獲,更珍惜在大城市的生活,也更愿意在未來的公益中奉獻愛心。我希望公司始終有這樣一個正能量的范圍,避免社會上一些負面情緒或一些浮躁的喪文化等。這都是我們在企業(yè)文化方面做的工作,還挺有效果的。
科技行者:聽起來就很有溫度,咱們公司的企業(yè)文化怎么概述?
陳運文:我們企業(yè)文化濃縮成八個字“通達樂觀、務(wù)實求真”。“通達樂觀”是公司名字的來歷,希望大家積極向上,永遠樂觀向前。“務(wù)實求真”是務(wù)實、接地氣、實事求是解決問題,這樣公司才能走得更長遠。
科技行者:剛才說“要不斷吸引人才”,納新是公司發(fā)展很重要的點,但這涉及到一個問題,大企業(yè)可能熱衷于換血,你們不斷納新是否也會涉及到這個問題?
陳運文:我們倒沒有太多這方面問題。大企業(yè)的業(yè)務(wù)相對穩(wěn)定,人員團隊相對飽和,可能需要用新鮮血液去替換。但我們一直在成長,每年都在擴編,還擔(dān)心人不夠用。我們既希望新鮮血液加入,也希望老員工成長,以承擔(dān)更重要的職責(zé),這也是我們作為成長期的科技企業(yè)吸引人才的地方。
04 創(chuàng)業(yè)是痛并快樂著
科技行者:創(chuàng)業(yè)之前,你在多家名企(盛大文學(xué)、騰訊文學(xué)、百度)任負責(zé)人。在大廠工作和自己創(chuàng)業(yè)相比,感受最大的區(qū)別是什么?
陳運文:自己創(chuàng)業(yè)要操心的事情太多了,要把自己從技術(shù)專家變成一個十項全能的選手,是一個很不容易的過程。當(dāng)然,這個過程對個人來說是全方位的鍛煉和成長,我們經(jīng)常講“痛并快樂著”,很辛苦但很有收獲。
科技行者:平日里,有沒有可推薦的書、電影或者音樂?
陳運文:我自己挺愛讀書的,比較推薦吳軍老師的作品,他的每一本書都寫得非常好。
我在大學(xué)當(dāng)校外研究生導(dǎo)師,就給同學(xué)推薦《數(shù)學(xué)之美》,把非常艱深晦澀的數(shù)學(xué)原理用非常直觀的例子講清楚,寫得非常好,且通俗易懂,今天我們所有的所謂計算機、人工智能技術(shù),底層全部都是數(shù)學(xué)模型,所以對數(shù)學(xué)的熱愛非常重要。
吳軍老師的《浪潮之巔》講的是整個互聯(lián)網(wǎng)或者IT科技產(chǎn)業(yè)的浪潮發(fā)展,里面的企業(yè)、產(chǎn)品、技術(shù)更迭等等,講得非常好,非常深刻。
《文明之光》我也特別喜歡,里面講到了人類文字的演進過程,我們今天的數(shù)學(xué)技術(shù)來自于5000年前人類發(fā)明的這些符號,這些符號是怎么發(fā)明的,怎么樣一步步變成今天的樣貌,非常有意思。我們公司搞了一面文化墻,把人類5000年來各種文字的發(fā)展歷程和當(dāng)中一些里程碑事件展示出來,還搞了很多實物展品,像一個小型的文字博物館,里面有來自埃及的文字,來自中國古代的甲骨文,刻在青銅器上的小篆等等,這些都是吳軍老師各種書里的內(nèi)容,我也經(jīng)常買這些書送給身邊的朋友,因為特別喜歡。
科技行者:我待會去書架上把我的《浪潮之巔》再拿出來讀一讀。
陳運文 達觀數(shù)據(jù)CEO
復(fù)旦大學(xué)計算機博士,國家“萬人計劃”專家,2021年中國青年創(chuàng)業(yè)獎,中國五四青年獎?wù)?、上海市十大青年科技杰出貢獻獎獲得者,上海市優(yōu)秀技術(shù)帶頭人,浦東十大杰出青年;國際計算機學(xué)會(ACM)、電子電器工程師學(xué)會(IEEE)、中國計算機學(xué)會(CCF)、中國人工智能學(xué)會(CAAI)高級會員,上海市計算機學(xué)會多媒體分會副會長;第九屆上海青年科技英才,浦東百人計劃專家,張江優(yōu)秀人才;上海市浦東新區(qū)政協(xié)委員。在人工智能領(lǐng)域擁有豐富研究成果,是復(fù)旦大學(xué)、上海財經(jīng)大學(xué)、上海外國語大學(xué)聘任的校外研究生導(dǎo)師,在IEEE Transactions、SIGKDD等國際頂級學(xué)術(shù)期刊和會議上發(fā)表數(shù)十篇高水平科研成果論文,出版有《智能RPA實戰(zhàn)》、人工智能經(jīng)典著作《智能Web算法》(第2版),并參與撰寫《數(shù)據(jù)實踐之美》等論著;曾多次摘取ACM KDD CUP、CIKM、EMI Hackathon等世界最頂尖的大數(shù)據(jù)競賽的冠亞軍榮譽。曾擔(dān)任盛大文學(xué)首席數(shù)據(jù)官、騰訊文學(xué)高級總監(jiān)、百度核心技術(shù)研發(fā)工程師。在機器學(xué)習(xí)、自然語言處理、搜索推薦等領(lǐng)域有豐富的研究和工程經(jīng)驗。
好文章,需要你的鼓勵
浙江大學(xué)團隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團隊提出SIRI方法,通過"壓縮-擴張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實驗顯示,該方法在數(shù)學(xué)競賽題上將模型準(zhǔn)確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團隊開發(fā)出Rolling Forcing技術(shù),實現(xiàn)AI視頻實時流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓(xùn)練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團隊發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強化學(xué)習(xí)方法訓(xùn)練多個AI模型。實驗結(jié)果顯示,幾何訓(xùn)練在四個空間智能測試基準(zhǔn)上都帶來顯著提升,其中最佳模型達到49.6%準(zhǔn)確率,超越此前最好成績。這項研究揭示了基礎(chǔ)幾何知識對培養(yǎng)AI空間智能的重要價值。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會友,左手硬核科技,右手浪漫主義。