作者 | 金旺
2018年,P2P產(chǎn)業(yè)暴雷,行業(yè)失序。
這一年,各地面臨最大的問(wèn)題是:當(dāng)?shù)氐降子卸嗌偌移髽I(yè)在從事非法金融活動(dòng),這些企業(yè)又存在怎樣的風(fēng)險(xiǎn)?
由此一并受到社會(huì)高度關(guān)注的,還有風(fēng)控行業(yè)。
當(dāng)時(shí)在螞蟻集團(tuán)做C類(lèi)風(fēng)控的一支團(tuán)隊(duì),面對(duì)如此洶涌的行業(yè)大潮,也開(kāi)始思考其中問(wèn)題,著手構(gòu)建商業(yè)信用視角的企業(yè)風(fēng)險(xiǎn)大腦。
當(dāng)時(shí)的企業(yè)風(fēng)險(xiǎn)大腦主要在做兩件事:全網(wǎng)的輿情監(jiān)控、全網(wǎng)企業(yè)信息識(shí)別。
“當(dāng)時(shí)我們已經(jīng)能夠通過(guò)全網(wǎng)信息理解一家企業(yè)在做什么,判斷出他們是否在從事非法金融活動(dòng),”回憶起團(tuán)隊(duì)在2019年構(gòu)建的企業(yè)風(fēng)險(xiǎn)大腦,螞蟻數(shù)科安全科技技術(shù)總監(jiān)章鵬如是說(shuō)。
企業(yè)風(fēng)險(xiǎn)大腦,也成了螞蟻蟻盾后來(lái)進(jìn)一步進(jìn)入產(chǎn)業(yè)風(fēng)控領(lǐng)域的開(kāi)端。
四年后的今天,蟻盾已經(jīng)進(jìn)入到金融、出行、大宗貿(mào)易等十?dāng)?shù)個(gè)行業(yè)2000余家企業(yè),開(kāi)始作為copilot,輔助企業(yè)進(jìn)行風(fēng)險(xiǎn)評(píng)估和拓客決策。
01 蟻盾“入仕”三部曲
2019年,螞蟻蟻盾搭建的企業(yè)風(fēng)險(xiǎn)大腦實(shí)際上是面向監(jiān)管部門(mén),為監(jiān)管部門(mén)提供服務(wù)的。
在2020年,當(dāng)螞蟻蟻盾決定將企業(yè)風(fēng)險(xiǎn)大腦的客戶(hù)從政府監(jiān)管部門(mén)擴(kuò)展至企業(yè)時(shí),他們發(fā)現(xiàn),當(dāng)時(shí)市面上已經(jīng)有了一些企業(yè)信息聚合類(lèi)平臺(tái)。
例如2014年成立的企查查和天眼查,這樣的平臺(tái)已經(jīng)初步具備企業(yè)風(fēng)險(xiǎn)評(píng)估能力。
當(dāng)時(shí)螞蟻蟻盾團(tuán)隊(duì)想到的是,要再往前走一步——不僅要做信息聚合,還要做信用逾期風(fēng)險(xiǎn)這樣非常具體的風(fēng)險(xiǎn)評(píng)估。
而這其中的技術(shù)是螞蟻蟻盾團(tuán)隊(duì)在支付寶內(nèi)做風(fēng)控時(shí)就已經(jīng)開(kāi)始在做的事,是他們擅長(zhǎng)的領(lǐng)域。
于是,這一年,當(dāng)有企業(yè)用到螞蟻數(shù)科的企業(yè)風(fēng)險(xiǎn)大腦時(shí),他們會(huì)發(fā)現(xiàn),這一產(chǎn)品除了全網(wǎng)企業(yè)識(shí)別和輿情監(jiān)控外,還融入了工商和司法輿情信息,并對(duì)這些信息做了進(jìn)一步的解讀和穿透,當(dāng)點(diǎn)擊基于這些信息生成的風(fēng)險(xiǎn)標(biāo)簽時(shí),可以看到這一風(fēng)險(xiǎn)的判斷依據(jù)。
信用逾期模型的加入,讓螞蟻蟻盾的企業(yè)風(fēng)險(xiǎn)大腦在進(jìn)入企業(yè)市場(chǎng)時(shí),有了自己的獨(dú)特性,不過(guò),只有這一個(gè)模型,遠(yuǎn)遠(yuǎn)無(wú)法滿(mǎn)足企業(yè)市場(chǎng)的風(fēng)云莫測(cè)。
章鵬發(fā)現(xiàn),在這一產(chǎn)品進(jìn)入市場(chǎng)后,要面對(duì)企業(yè)生產(chǎn)決策中的諸多考量。
“當(dāng)我們只為企業(yè)提供這一個(gè)模型,企業(yè)工作流又是離線(xiàn)運(yùn)行時(shí),企業(yè)很難用起來(lái)。”
基于這樣的考慮,螞蟻蟻盾的企業(yè)風(fēng)險(xiǎn)大腦開(kāi)始向2.0版本演進(jìn),搭建一站式工作臺(tái)的想法也由此萌生。
在這個(gè)過(guò)程中,螞蟻蟻盾團(tuán)隊(duì)不僅從拓客、準(zhǔn)入到監(jiān)控,構(gòu)建起了全鏈路一站式平臺(tái),還通過(guò)搭建授權(quán)鏈路、引入私域數(shù)據(jù),提升模型和決策能力。
與此同時(shí),風(fēng)險(xiǎn)指標(biāo)池、行業(yè)圖譜、交互建模等技術(shù)開(kāi)始被進(jìn)一步引入。
當(dāng)螞蟻蟻盾的企業(yè)風(fēng)險(xiǎn)大腦進(jìn)化為一站式產(chǎn)業(yè)風(fēng)控平臺(tái)時(shí),已經(jīng)與市場(chǎng)上的企業(yè)信息查詢(xún)平臺(tái)的邏輯完全不同,章鵬認(rèn)為,二者至少有以下幾點(diǎn)不同:
第一,我們不只是一個(gè)信息聚合平臺(tái),如今的蟻盾-產(chǎn)業(yè)風(fēng)控平臺(tái)已經(jīng)走向一站式工作臺(tái),所以企業(yè)實(shí)際上已經(jīng)能在這一平臺(tái)上完成諸如獲客、準(zhǔn)入、監(jiān)控等工作;
第二,蟻盾-產(chǎn)業(yè)風(fēng)控平臺(tái)不只基于公開(kāi)數(shù)據(jù),要把企業(yè)風(fēng)險(xiǎn)識(shí)別準(zhǔn),還要引入行業(yè)特征數(shù)據(jù),甚至需要授權(quán)的私域數(shù)據(jù),所以我們可以與企業(yè)生產(chǎn)系統(tǒng)進(jìn)行打通,實(shí)現(xiàn)更精準(zhǔn)的風(fēng)險(xiǎn)識(shí)別;
第三,我們希望和企業(yè)生產(chǎn)系統(tǒng)進(jìn)行更多連接時(shí),企業(yè)一定會(huì)對(duì)我們產(chǎn)品的準(zhǔn)確性、效能有更高要求,因此我們也可以有更多定制,包括開(kāi)放的能力出現(xiàn),包括我們?cè)谧龅臄?shù)據(jù)和知識(shí)的交互式建模。
章鵬認(rèn)為,現(xiàn)在蟻盾擁有的能力相當(dāng)于“信息聚合+一站式工作臺(tái)+與客戶(hù)生產(chǎn)關(guān)系打通”。
這樣的產(chǎn)業(yè)風(fēng)控平臺(tái),嵌入到了企業(yè)事前、事中、事后全流程數(shù)智風(fēng)險(xiǎn)管理工作流中,從而為產(chǎn)業(yè)協(xié)作降低風(fēng)險(xiǎn)、提升效率。
02 數(shù)據(jù)驅(qū)動(dòng)or知識(shí)驅(qū)動(dòng)?
數(shù)據(jù)驅(qū)動(dòng),是消費(fèi)互聯(lián)網(wǎng)體系中的一個(gè)重要策略,然而,當(dāng)進(jìn)入到產(chǎn)業(yè)風(fēng)控領(lǐng)域時(shí),數(shù)據(jù)驅(qū)動(dòng)這條路不再走得通。
“在消費(fèi)互聯(lián)網(wǎng)領(lǐng)域,數(shù)據(jù)足夠多,有數(shù)據(jù)驅(qū)動(dòng)就已經(jīng)足夠了;但在產(chǎn)業(yè)風(fēng)控領(lǐng)域,實(shí)際情況剛好相反——這時(shí)我們往往有很多知識(shí),但卻沒(méi)有足夠多的數(shù)據(jù),”章鵬如是說(shuō)。
如此一來(lái),要想做好產(chǎn)業(yè)風(fēng)控,蟻盾就需要走出一條新路,一條將公域數(shù)據(jù)和私域數(shù)據(jù)有效融合的新路。
知識(shí)交互建模,就是蟻盾在這條路上摸索出來(lái)的一種新范式。
在知識(shí)交互建模范式中,整個(gè)建模過(guò)程被劃分成了客戶(hù)上傳樣本、樣本擴(kuò)充、生成樣本標(biāo)簽、生成行業(yè)模型四步。
章鵬解釋稱(chēng),“在一個(gè)行業(yè)模型真實(shí)建模過(guò)程中,帶標(biāo)簽的樣本其實(shí)很少,因?yàn)橐粋€(gè)企業(yè)運(yùn)營(yíng)系統(tǒng)中的逾期客戶(hù)最多可能也只有三五十個(gè),再多公司就要破產(chǎn)了。
“對(duì)于我們來(lái)說(shuō),如何根據(jù)行業(yè)經(jīng)驗(yàn)(知識(shí))擴(kuò)展樣本標(biāo)簽就成了問(wèn)題的關(guān)鍵。”
據(jù)章鵬介紹,整個(gè)樣本標(biāo)簽擴(kuò)展過(guò)程,又可以分為如下幾步:
首先,需要企業(yè)風(fēng)控人員根據(jù)經(jīng)驗(yàn)給出一定的規(guī)則,并結(jié)合蟻盾積累的行業(yè)模板,形成統(tǒng)一的準(zhǔn)入規(guī)則;
其次,知識(shí)交互建模引擎借助弱監(jiān)督學(xué)習(xí),通過(guò)這些準(zhǔn)確率并不高的規(guī)則,推斷出很多新的企業(yè),并為這些新企業(yè)打標(biāo)簽;
然后,專(zhuān)家根據(jù)新的企業(yè)標(biāo)注,以及標(biāo)簽關(guān)聯(lián)的結(jié)果和原因,對(duì)自動(dòng)打標(biāo)簽的結(jié)果進(jìn)行修正。
最后,通過(guò)專(zhuān)家修正后的標(biāo)簽更新平臺(tái)規(guī)則。
“如此循環(huán)往復(fù),當(dāng)我們擁有足夠多的標(biāo)簽時(shí),我們的建模工作也就完成了一大半。”
章鵬告訴我們,“通過(guò)這樣的知識(shí)交互建模方式,我們幫某個(gè)客戶(hù)將樣本標(biāo)簽擴(kuò)展了5倍,AUC模型性能從60%提升到了85%,建模周期也從原來(lái)的數(shù)月縮短到了一周。”
03 平臺(tái)構(gòu)建的“二八定律”
時(shí)至今日,蟻盾已經(jīng)是螞蟻集團(tuán)安全科技商業(yè)化品牌,對(duì)外提供包含身份安全、交易安全、合規(guī)安全等全鏈路風(fēng)控產(chǎn)品和服務(wù)。
在2023年云棲大會(huì)上,蟻盾正式對(duì)外發(fā)布了“知識(shí)交互建模引擎”,通過(guò)將實(shí)體產(chǎn)業(yè)知識(shí)與AI模型有機(jī)結(jié)合,最快10分鐘就能為企業(yè)定制自主可控的垂直領(lǐng)域AI風(fēng)控引擎。
目前,這一引擎已經(jīng)面向大宗商品行業(yè)開(kāi)始落地測(cè)試。
蟻盾產(chǎn)品負(fù)責(zé)人李莎指出,“從最開(kāi)始做一個(gè)通用平臺(tái)給到某個(gè)具體客戶(hù),到客戶(hù)提出更多功能需求,我們的算法團(tuán)隊(duì)進(jìn)而幫客戶(hù)做定制化需求的不斷往復(fù),我們現(xiàn)在依然處在一個(gè)從定制化產(chǎn)品向通用化產(chǎn)品轉(zhuǎn)型過(guò)程中。”
“未來(lái),我們期望的是80%的客戶(hù)需求能夠直接由我們通用平臺(tái)中已有的能力得到滿(mǎn)足,另外20%需要定制化的功能,我們會(huì)開(kāi)放出來(lái),由我們的合作伙伴來(lái)完成。”
不過(guò),李莎也坦言,“我們現(xiàn)在還處于將我們通用平臺(tái)的能力從能夠滿(mǎn)足客戶(hù)50%的需求提高到80%的過(guò)程中。”
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專(zhuān)家搜索方法,讓AI能根據(jù)不同問(wèn)題靈活調(diào)整內(nèi)部專(zhuān)家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類(lèi)型問(wèn)題偏愛(ài)不同專(zhuān)家配置,為AI推理優(yōu)化開(kāi)辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過(guò)"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話(huà)多且準(zhǔn)確率低"的問(wèn)題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開(kāi)發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過(guò)滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問(wèn)題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開(kāi)辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過(guò)讓AI模型學(xué)習(xí)解決幾何問(wèn)題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來(lái)顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。
關(guān)注智造、硬件、機(jī)器人。