億次。”
阿里巴巴高級(jí)技術(shù)專家 羅金鵬
4月20日, UBDC全域大數(shù)據(jù)峰會(huì)·2016上,阿里巴巴公共數(shù)據(jù)平臺(tái)負(fù)責(zé)人羅金鵬首次對(duì)外披露了在阿里中臺(tái)戰(zhàn)略下,如何推動(dòng)數(shù)據(jù)中臺(tái)落地的個(gè)中細(xì)節(jié)。
據(jù)悉,中臺(tái)戰(zhàn)略是阿里巴巴于2015年底首次提出。作為阿里中臺(tái)戰(zhàn)略的核心之一——數(shù)據(jù)中臺(tái)旨在對(duì)內(nèi)提供數(shù)據(jù)基礎(chǔ)建設(shè)和統(tǒng)一的數(shù)據(jù)服務(wù),對(duì)外提供服務(wù)商家的數(shù)據(jù)產(chǎn)品。
OneData是阿里數(shù)據(jù)中臺(tái)的核心,羅金鵬介紹,OneData體系建立的集團(tuán)數(shù)據(jù)公共層,從設(shè)計(jì)、開(kāi)發(fā)、部署和使用上保障了數(shù)據(jù)口徑的規(guī)范和統(tǒng)一,實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)全鏈路管理,提供標(biāo)準(zhǔn)數(shù)據(jù)輸出。
統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)是一項(xiàng)非常復(fù)雜的工作,譬如,針對(duì)UV這一相同的指標(biāo),在統(tǒng)一之前阿里內(nèi)部竟然有10多種數(shù)據(jù)定義。據(jù)介紹,OneData數(shù)據(jù)公共層總共對(duì)30000多個(gè)數(shù)據(jù)指標(biāo)進(jìn)行了口徑的規(guī)范和統(tǒng)一,梳理后縮減為3000余個(gè)。
盡管工程浩大,但是此舉卻為阿里帶來(lái)了顯著的收效。借助于OneData平臺(tái)實(shí)時(shí)數(shù)據(jù)分析能力,在2015年雙11當(dāng)天,淘寶搜索排序中引入實(shí)時(shí)數(shù)據(jù)影響因子,實(shí)現(xiàn)增收數(shù)十億元,羅金鵬表示。
在DT時(shí)代,數(shù)據(jù)暴增對(duì)存儲(chǔ)計(jì)算成本帶來(lái)很大的挑戰(zhàn)。據(jù)羅金鵬介紹在沒(méi)有建設(shè)統(tǒng)一的數(shù)據(jù)公共層時(shí),阿里內(nèi)部服務(wù)器需求量會(huì)在5年之后達(dá)到現(xiàn)在的100倍之多。而經(jīng)過(guò)數(shù)據(jù)公共層的統(tǒng)一建設(shè),5年后的服務(wù)器需求量相對(duì)會(huì)節(jié)約90%。
此外,阿里基于數(shù)據(jù)中臺(tái)孵化了一個(gè)內(nèi)部名叫“GProfile”全域用戶檔案的標(biāo)簽服務(wù)。“GProfile”根據(jù)用戶行為,打上不同的標(biāo)簽,再推薦與買(mǎi)家消費(fèi)能力和喜好匹配的商品?;诖嗣總€(gè)用戶在手機(jī)淘寶上搜索“連衣裙”,每個(gè)人看到的搜索結(jié)果都是不一樣。
千人千面的個(gè)性化服務(wù)背后的數(shù)據(jù)基礎(chǔ)就是“GProfile”。據(jù)羅金鵬的介紹,目前標(biāo)簽有300多種,如此多的標(biāo)簽,都是為了更精準(zhǔn)地定位用戶,從而實(shí)現(xiàn)更好的用戶體驗(yàn)與精準(zhǔn)營(yíng)銷。
除對(duì)內(nèi)挖掘數(shù)據(jù)的價(jià)值,用技術(shù)驅(qū)動(dòng)和創(chuàng)新內(nèi)部的業(yè)務(wù),阿里數(shù)據(jù)同時(shí)也將數(shù)據(jù)能力通過(guò)產(chǎn)品對(duì)外服務(wù)。而這一產(chǎn)品即是“生意參謀”,為商家提供多維度的數(shù)據(jù)服務(wù),幫助商家通過(guò)數(shù)據(jù)分析來(lái)進(jìn)行商業(yè)決策。
羅金鵬告訴記者,生意參謀可以用數(shù)據(jù)化來(lái)貫穿到企業(yè)管理的整體鏈路中,包括了,品類管理數(shù)據(jù)化、營(yíng)銷數(shù)據(jù)化、品牌數(shù)據(jù)化以及服務(wù)數(shù)據(jù)化。
據(jù)悉到目前為止,生意參謀已經(jīng)為千萬(wàn)商家服務(wù),月成交額30萬(wàn)元以上的商家中,逾90%在使用生意參謀;月成交金額100萬(wàn)元以上的商家中,逾90%每月登錄生意參謀天次達(dá)20次以上。
在DT時(shí)代,數(shù)據(jù)已經(jīng)成為推動(dòng)商業(yè)發(fā)展的新能源,而數(shù)據(jù)中臺(tái)的建設(shè)成為新能源能否在阿里巴巴生態(tài)中發(fā)揮價(jià)值的關(guān)鍵。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專家搜索方法,讓AI能根據(jù)不同問(wèn)題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問(wèn)題偏愛(ài)不同專家配置,為AI推理優(yōu)化開(kāi)辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過(guò)"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問(wèn)題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開(kāi)發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過(guò)滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問(wèn)題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開(kāi)辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過(guò)讓AI模型學(xué)習(xí)解決幾何問(wèn)題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來(lái)顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。