在剛剛舉行的2016年百度世界上,除了李彥宏的主題演講,還有一位讓很多人感到意外的嘉賓現(xiàn)身,為這場技術大秀添加了一份驚喜。百度錢包代言人、著名演員胡歌與李彥宏同臺為現(xiàn)場觀眾展示了一段“百度大腦”核心能力——用戶畫像能力。
“你的粉絲都是一些什么樣的人,我們覺得你一定也很關心。”李彥宏告訴胡歌,通過大量的用戶行為數(shù)據(jù),百度大腦能夠描繪出他的粉絲群體的基本特點,“我其實還是有一點驚訝,本來以為(喜歡)影視音樂(的人)應該是最大的群體,但是我們看到像旅游出行、網(wǎng)絡購物這些都是你粉絲群體特別特別喜歡的東西。”李彥宏表示,基于數(shù)億用戶各種各樣的標簽獲得的群體畫像,還是比較可信的。
關于這項能力的基礎,李彥宏介紹,“用戶畫像是基于百度大數(shù)據(jù)、機器學習獲得的能力?,F(xiàn)在我們已經(jīng)有接近十億的用戶畫像,對于他們的識別,我們已經(jīng)細分到1000萬級細分標簽,這些標簽在兩個維度上體現(xiàn),一個是通用維度,也有一些垂直行業(yè)的特征。”李彥宏提出,用戶畫像能力對于了解用戶喜好、提升用戶粘性非常重要,因為“我知道你是一個什么人,喜歡看什么樣的東西”。李彥宏告訴大家,在過去兩個月中,手機百度資訊的推薦用戶量有10倍的增長,這種增長背后正是以用戶興趣、喜好為依據(jù)進行的個性化新聞推薦,“它可以做到千人千面,其實準確的講不是千人千面,而是萬人萬面,億人億面,每一個人對于百度來說都是不同的個體,每一個人看到的信息都是不一樣的。”他說。
除了為胡歌定制了粉絲群體畫像之外,李彥宏還分享了百度與電影《魔獸》制作方合作,利用用戶畫像提升電影票房的案例。“這個做法很聰明,他把人群分成三類,一類人是不管怎樣都要看的,另外一類是不管怎樣都不會看的。這兩類他都不太關心,關心的是他可以影響的人群,通過用戶畫像把這些人群從搖擺變成去看電影。”李彥宏告訴大家,用戶畫像能力為《魔獸》帶來了200%的票房提升,讓制作方驚喜不已。
對于用戶畫像能力的應用空間,李彥宏表示,這還需要各行各業(yè)共同思考、探索,“我個人的想象力很有限,整個百度幾萬人想象力也是有限的,但是這些能力如果賦予很多很多人、幾億人、幾十億人,這個可能性幾乎是無限的。”
好文章,需要你的鼓勵
浙江大學團隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學、編程等任務上顯著提升推理準確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學研究團隊提出SIRI方法,通過"壓縮-擴張"交替訓練策略,成功解決了大型推理模型"話多且準確率低"的問題。實驗顯示,該方法在數(shù)學競賽題上將模型準確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓練提供了新思路。
南洋理工大學與騰訊聯(lián)合研究團隊開發(fā)出Rolling Forcing技術,實現(xiàn)AI視頻實時流式生成的重大突破。該技術通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學研究團隊發(fā)現(xiàn),通過讓AI模型學習解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強化學習方法訓練多個AI模型。實驗結(jié)果顯示,幾何訓練在四個空間智能測試基準上都帶來顯著提升,其中最佳模型達到49.6%準確率,超越此前最好成績。這項研究揭示了基礎幾何知識對培養(yǎng)AI空間智能的重要價值。