av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

<abbr id="ihbto"></abbr>

微信掃一掃，關(guān)注公眾號

科技行者
算力行者

見證連接與計算的「力量」

微軟讓AI學(xué)會"畫像"用戶：推薦系統(tǒng)變身貼心管家的秘密武器

推薦系統(tǒng)用戶畫像大型語言模型

微軟讓AI學(xué)會"畫像"用戶：推薦系統(tǒng)變身貼心管家的秘密武器

作者：科技行者

2025-06-26 10:12

分享至：

微軟研究團(tuán)隊開發(fā)了LettinGo框架，通過讓AI用自然語言生成用戶畫像來改進(jìn)推薦系統(tǒng)。該方法分三步：多模型探索生成多樣化用戶檔案，通過實際推薦效果評估檔案質(zhì)量，最后用偏好對齊技術(shù)訓(xùn)練專門的檔案生成器。在三個主要數(shù)據(jù)集上的實驗顯示，相比傳統(tǒng)方法平均準(zhǔn)確率提升20個百分點(diǎn)，且生成的檔案更靈活、可解釋性更強(qiáng)。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2025-06-26 10:12 ? 科技行者

這項由微軟公司研究團(tuán)隊在2025年6月發(fā)表于第31屆ACM SIGKDD知識發(fā)現(xiàn)與數(shù)據(jù)挖掘會議的研究，為我們揭示了一個有趣的現(xiàn)象：如何讓計算機(jī)更好地理解我們每個人的獨(dú)特喜好。該研究的完整論文可通過DOI https://doi.org/10.1145/3711896.3737024 獲取，有興趣深入了解的讀者可以訪問該鏈接查看詳細(xì)內(nèi)容。

在這個信息爆炸的時代，我們每天都會收到各種各樣的推薦：網(wǎng)購平臺推薦商品、視頻網(wǎng)站推薦電影、音樂軟件推薦歌曲。但你有沒有想過，這些推薦系統(tǒng)是如何知道你喜歡什么的？就像一個剛認(rèn)識你的朋友，需要通過各種方式了解你的性格和喜好一樣，推薦系統(tǒng)也需要為每個用戶建立一個"檔案"——這就是用戶畫像。

傳統(tǒng)的用戶畫像就像是一張沒有表情的面具，只有冰冷的數(shù)字和符號，既看不懂又不能靈活調(diào)整。微軟的研究團(tuán)隊想要解決的正是這個問題：如何讓用戶畫像變得更加生動、準(zhǔn)確，就像一幅栩栩如生的肖像畫，能夠真實反映每個人的獨(dú)特品味和偏好？

研究團(tuán)隊開發(fā)了一個名為"LettinGo"的創(chuàng)新框架，這個名字寓意著"放手讓AI自由探索"。與傳統(tǒng)方法不同，LettinGo不會強(qiáng)迫AI按照固定的模板來描述用戶，而是讓它自由發(fā)揮，用最自然的語言來"畫出"每個用戶的喜好輪廓。就好比從標(biāo)準(zhǔn)化的證件照片升級到個性化的寫實肖像畫，每一筆都充滿了個人特色。

這項研究的突破性意義在于，它首次將大型語言模型的創(chuàng)造力與推薦系統(tǒng)的實用性完美結(jié)合。過去，推薦系統(tǒng)就像是一個只會按部就班的機(jī)器人，現(xiàn)在它變成了一個既有洞察力又有表達(dá)能力的智能助手。研究團(tuán)隊通過在三個主要數(shù)據(jù)集上的實驗證明，這種新方法不僅讓推薦更準(zhǔn)確，還讓整個系統(tǒng)變得更加靈活和智能。

一、傳統(tǒng)用戶畫像的局限：為什么需要變革

如果把推薦系統(tǒng)比作一家定制服裝店，那么用戶畫像就相當(dāng)于每個顧客的身材檔案。傳統(tǒng)的用戶畫像就像是只記錄身高體重這些基本數(shù)據(jù)的簡單表格，雖然能提供一些參考，但無法真正了解顧客的穿衣風(fēng)格、色彩偏好或者特殊需求。

過去幾十年里，推薦系統(tǒng)主要依靠數(shù)字向量來表示用戶偏好。這些向量就像是用一串密碼來描述一個人的性格，只有計算機(jī)能看懂，人類完全無法理解其含義。這種方法有幾個顯著的問題。

首先是透明度問題。當(dāng)系統(tǒng)向你推薦某個商品時，你完全不知道它為什么這樣推薦。就像一個朋友突然給你推薦一部電影，但完全不告訴你理由，這樣的推薦往往讓人感覺莫名其妙。其次是適應(yīng)性問題。數(shù)字向量一旦生成就很難修改，特別是當(dāng)用戶的興趣發(fā)生變化或者遇到新用戶時，系統(tǒng)往往束手無策。這就像一件訂制的衣服，一旦做好就很難再改尺寸。

更重要的是，傳統(tǒng)方法很難捕捉用戶行為的復(fù)雜性和動態(tài)變化?，F(xiàn)實中，一個人的喜好往往受到心情、季節(jié)、生活狀態(tài)等多種因素影響。比如，同一個人可能在工作日喜歡聽輕音樂，周末卻偏愛搖滾樂；夏天喜歡清爽的電影，冬天卻想看溫馨的家庭片。傳統(tǒng)的數(shù)字向量很難捕捉這種細(xì)微的變化和復(fù)雜的偏好模式。

近年來，大型語言模型的興起為解決這些問題帶來了新的希望。這些模型就像是擁有豐富詞匯和表達(dá)能力的作家，能夠用自然語言來描述復(fù)雜的概念和細(xì)微的差別。研究團(tuán)隊意識到，如果能讓這些"AI作家"來為用戶寫"性格檔案"，或許能創(chuàng)造出更加生動、準(zhǔn)確和靈活的用戶畫像。

然而，直接讓大型語言模型處理用戶的全部歷史行為數(shù)據(jù)也有問題。就像讓一個人一次性閱讀一個人的全部日記一樣，信息量太大反而會讓模型"消化不良"，導(dǎo)致重要信息被忽略或者被噪音干擾。研究數(shù)據(jù)顯示，當(dāng)輸入的歷史行為數(shù)據(jù)過長時，推薦性能不但不會提升，反而會下降。這說明我們需要一種更智能的方法來處理和利用用戶數(shù)據(jù)。

二、LettinGo框架：三步走的創(chuàng)新策略

面對傳統(tǒng)方法的種種局限，微軟研究團(tuán)隊設(shè)計了LettinGo框架，這是一個分三個階段循序漸進(jìn)的系統(tǒng)。整個過程就像培養(yǎng)一位優(yōu)秀的人像畫家：首先讓多位畫家從不同角度觀察同一個模特，然后比較各幅作品的質(zhì)量，最后訓(xùn)練出能夠畫出最佳作品的頂級畫家。

第一階段是"檔案探索"階段。研究團(tuán)隊不依賴單一的AI模型，而是召集了多個不同的大型語言模型，包括GPT-4o-mini、Claude以及LLaMA系列模型。每個模型都會根據(jù)用戶的歷史行為數(shù)據(jù)生成多份不同的用戶檔案。這就像邀請多位不同風(fēng)格的畫家來為同一個人畫像，有的畫家注重細(xì)節(jié)，有的善于捕捉神韻，有的擅長色彩搭配。通過這種"群策群力"的方式，系統(tǒng)能夠產(chǎn)生各種各樣的用戶描述，從不同角度展現(xiàn)用戶的特點(diǎn)和偏好。

為了增加描述的多樣性，研究團(tuán)隊還特意調(diào)高了模型的"創(chuàng)造性參數(shù)"（溫度設(shè)置為1.0），這就像是鼓勵畫家們放開手腳，不要拘泥于傳統(tǒng)套路，盡情發(fā)揮自己的想象力和創(chuàng)造力。這樣產(chǎn)生的用戶檔案在格式、內(nèi)容和表達(dá)方式上都會有很大差異，為后續(xù)的篩選和優(yōu)化提供了豐富的素材。

第二階段是"質(zhì)量評估"階段。生成了眾多用戶檔案之后，關(guān)鍵問題是如何判斷哪些檔案質(zhì)量更高。研究團(tuán)隊采用了一種巧妙的間接評估方法：讓這些檔案在實際的推薦任務(wù)中"接受考驗"。

具體來說，系統(tǒng)會將每個用戶檔案與用戶的近期行為數(shù)據(jù)結(jié)合起來，然后嘗試預(yù)測用戶對某個特定商品或內(nèi)容的喜好。這就像是讓畫家們的作品參加一場實用性測試：哪幅畫像能幫助銷售員更準(zhǔn)確地向顧客推薦商品，哪幅就是更好的作品。

這種評估方法的精妙之處在于，它不需要人工標(biāo)注什么是"好的"用戶檔案，而是通過實際應(yīng)用效果來自動判斷。如果一個用戶檔案能幫助系統(tǒng)做出準(zhǔn)確的推薦預(yù)測，那它就是高質(zhì)量的；如果預(yù)測失敗，那這個檔案可能就沒有很好地捕捉到用戶的真實偏好。

通過這種方法，研究團(tuán)隊為每個用戶檔案打分，并將它們分成"優(yōu)秀檔案"和"普通檔案"兩類。這樣就形成了寶貴的訓(xùn)練數(shù)據(jù)：我們知道了什么樣的用戶描述是有效的，什么樣的是無效的。

第三階段是"偏好對齊"階段。有了前兩個階段的鋪墊，現(xiàn)在可以訓(xùn)練一個專門的"檔案生成師"了。這個階段的目標(biāo)是讓AI學(xué)會自動生成高質(zhì)量的用戶檔案，而不需要每次都召集一群模型來"群策群力"。

訓(xùn)練過程采用了一種叫做"直接偏好優(yōu)化"（DPO）的先進(jìn)技術(shù)。這種方法就像是給AI展示許多對比案例：這是一個好的用戶描述，那是一個不太好的描述。通過不斷學(xué)習(xí)這些對比案例，AI逐漸掌握了什么樣的用戶檔案才是真正有用的。

與傳統(tǒng)的訓(xùn)練方法相比，這種方法的優(yōu)勢在于它不會強(qiáng)迫AI按照固定的格式或模板來生成用戶檔案。就像培養(yǎng)一個真正有天賦的畫家，重要的不是讓他臨摹標(biāo)準(zhǔn)的畫法，而是讓他理解什么樣的作品能夠真正打動觀眾。通過這種靈活的訓(xùn)練方式，最終得到的檔案生成器既能保持創(chuàng)造性和多樣性，又能確保生成的檔案對實際應(yīng)用真正有用。

三、技術(shù)實現(xiàn)的精妙細(xì)節(jié)

LettinGo框架的成功不僅在于整體設(shè)計思路，更在于許多精妙的技術(shù)細(xì)節(jié)。這些細(xì)節(jié)就像一道精致菜肴中的各種調(diào)料，每一樣都不可或缺，共同成就了最終的美味。

在數(shù)據(jù)處理方面，研究團(tuán)隊采用了一種巧妙的"長短結(jié)合"策略。他們將用戶的行為歷史分成兩部分：長期歷史和近期歷史。長期歷史就像是一個人的性格底色，包含了用戶長期穩(wěn)定的興趣偏好，用于生成用戶檔案。近期歷史則反映了用戶當(dāng)前的關(guān)注焦點(diǎn)和臨時興趣，在做推薦預(yù)測時與用戶檔案一起使用。

這種設(shè)計的智慧在于平衡了穩(wěn)定性和靈活性。長期歷史幫助系統(tǒng)理解用戶的核心偏好，就像了解一個人的基本性格；近期歷史則捕捉用戶興趣的最新變化，就像察覺一個人當(dāng)下的心情。兩者結(jié)合，既避免了推薦過于保守（只基于長期歷史），也避免了過于隨意（只看近期行為）。

在檔案生成的提示設(shè)計上，研究團(tuán)隊采用了一種"開放式引導(dǎo)"的方法。與其給AI一個嚴(yán)格的模板要求它"按格式填空"，不如給它一個明確的目標(biāo)，然后讓它自由發(fā)揮。提示詞就像是給畫家的創(chuàng)作要求："請為這個用戶畫一幅能幫助我們理解其喜好的肖像"，而不是"請按照標(biāo)準(zhǔn)格式填寫用戶信息表"。

這種開放性設(shè)計讓不同的AI模型能夠發(fā)揮各自的特長。有些模型可能更善于分析用戶的情感傾向，生成富有感情色彩的描述；有些模型可能更擅長邏輯分析，生成結(jié)構(gòu)化的偏好總結(jié)；還有些模型可能善于捕捉細(xì)節(jié)，生成詳細(xì)而具體的興趣列表。這種多樣性為后續(xù)的質(zhì)量評估和優(yōu)化提供了豐富的選擇空間。

在質(zhì)量評估環(huán)節(jié)，研究團(tuán)隊設(shè)計了一個巧妙的"成對比較"機(jī)制。對于每個用戶，系統(tǒng)不是簡單地給每個檔案打一個絕對分?jǐn)?shù)，而是通過實際推薦效果將檔案分成"好"和"不好"兩類，然后形成成對的對比數(shù)據(jù)。這就像是組織一場畫作評比，不是要求評委給每幅畫打具體分?jǐn)?shù)，而是讓他們在兩幅畫之間做選擇：哪一幅更好？

這種設(shè)計的好處是避免了絕對評分的主觀性和不一致性。在實際應(yīng)用中，我們往往并不需要知道一個檔案的絕對質(zhì)量分?jǐn)?shù)，只需要知道它比另一個檔案好還是差就足夠了。這種相對比較的方法更加穩(wěn)定可靠，也更適合機(jī)器學(xué)習(xí)算法的需求。

在模型訓(xùn)練階段，直接偏好優(yōu)化（DPO）技術(shù)的應(yīng)用是整個框架的核心創(chuàng)新之一。傳統(tǒng)的監(jiān)督學(xué)習(xí)就像是給學(xué)生一堆標(biāo)準(zhǔn)答案讓他們背誦，而DPO更像是讓學(xué)生在多個選項中學(xué)會判斷哪個更好。這種方法的優(yōu)勢在于它不會限制AI的創(chuàng)造性，同時確保生成的內(nèi)容符合實際需求。

DPO的工作原理可以這樣理解：系統(tǒng)會同時看到一個好的用戶檔案和一個不太好的用戶檔案，然后學(xué)習(xí)如何提高生成好檔案的概率，降低生成差檔案的概率。這個過程不斷重復(fù)，直到AI能夠穩(wěn)定地生成高質(zhì)量的用戶檔案。

四、實驗驗證：三大數(shù)據(jù)集的全面測試

為了驗證LettinGo框架的有效性，研究團(tuán)隊在三個具有代表性的數(shù)據(jù)集上進(jìn)行了全面的實驗測試。這三個數(shù)據(jù)集就像三個不同的考場，分別考察系統(tǒng)在不同應(yīng)用場景下的表現(xiàn)能力。

第一個測試場景是電影推薦，使用的是著名的MovieLens-10M數(shù)據(jù)集。這個數(shù)據(jù)集包含了超過7萬用戶對1萬多部電影的評分?jǐn)?shù)據(jù)，是推薦系統(tǒng)研究領(lǐng)域的經(jīng)典測試平臺。電影推薦的特點(diǎn)是用戶偏好相對穩(wěn)定但又充滿個性化差異，有些人喜歡動作片，有些人偏愛文藝片，還有些人的口味很雜。LettinGo在這個數(shù)據(jù)集上的表現(xiàn)驗證了它處理娛樂內(nèi)容推薦的能力。

第二個測試場景是商品推薦，使用的是Amazon Books數(shù)據(jù)集。這個數(shù)據(jù)集記錄了185萬用戶對48萬本圖書的購買和評價行為。圖書推薦比電影推薦更具挑戰(zhàn)性，因為圖書的屬性更加復(fù)雜多樣，用戶的閱讀偏好也更難預(yù)測。一個人可能既喜歡科幻小說，又對歷史書籍感興趣，還會偶爾閱讀專業(yè)技術(shù)書籍。這種復(fù)雜性正好測試了LettinGo生成細(xì)致用戶檔案的能力。

第三個測試場景是本地服務(wù)推薦，使用的是Yelp數(shù)據(jù)集。這個數(shù)據(jù)集包含了近2萬用戶對2.2萬家本地商戶的評價信息，涵蓋餐廳、商店、娛樂場所等各類服務(wù)。本地服務(wù)推薦的特殊性在于它不僅涉及用戶的基本偏好，還與地理位置、消費(fèi)習(xí)慣、生活方式等因素密切相關(guān)。這為LettinGo的適應(yīng)性和靈活性提出了更高要求。

為了確保實驗的公平性和可靠性，研究團(tuán)隊采用了嚴(yán)格的數(shù)據(jù)處理方法。他們只選擇了歷史行為記錄超過70次的用戶，確保有足夠的數(shù)據(jù)來生成有意義的用戶檔案。測試集的構(gòu)建也很講究：隨機(jī)選擇了2000個用戶的最近一次行為作為預(yù)測目標(biāo)，用之前的行為數(shù)據(jù)來生成用戶檔案。

實驗結(jié)果令人印象深刻。在所有三個數(shù)據(jù)集上，LettinGo都顯著超越了傳統(tǒng)基線方法。具體來說，與僅使用最近10次行為記錄的簡單方法相比，LettinGo的準(zhǔn)確率平均提升了20個百分點(diǎn)。這樣的提升幅度在推薦系統(tǒng)領(lǐng)域是相當(dāng)可觀的，意味著用戶能夠收到更加精準(zhǔn)和滿意的推薦。

更重要的是，實驗還揭示了一些有趣的發(fā)現(xiàn)。比如，研究團(tuán)隊發(fā)現(xiàn)，用于生成用戶檔案的歷史行為長度并不是越長越好。在某個臨界點(diǎn)之后，過長的歷史記錄反而會引入噪音，降低推薦效果。這就像做菜時添加調(diào)料一樣，適量的調(diào)料能提升味道，但過多的調(diào)料會掩蓋食材本身的鮮美。

實驗還顯示，不同數(shù)據(jù)集的最佳歷史長度有所不同。MovieLens數(shù)據(jù)集上30條歷史記錄就足夠了，而Amazon Books數(shù)據(jù)集可能需要50-70條歷史記錄才能達(dá)到最佳效果。這種差異反映了不同應(yīng)用場景的特殊性：電影偏好相對簡單直接，而圖書偏好更加復(fù)雜多樣，需要更多的歷史信息才能準(zhǔn)確把握。

五、消融實驗：驗證每個組件的價值

為了深入理解LettinGo框架中每個組件的作用，研究團(tuán)隊進(jìn)行了詳細(xì)的消融實驗。這些實驗就像是拆解一臺精密機(jī)器，逐一檢查每個零件的功能，確保我們真正理解成功的原因。

首先測試的是直接偏好優(yōu)化（DPO）技術(shù)的效果。研究團(tuán)隊比較了使用DPO訓(xùn)練的模型與使用傳統(tǒng)監(jiān)督學(xué)習(xí)訓(xùn)練的模型，結(jié)果顯示DPO帶來了顯著的性能提升。在MovieLens數(shù)據(jù)集上，DPO使準(zhǔn)確率提升了2.1%；在Yelp數(shù)據(jù)集上提升了4.2%；在Amazon Books數(shù)據(jù)集上的提升最為顯著，達(dá)到了6.7%。

這些數(shù)字背后的含義很重要。DPO不僅僅是一種訓(xùn)練技巧，它代表了一種全新的學(xué)習(xí)理念：讓AI在比較中學(xué)習(xí)，而不是通過記憶標(biāo)準(zhǔn)答案來學(xué)習(xí)。這種方法讓AI能夠理解什么樣的用戶描述真正有用，而不是簡單地模仿某種固定格式。

接下來測試的是歷史行為長度對性能的影響。研究團(tuán)隊分別使用30、50、70條歷史記錄來生成用戶檔案，然后比較推薦效果。結(jié)果發(fā)現(xiàn)，不同數(shù)據(jù)集的最優(yōu)長度確實不同，這驗證了我們之前提到的"調(diào)料適量"原則。

有趣的是，實驗還發(fā)現(xiàn)了一個"邊際遞減"現(xiàn)象：從30條增加到50條記錄時，性能提升明顯；但從50條增加到70條時，提升就不那么顯著了。這種現(xiàn)象在經(jīng)濟(jì)學(xué)中很常見，說明信息的價值存在飽和點(diǎn)，超過這個點(diǎn)后，額外的信息帶來的收益就很有限了。

研究團(tuán)隊還測試了不同類型的基線方法，以確保LettinGo的優(yōu)勢是實質(zhì)性的而不是偶然的。他們比較了直接使用長歷史記錄的方法（KAR）、其他基于大型語言模型的用戶建模方法（RLMRec、PALR）等。在所有比較中，LettinGo都表現(xiàn)出明顯的優(yōu)勢，特別是在Amazon數(shù)據(jù)集上，LettinGo的準(zhǔn)確率達(dá)到66.30%，F(xiàn)1分?jǐn)?shù)達(dá)到69.04%，遠(yuǎn)超其他方法。

為了驗證框架的通用性，研究團(tuán)隊還測試了LettinGo在不同模型架構(gòu)上的表現(xiàn)。除了LLaMA系列模型，他們還在Qwen2.5模型上進(jìn)行了驗證。結(jié)果顯示，LettinGo的改進(jìn)是普遍性的，不依賴于特定的模型架構(gòu)。這說明這種方法具有很好的可移植性和實用價值。

最后，研究團(tuán)隊還與頂級的商業(yè)模型進(jìn)行了比較。他們使用GPT-4o來生成用戶檔案，然后與LettinGo生成的檔案進(jìn)行對比。結(jié)果顯示，LettinGo訓(xùn)練出的專用模型（53.00%準(zhǔn)確率）甚至略微超過了GPT-4o（52.80%準(zhǔn)確率）。這個結(jié)果特別有意義，因為它說明通過專門的訓(xùn)練和優(yōu)化，開源模型完全可以在特定任務(wù)上達(dá)到甚至超過最先進(jìn)商業(yè)模型的水平。

六、案例分析：看看AI如何"畫像"用戶

為了更直觀地理解LettinGo的工作效果，讓我們看看它實際生成的用戶檔案是什么樣的。研究團(tuán)隊在論文中展示了幾個具體案例，這些案例就像是AI畫家的作品集，展現(xiàn)了不同領(lǐng)域中用戶檔案的多樣性和生動性。

在電影推薦場景中，LettinGo為一位用戶生成的檔案是這樣的："這是一個內(nèi)心浪漫的觀眾，對探索人性深度的電影有著強(qiáng)烈的偏好，特別喜歡戲劇、愛情和喜劇類型。他們傾向于欣賞情感共鳴強(qiáng)烈、角色驅(qū)動的故事，經(jīng)常被復(fù)雜角色和細(xì)膩敘事所吸引。雖然他們可能不太熱衷于動作大片，但偶爾也會欣賞一部好的冒險電影。這位用戶很可能喜歡那些平衡幽默與真情的電影，并且特別關(guān)注探討愛情、家庭和個人成長主題的故事。"

這段描述就像是一個細(xì)致的人物畫像，不僅指出了用戶的基本偏好（戲劇、愛情、喜?。?，還深入分析了偏好背后的心理動機(jī)（情感共鳴、角色驅(qū)動）。更重要的是，它還注意到了用戶偏好的復(fù)雜性和例外情況（偶爾也喜歡冒險電影），這種細(xì)致入微的觀察是傳統(tǒng)數(shù)字向量完全無法提供的。

在圖書推薦場景中，系統(tǒng)為另一位用戶生成的檔案展現(xiàn)了完全不同的風(fēng)格："這位讀者是動作冒險故事的愛好者，特別喜歡融合科幻、奇幻和冒險元素的作品。他們傾向于閱讀大型系列作品，比如《星球大戰(zhàn)》、《分裂細(xì)胞》、《守望先鋒》等。這位用戶還對基于流行游戲改編的書籍情有獨(dú)鐘，比如《殺出重圍》和《羞辱》系列。他們似乎欣賞多種類型的混合，包括文學(xué)小說、科幻、奇幻和驚悚小說。用戶的評價通常比較積極，對系列作品或與更大宇宙有強(qiáng)烈敘事聯(lián)系的書籍有特別的好感。"

這個檔案不僅識別出了用戶的核心興趣（科幻奇幻），還發(fā)現(xiàn)了一個有趣的特點(diǎn)：偏愛系列作品和游戲改編書籍。這種深層次的偏好模式是通過分析大量歷史數(shù)據(jù)才能發(fā)現(xiàn)的，展現(xiàn)了LettinGo在模式識別方面的強(qiáng)大能力。

在本地服務(wù)推薦場景中，系統(tǒng)生成的用戶檔案更加結(jié)構(gòu)化和實用："興趣點(diǎn)包括：快餐（如In-N-Out漢堡、溫迪漢堡）、墨西哥菜（如Cal Taco、Lilly's Tacos等）、漢堡（如溫迪、In-N-Out漢堡、Rockfire Grill）等。偏好菜系：墨西哥菜、新美式料理。情感分析顯示：用戶對大多數(shù)商家態(tài)度中性，只有少數(shù)例外。他們對提供墨西哥菜、漢堡和日式料理的商家有強(qiáng)烈的正面情感。預(yù)測性洞察：用戶很可能對提供墨西哥菜、漢堡或日式料理的新商家持積極態(tài)度，也很可能對有夜生活元素的新商家（如酒吧或啤酒廠）感興趣。"

這個檔案的特點(diǎn)是高度實用和具體。它不僅總結(jié)了用戶的基本偏好，還提供了預(yù)測性的建議，這對實際的商業(yè)應(yīng)用非常有價值。同時，它的結(jié)構(gòu)化程度較高，便于系統(tǒng)處理和使用。

研究團(tuán)隊還展示了一個特別有意思的案例，說明用戶檔案如何幫助改善推薦效果。在這個案例中，系統(tǒng)最初僅基于用戶最近的10次行為記錄，錯誤地預(yù)測用戶會不喜歡《玩具總動員2》。但當(dāng)加入LettinGo生成的用戶檔案后，系統(tǒng)成功地預(yù)測出用戶會喜歡這部電影。

分析這個案例，我們可以看到用戶檔案起到了關(guān)鍵的補(bǔ)充作用。檔案中提到用戶"喜歡輕松幽默的喜劇"和"對經(jīng)典電影有很高的欣賞度"，這些信息在短期行為記錄中可能不夠明顯，但對于預(yù)測用戶對《玩具總動員2》這樣的經(jīng)典動畫喜劇的態(tài)度非常重要。

七、跨模型驗證：通用性的有力證明

LettinGo框架的一個重要優(yōu)勢是它的通用性。為了驗證這一點(diǎn)，研究團(tuán)隊不僅在多個數(shù)據(jù)集上進(jìn)行了測試，還在不同的模型架構(gòu)上驗證了方法的有效性。這種全方位的驗證就像是測試一個新發(fā)明的工具：不僅要在不同的工作環(huán)境中試用，還要讓不同技能水平的工人來操作，確保它真的是普遍適用的。

在模型選擇方面，研究團(tuán)隊既使用了開源模型（如LLaMA系列、Qwen系列），也測試了商業(yè)模型（如GPT-4o、Claude）。這種對比很有意義，因為它能夠回答一個實際的問題：企業(yè)是否需要使用昂貴的商業(yè)模型，還是開源模型就足夠了？

實驗結(jié)果顯示，經(jīng)過LettinGo訓(xùn)練的開源模型在某些情況下甚至能夠超過直接使用的頂級商業(yè)模型。這個發(fā)現(xiàn)對于實際應(yīng)用具有重要的成本考量意義。企業(yè)可以使用相對便宜的開源模型，通過LettinGo的訓(xùn)練方法達(dá)到與昂貴商業(yè)模型相當(dāng)甚至更好的效果。

在Qwen2.5 7B模型上的驗證實驗特別有說服力。使用LettinGo方法后，系統(tǒng)在MovieLens數(shù)據(jù)集上的準(zhǔn)確率從52.50%提升到了58.30%，F(xiàn)1分?jǐn)?shù)從50.23%提升到了56.87%。這種一致的改進(jìn)模式說明LettinGo的優(yōu)勢不是偶然的，而是方法本身的固有特性。

更重要的是，實驗還發(fā)現(xiàn)了一個有趣的現(xiàn)象：隨著用戶檔案中包含的歷史信息增加，不同模型的表現(xiàn)都呈現(xiàn)出類似的改進(jìn)趨勢。這說明LettinGo發(fā)現(xiàn)的"信息量最優(yōu)點(diǎn)"是一個普遍規(guī)律，而不是特定模型的特殊現(xiàn)象。

研究團(tuán)隊還測試了LettinGo在不同規(guī)模模型上的表現(xiàn)。從8B參數(shù)的模型到13B參數(shù)的模型，改進(jìn)效果都很明顯且一致。這種規(guī)模無關(guān)性進(jìn)一步證明了方法的穩(wěn)健性。

在實際部署考慮方面，研究團(tuán)隊還分析了LettinGo生成的用戶檔案相比原始?xì)v史數(shù)據(jù)在長度上的優(yōu)勢。實驗顯示，生成的檔案平均只有原始數(shù)據(jù)長度的一半左右，這意味著在實際應(yīng)用中能夠顯著減少計算成本和響應(yīng)時間。這種效率提升對于需要實時響應(yīng)的在線推薦系統(tǒng)來說非常重要。

八、深入洞察：為什么LettinGo如此有效

LettinGo之所以能夠取得如此顯著的效果，背后有幾個深層次的原因。理解這些原因不僅有助于我們更好地使用這個方法，也為未來的研究指明了方向。

首先是"信息蒸餾"的效應(yīng)。傳統(tǒng)方法直接使用用戶的全部歷史數(shù)據(jù)，就像是讓人同時閱讀一個人的全部日記。雖然信息很全面，但其中包含了大量的噪音和無關(guān)細(xì)節(jié)。LettinGo通過生成用戶檔案，實際上是在做"信息蒸餾"：將大量的原始數(shù)據(jù)提煉成最精華的部分。這個過程不僅減少了噪音，還突出了最重要的偏好模式。

其次是"語義理解"的優(yōu)勢。大型語言模型在訓(xùn)練過程中學(xué)習(xí)了大量的語言知識和常識，這使得它們能夠理解不同物品之間的深層語義關(guān)系。比如，系統(tǒng)能夠理解"科幻電影"和"太空探索紀(jì)錄片"之間的聯(lián)系，或者"意大利餐廳"和"浪漫約會"之間的關(guān)聯(lián)。這種語義理解能力是傳統(tǒng)數(shù)字向量方法難以企及的。

第三是"多樣性探索"的價值。通過使用多個不同的模型來生成初始檔案，LettinGo實際上是在進(jìn)行一種"集體智慧"的探索。不同的模型可能會注意到用戶行為中的不同方面，有些關(guān)注情感特征，有些關(guān)注行為模式，有些關(guān)注時間規(guī)律。這種多角度的觀察使得最終的用戶檔案更加全面和準(zhǔn)確。

第四是"任務(wù)驅(qū)動優(yōu)化"的力量。傳統(tǒng)的用戶建模方法往往是為了建模而建模，缺乏明確的應(yīng)用目標(biāo)。LettinGo的創(chuàng)新在于它直接以推薦任務(wù)的效果為優(yōu)化目標(biāo)，這確保了生成的用戶檔案確實對實際應(yīng)用有用。這就像是培養(yǎng)一個專門為特定目的服務(wù)的專家，而不是培養(yǎng)一個什么都懂但什么都不精的通才。

第五是"靈活性與一致性的平衡"。LettinGo既保持了用戶檔案格式的靈活性（不強(qiáng)制固定模板），又通過訓(xùn)練確保了質(zhì)量的一致性。這種平衡很難做到，但一旦實現(xiàn)就能帶來巨大的優(yōu)勢：系統(tǒng)既能適應(yīng)不同用戶的獨(dú)特性，又能保證輸出質(zhì)量的穩(wěn)定性。

最后是"漸進(jìn)優(yōu)化"的哲學(xué)。LettinGo采用的三階段方法體現(xiàn)了一種漸進(jìn)優(yōu)化的思路：先探索可能性空間，再評估不同選擇的質(zhì)量，最后學(xué)習(xí)如何做出最佳選擇。這種方法論不僅適用于用戶建模，也為其他AI應(yīng)用提供了有益的啟示。

九、實際應(yīng)用的廣闊前景

LettinGo的成功不僅僅是學(xué)術(shù)研究的勝利，更重要的是它為實際應(yīng)用開辟了廣闊的前景。我們可以想象，這種技術(shù)將如何改變我們的日常生活體驗。

在電商領(lǐng)域，LettinGo能夠幫助購物平臺更好地理解每個用戶的購物習(xí)慣和偏好。系統(tǒng)不再僅僅基于"買了A商品的人也買了B商品"這樣的簡單關(guān)聯(lián)，而是能夠深入理解用戶的生活方式、價值觀念和審美傾向。比如，系統(tǒng)可能會發(fā)現(xiàn)某個用戶不僅喜歡環(huán)保產(chǎn)品，還關(guān)注簡約設(shè)計和性價比，于是在推薦時會優(yōu)先考慮那些既環(huán)保又簡約還實惠的商品。

在內(nèi)容推薦方面，無論是視頻平臺、音樂軟件還是新聞應(yīng)用，都能夠從LettinGo中獲益。以視頻推薦為例，系統(tǒng)可能會生成這樣的用戶檔案："這位用戶在工作日晚上偏愛短時長的輕松喜劇來放松心情，周末喜歡觀看深度紀(jì)錄片來學(xué)習(xí)新知識，對于科技和歷史主題特別感興趣。"基于這樣的理解，系統(tǒng)就能在不同時間點(diǎn)推薦最合適的內(nèi)容。

在本地服務(wù)推薦領(lǐng)域，LettinGo的價值更加明顯。餐飲推薦不再只是基于菜系偏好，而是能夠綜合考慮用戶的飲食習(xí)慣、社交需求、消費(fèi)水平等多個維度。比如系統(tǒng)可能識別出某個用戶"喜歡嘗試新鮮菜系，偏愛有特色的小店勝過連鎖餐廳，通常與朋友聚餐，預(yù)算適中"，然后相應(yīng)地推薦那些有特色、適合聚餐、價格合理的新餐廳。

在金融服務(wù)方面，LettinGo也有很大的應(yīng)用潛力。銀行和保險公司可以使用這種技術(shù)來更好地理解客戶的財務(wù)需求和風(fēng)險偏好，從而提供更加個性化的金融產(chǎn)品推薦。比如，系統(tǒng)可能會識別出某個客戶"注重長期投資、偏好穩(wěn)健收益、對新興科技領(lǐng)域感興趣但風(fēng)險承受能力有限"，然后推薦相應(yīng)的投資組合。

在教育領(lǐng)域，LettinGo的應(yīng)用前景同樣廣闊。在線教育平臺可以使用這種技術(shù)來理解每個學(xué)習(xí)者的學(xué)習(xí)風(fēng)格、知識背景和興趣點(diǎn)，從而提供更加個性化的學(xué)習(xí)路徑。比如，系統(tǒng)可能發(fā)現(xiàn)某個學(xué)員"偏愛通過實際案例學(xué)習(xí)、對數(shù)據(jù)分析很感興趣、習(xí)慣在晚上學(xué)習(xí)、喜歡交互性強(qiáng)的課程"，然后相應(yīng)地安排學(xué)習(xí)內(nèi)容和時間。

更有意思的是，LettinGo還可能催生一些全新的應(yīng)用場景。比如"智能生活助手"，它能夠綜合理解用戶在購物、娛樂、飲食、學(xué)習(xí)等各個方面的偏好，然后提供跨領(lǐng)域的生活建議?；蛘?個性化新聞編輯"，它不僅知道用戶關(guān)注哪些話題，還理解用戶的閱讀習(xí)慣、信息接受方式和價值觀傾向，從而提供真正符合用戶需求的新聞內(nèi)容。

說到底，LettinGo代表的是從"推薦算法"向"理解用戶"的轉(zhuǎn)變。過去的推薦系統(tǒng)更像是一個只會統(tǒng)計和匹配的機(jī)器，而基于LettinGo的新一代推薦系統(tǒng)更像是一個真正理解用戶的智能助手。這種轉(zhuǎn)變不僅會帶來更好的推薦效果，還可能改變我們與AI系統(tǒng)交互的整體體驗。

這項由微軟公司研究團(tuán)隊在2025年6月發(fā)表于第31屆ACM SIGKDD知識發(fā)現(xiàn)與數(shù)據(jù)挖掘會議的研究，為我們展示了AI技術(shù)發(fā)展的一個重要方向：不僅要讓機(jī)器變得更聰明，更要讓它們變得更懂人。有興趣深入了解這項研究的讀者，可以通過DOI鏈接 https://doi.org/10.1145/3711896.3737024 訪問完整的論文內(nèi)容，相信會從中獲得更多的啟發(fā)和思考。

Q&A

Q1：LettinGo是什么？它能做什么？ A：LettinGo是微軟開發(fā)的一個AI用戶畫像生成框架，它能讓推薦系統(tǒng)更好地理解每個用戶的喜好。不同于傳統(tǒng)的數(shù)字化用戶建模，LettinGo能用自然語言生成生動、準(zhǔn)確的用戶描述，就像為每個用戶寫一份個性化的"興趣檔案"，從而讓推薦更精準(zhǔn)。

Q2：LettinGo會不會泄露用戶隱私？ A：論文主要關(guān)注技術(shù)方法，沒有詳細(xì)討論隱私保護(hù)措施。但從技術(shù)原理看，LettinGo生成的是概括性的興趣描述而非具體行為記錄，這在一定程度上起到了數(shù)據(jù)脫敏的作用。不過在實際應(yīng)用中，隱私保護(hù)仍需要額外的技術(shù)和制度保障。

Q3：普通用戶如何體驗到LettinGo的好處？ A：雖然LettinGo目前還是研究階段的技術(shù)，但一旦被各大平臺采用，用戶就能在購物、看視頻、聽音樂、點(diǎn)外賣等日常場景中獲得更精準(zhǔn)的推薦。比如購物平臺會更懂你的品味，視頻網(wǎng)站會推薦更符合你心情的內(nèi)容，這些改善都是用戶能直接感受到的。

推薦系統(tǒng)用戶畫像大型語言模型

分享至

0贊

好文章，需要你的鼓勵

推薦文章

人工智能
動態(tài)專家搜索
推理優(yōu)化

2025-10-22 13:24

浙江大學(xué)突破：讓AI專家團(tuán)隊在考試時"動態(tài)組隊"，推理能力飆升

浙江大學(xué)團(tuán)隊提出動態(tài)專家搜索方法，讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率，且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置，為AI推理優(yōu)化開辟新路徑。
人工智能
強(qiáng)化學(xué)習(xí)
模型優(yōu)化

2025-10-22 13:24

清華大學(xué)新突破：AI模型居然能學(xué)會"少說話多做事"，推理效率提升一倍還更準(zhǔn)確

清華大學(xué)研究團(tuán)隊提出SIRI方法，通過"壓縮-擴(kuò)張"交替訓(xùn)練策略，成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實驗顯示，該方法在數(shù)學(xué)競賽題上將模型準(zhǔn)確率提升43.2%的同時，輸出長度減少46.9%，真正實現(xiàn)了效率與性能的雙重優(yōu)化，為AI模型訓(xùn)練提供了新思路。
人工智能
視頻生成
實時流媒體

2025-10-22 13:24

南洋理工大學(xué)突破性研究：用AI實現(xiàn)多分鐘視頻實時流式生成，就像看電視直播一樣

南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊開發(fā)出Rolling Forcing技術(shù)，實現(xiàn)AI視頻實時流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項創(chuàng)新，解決了長視頻生成中的錯誤累積問題，可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻，延遲僅0.76秒，質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01，為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
人工智能
幾何學(xué)習(xí)
空間智能

2025-10-22 10:14

華中科技大學(xué)團(tuán)隊突破性發(fā)現(xiàn)：讓AI像幾何學(xué)家一樣思考，竟能大幅提升空間理解能力

華中科技大學(xué)研究團(tuán)隊發(fā)現(xiàn)，通過讓AI模型學(xué)習(xí)解決幾何問題，能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集，使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個AI模型。實驗結(jié)果顯示，幾何訓(xùn)練在四個空間智能測試基準(zhǔn)上都帶來顯著提升，其中最佳模型達(dá)到49.6%準(zhǔn)確率，超越此前最好成績。這項研究揭示了基礎(chǔ)幾何知識對培養(yǎng)AI空間智能的重要價值。

浙江大學(xué)突破：讓AI專家團(tuán)隊在考試時"動態(tài)組隊"，推理能力飆升

浙江大學(xué)突破：讓AI專家團(tuán)隊在考試時"動態(tài)組隊"，推理能力飆升

2025-10-22 13:24

清華大學(xué)新突破：AI模型居然能學(xué)會"少說話多做事"，推理效率提升一倍還更準(zhǔn)確

清華大學(xué)新突破：AI模型居然能學(xué)會"少說話多做事"，推理效率提升一倍還更準(zhǔn)確

2025-10-22 13:24

南洋理工大學(xué)突破性研究：用AI實現(xiàn)多分鐘視頻實時流式生成，就像看電視直播一樣

南洋理工大學(xué)突破性研究：用AI實現(xiàn)多分鐘視頻實時流式生成，就像看電視直播一樣

2025-10-22 13:24

華中科技大學(xué)團(tuán)隊突破性發(fā)現(xiàn)：讓AI像幾何學(xué)家一樣思考，竟能大幅提升空間理解能力

華中科技大學(xué)團(tuán)隊突破性發(fā)現(xiàn)：讓AI像幾何學(xué)家一樣思考，竟能大幅提升空間理解能力

2025-10-22 10:14

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

友情鏈接

至頂網(wǎng)
管理現(xiàn)代化
和訊IT
TechWeb
第三媒體
速途網(wǎng)
51CTO傳媒
投資界
科技訊
智者新時代

京ICP證15039648號京ICP備15039648號-9 京公網(wǎng)安備 11010802021500號

北京第二十六維信息技術(shù)有限公司（至頂網(wǎng)）版權(quán)所有。 | 聯(lián)絡(luò)我們

舉報電話：010-62641205　涉未成年人舉報專線：010-62641208 舉報郵箱: jubao@zhiding.cn 　網(wǎng)上有害信息舉報專區(qū)：https://www.12377.cn

<tfoot id="okt7g"></tfoot>