長(zhǎng)期以來(lái),LinkedIn(領(lǐng)英)一直處于AI技術(shù)的前沿,并將AI技術(shù)融入產(chǎn)品和服務(wù)。最近,筆者與LinkedIn公司首席數(shù)據(jù)官兼工程技術(shù)副總裁Igor Perisic進(jìn)行了交流,探討了LinkedIn公司內(nèi)部AI技術(shù)發(fā)展,如何將AI應(yīng)用于日常工作,全球數(shù)據(jù)法規(guī)帶來(lái)的實(shí)際影響,以及如何應(yīng)對(duì)不斷變化的AI工作環(huán)境與工作角色等問(wèn)題。
▲ 圖:LinkedIn公司工程技術(shù)副總裁兼首席數(shù)據(jù)官Igor Perisic
LinkedIn公司很早就意識(shí)到,「數(shù)據(jù)」將成為企業(yè)之間的一大核心差異化因素。為了從市場(chǎng)競(jìng)爭(zhēng)中脫穎而出,該公司建立起“會(huì)員優(yōu)先”這一核心價(jià)值觀(以明確、統(tǒng)一的方式對(duì)會(huì)員數(shù)據(jù)加以控制),并以此為基礎(chǔ),為全球會(huì)員提供職業(yè)提升通道。
隨著LinkedIn將越來(lái)越多的AI技術(shù)融入產(chǎn)品與服務(wù),他們也意識(shí)到,必須為每一位員工在工作流程中配備必要的AI工具。為此,他們建立起內(nèi)部培訓(xùn)計(jì)劃,名為「AI Academy」。這項(xiàng)計(jì)劃希望覆蓋從軟件工程師到銷售團(tuán)隊(duì)的各個(gè)群體,為員工們傳授最適合當(dāng)前崗位的AI知識(shí),保證他們?yōu)檫@類技術(shù)的實(shí)際使用做好準(zhǔn)備。
LinkedIn早期AI項(xiàng)目之一正是「你可能認(rèn)識(shí)的人(People You May Know,簡(jiǎn)稱PYMK)」推薦服務(wù)。在本質(zhì)上,這種算法可以向會(huì)員們推薦他們可能認(rèn)識(shí)的其他會(huì)員,并據(jù)此建立起人脈網(wǎng)絡(luò)。當(dāng)初的推薦系統(tǒng)當(dāng)然不像現(xiàn)在這么復(fù)雜,但確實(shí)成為L(zhǎng)inkedIn產(chǎn)品的一大核心。PYMK以數(shù)據(jù)產(chǎn)品的形式亮相,約在2006年左右,當(dāng)時(shí)開(kāi)發(fā)這項(xiàng)服務(wù)的是技術(shù)行業(yè)中最早的“數(shù)據(jù)科學(xué)”團(tuán)隊(duì)之一。但在早期,沒(méi)人把PYMK稱為“AI”項(xiàng)目,因?yàn)楫?dāng)時(shí)AI這種說(shuō)法還沒(méi)流行起來(lái)。
大約在同一時(shí)期,LinkedIn啟動(dòng)的另一個(gè)重要項(xiàng)目是「搜索排名」。谷歌的出現(xiàn)將搜索引擎領(lǐng)域的競(jìng)爭(zhēng)推向白熱化,而搜索排名正是一類經(jīng)典的AI問(wèn)題。
在LinkedIn,Igor表示“我們把AI技術(shù)看得像氧氣一樣重要——它會(huì)滲透到我們工作中的每一個(gè)角落。”例如,對(duì)于LinkedIn的會(huì)員,AI技術(shù)可以幫助推薦工作機(jī)會(huì)、組織簡(jiǎn)歷資料、保證他們收到及時(shí)且翔實(shí)的通知,并根據(jù)個(gè)人特質(zhì)推薦新的技能與學(xué)習(xí)內(nèi)容。至于LinkedIn的企業(yè)產(chǎn)品,他表示“AI技術(shù)可以幫助銷售人員吸引到對(duì)其產(chǎn)品最感興趣的會(huì)員,幫助營(yíng)銷人員發(fā)布高質(zhì)量贊助內(nèi)容,幫助招聘人員確定并接觸新的人才群體。”此外,LinkedIn還將AI技術(shù)廣泛引入后臺(tái),幫助會(huì)員免受欺詐及有害內(nèi)容的影響,同時(shí)優(yōu)化互聯(lián)網(wǎng)連接以保證會(huì)員始終擁有最佳站點(diǎn)訪問(wèn)速度等。
“保障平臺(tái)會(huì)員安全,一直是我們關(guān)注的重要目標(biāo)。”Igor說(shuō),作為一家具有明確職業(yè)傾向的社交網(wǎng)絡(luò),最重要的就是迅速采取行動(dòng),盡快識(shí)別并阻止一切惡意行為。隨著惡意與威脅形勢(shì)的不斷變化,AI技術(shù)也成為安全保障工作中的核心。事實(shí)證明,機(jī)器學(xué)習(xí)在檢測(cè)虛假資料信息方面確實(shí)表現(xiàn)出色。
如果沒(méi)有AI,LinkedIn的多數(shù)產(chǎn)品及服務(wù)將根本無(wú)法運(yùn)行。LinkedIn針對(duì)全球經(jīng)濟(jì)體系建立起的“經(jīng)濟(jì)圖譜”實(shí)在太過(guò)龐大、太過(guò)細(xì)致,沒(méi)有AI根本無(wú)法進(jìn)行解析。
AI也在切實(shí)增強(qiáng)每一項(xiàng)使用體驗(yàn)。雖然「通知功能」已經(jīng)可以在一定程度上幫助會(huì)員了解項(xiàng)目情況,但目前AI體驗(yàn)中最關(guān)鍵的一環(huán)主要體現(xiàn)在Feed方面——即對(duì)各類活動(dòng)(包括網(wǎng)絡(luò)帖子、新聞、視頻以及文章等)進(jìn)行分類與排序。為了保證摘要信息的相關(guān)性,算法必須有能力處理“內(nèi)容推薦”與“會(huì)員偏好”之間的細(xì)微差別,這種能力也成為決定成敗的關(guān)鍵。
Igor還分享了一個(gè)有趣的例子。2018年初,他們發(fā)現(xiàn)不同用戶群體在Feed中的參與度出現(xiàn)了嚴(yán)重分裂——前1%超級(jí)用戶依靠“病毒式傳播”獲得了巨大收益,但大多數(shù)創(chuàng)作者卻陷入零反饋困境。這是因?yàn)楫?dāng)時(shí)的摘要模型遵循一條簡(jiǎn)單粗暴的原理:分享那些能夠引起廣泛關(guān)注的“病毒式內(nèi)容”。
但LinkedIn很快意識(shí)到,這種優(yōu)化思路不一定適合所有會(huì)員。為了對(duì)抗由AI技術(shù)造成的負(fù)面生態(tài)系統(tǒng)影響,他們開(kāi)始在Feed中引入更深層次的創(chuàng)作優(yōu)化功能,借此幫助那些受眾規(guī)模較小的創(chuàng)作者。
在此次更新中,排名算法開(kāi)始考慮,讀者與創(chuàng)作者在特定項(xiàng)目之間產(chǎn)生的聯(lián)系與價(jià)值。對(duì)于讀者來(lái)說(shuō),他們希望根據(jù)自己的喜好獲取相關(guān)內(nèi)容;對(duì)于創(chuàng)作者來(lái)說(shuō),他們希望自己產(chǎn)出的高質(zhì)量?jī)?nèi)容能夠切實(shí)吸引到目標(biāo)受眾。Igor指出,“通過(guò)模型的調(diào)整與優(yōu)化,我們將新聞?wù)鸩睫D(zhuǎn)化成意見(jiàn)領(lǐng)袖與受眾之間更加健康的關(guān)聯(lián)與內(nèi)容組合,從而極大提高了讀者與創(chuàng)作者的參與度。”
近幾年來(lái),世界各地都已經(jīng)開(kāi)始制定法律,借此約束企業(yè)對(duì)用戶數(shù)據(jù)的存儲(chǔ)與使用方式。歐洲推出的《通用數(shù)據(jù)保護(hù)條例(GDPR)》以及加利福尼亞州的《加州消費(fèi)者隱私法(CCPA)》都在強(qiáng)化隱私權(quán)與消費(fèi)者保護(hù)的重要意義。對(duì)部分企業(yè)來(lái)說(shuō),這意味著他們必須重新審視對(duì)用戶數(shù)據(jù)的處理思路。好在,LinkedIn一直將數(shù)據(jù)視為寶貴的企業(yè)資產(chǎn),同時(shí)也是該公司的核心差異化因素之一。
Igor解釋道,甚至早在GDPR出臺(tái)之前,LinkedIn就設(shè)有一套內(nèi)部框架,名為3C——即透明(clarity)、一致(consistency)以及控制(control)。他表示,“現(xiàn)在我們?nèi)匀粓?jiān)持著同樣的思路,保證會(huì)員們清楚我們?cè)谌绾翁幚硭麄兊臄?shù)據(jù)、可以求證我們的言行之間是否一致,同時(shí)允許會(huì)員真正控制自己的數(shù)據(jù)。”結(jié)合當(dāng)前歷史背景,LinkedIn希望通過(guò)GDPR,進(jìn)一步鞏固自己對(duì)全球會(huì)員做出的數(shù)據(jù)隱私保護(hù)承諾。例如,LinkedIn將把GDPR數(shù)據(jù)的主體權(quán)利擴(kuò)展至全球所有會(huì)員。他們還在不斷思考,如何在LinkedIn與AI模型中處理會(huì)員數(shù)據(jù),同時(shí)增強(qiáng)查看與更新流程設(shè)計(jì)層面的私密性保障。LinkedIn始終將會(huì)員利益視為運(yùn)營(yíng)宗旨,并將保護(hù)會(huì)員數(shù)據(jù)視為組織內(nèi)部的整體責(zé)任。
作為規(guī)模龐大的專業(yè)社交網(wǎng)絡(luò),LinkedIn能夠以非常獨(dú)特視角,觀察并理解其他企業(yè)難以涉及的「職位變動(dòng)」、「職位趨勢(shì)」以及「區(qū)域吸引力」等重要洞見(jiàn)。
去年底,LinkedIn發(fā)布了第三期年度新興工作崗位報(bào)告,希望確定增長(zhǎng)速度最快的工作崗位。人工智能專家成為榜單中的頭名,在過(guò)去4年中年均增長(zhǎng)率高達(dá)74%。這一增長(zhǎng)遠(yuǎn)遠(yuǎn)超出科技行業(yè)的平均水平。尤其令人興奮的是,他們發(fā)現(xiàn)在2017年,來(lái)自教育領(lǐng)域的核心AI技術(shù)專家,已經(jīng)在LinkedIn平臺(tái)全部AI會(huì)員群體的占比中位列第二,這意味著大部分AI職位增長(zhǎng)都與教育行業(yè)以及學(xué)術(shù)研究相關(guān)。
最近面對(duì)COVID-19疫情引發(fā)的經(jīng)濟(jì)衰退,LinkedIn發(fā)現(xiàn),AI就業(yè)市場(chǎng)仍然保持著持續(xù)增長(zhǎng)。在對(duì)總發(fā)布職位數(shù)量進(jìn)行標(biāo)準(zhǔn)化整理后,美國(guó)遭遇COVID-19疫情侵襲的十周之內(nèi),AI職位數(shù)量增長(zhǎng)了8.3%——雖然這一增長(zhǎng)速度要低于疫情之前,但相較于市場(chǎng)上人才需求總體下降的趨勢(shì),雇主們似乎仍然更加關(guān)注AI技術(shù)專家。
AI領(lǐng)域的另一個(gè)有趣之處在于,LinkedIn觀察到一個(gè)完整的技術(shù)角色生態(tài)系統(tǒng),各角色支撐起AI生命周期中的不同階段。回顧去年底發(fā)布的新興工作報(bào)告,除了AI專家角色(負(fù)責(zé)模型創(chuàng)建與訓(xùn)練)的持續(xù)增加之外,與AI相關(guān)的“配套”崗位也在不斷發(fā)展。未來(lái),市場(chǎng)對(duì)于「數(shù)據(jù)科學(xué)家」、「數(shù)據(jù)工程師」以及「云工程師」的需求也將提升——這種提升不僅體現(xiàn)在技術(shù)領(lǐng)域中,而是各行各業(yè)。
歸根結(jié)底,AI仍是一種工具,其最大的潛力在于增強(qiáng)人類智能并幫助人類取得更大的成就。LinkedIn目前的AI工具,在很大程度上仍依賴于人工輸入,而且永遠(yuǎn)無(wú)法徹底實(shí)現(xiàn)自動(dòng)化。
Igor堅(jiān)信,AI的未來(lái)在于實(shí)際應(yīng)用,特別是如何利用AI工具提升人類的智能水平,從而更好更快地完成任務(wù)。為了實(shí)現(xiàn)這個(gè)目標(biāo),我們不僅需要AI專家,同時(shí)也要推動(dòng)AI技術(shù)的大眾化。AI應(yīng)該逐步轉(zhuǎn)化為一種即插即用、能夠直接操作的界面。他發(fā)現(xiàn),各大主要云服務(wù)供應(yīng)商已經(jīng)參與進(jìn)來(lái),努力開(kāi)發(fā)出各類有助于降低AI使用門檻的工具。一旦AI與應(yīng)用場(chǎng)景得到全面結(jié)合,就會(huì)真正激發(fā)出人們的創(chuàng)造力,開(kāi)發(fā)出越來(lái)越多更酷、更有趣的實(shí)際用例。
以此為基礎(chǔ),AI技術(shù)也將實(shí)現(xiàn)貫通式的整體升級(jí)。從算法到數(shù)學(xué)發(fā)現(xiàn)、再到硬件與AI系統(tǒng)設(shè)計(jì),從業(yè)者們將立足各個(gè)環(huán)節(jié),用自己的獨(dú)創(chuàng)性為AI發(fā)展貢獻(xiàn)力量。這將是一片廣闊的天地,每個(gè)角落當(dāng)中都有著值得奮力發(fā)掘的寶藏。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專家搜索方法,讓AI能根據(jù)不同問(wèn)題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問(wèn)題偏愛(ài)不同專家配置,為AI推理優(yōu)化開(kāi)辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過(guò)"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問(wèn)題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開(kāi)發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過(guò)滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問(wèn)題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開(kāi)辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過(guò)讓AI模型學(xué)習(xí)解決幾何問(wèn)題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來(lái)顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。