av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

<abbr id="bm0cr"><samp id="bm0cr"></samp></abbr>

微信掃一掃，關(guān)注公眾號

科技行者
算力行者

見證連接與計算的「力量」

“AI”向你發(fā)起了視頻通話，接還是不接？

“AI”向你發(fā)起了視頻通話，接還是不接？

作者：科技行者

2021-02-23 15:57

分享至：

隨著化身技術(shù)真正邁出前進的步伐，人們的期望也會越來越高;而當虛擬助手的仿真面孔無法匹配靈活的大腦與情商表達時，失望之情也會與日俱增。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2021-02-23 15:57 ? 科技行者

在一年一度的超級碗決賽之前，Amazon又發(fā)布了“Alexa新形態(tài)”的重磅廣告。在廣告中，一位女演員把自己對邁克爾·喬丹的崇拜傾注在Alexa語音助手身上，徹底惹毛了自己的丈夫。毫無疑問，大多數(shù)觀眾都不會把Amazon設(shè)計的這段新廣告太當真;但事實上，能像人一樣與我們流暢交通的AI也并沒那么遙遠。

如今，AI化身——即使用數(shù)字形體及/或面部渲染出的AI形象——還遠遠不像喬丹那么有人格魅力，甚至看起來還有點恐怖。研究表明，人類確實很喜歡開發(fā)這種具有類人功能的機器人，但一旦機器的“類人性”超過某個閾值，反而會讓人感到可怕——這就是著名的“恐怖谷”理論。創(chuàng)造這個詞的機器人專家Masahiro Mori預(yù)計，終有一天會出現(xiàn)能夠以假亂真的機器人，讓我們徹底失去分辨能力。至少在對話層面，這樣的AI已經(jīng)有望實現(xiàn)，徹底打破舊有圖靈測試的束縛。

在最近與傳奇營銷天才Guy Kawasaki的遠程視頻中，我大膽做出預(yù)測：未來兩年以內(nèi)，Guy就將無法區(qū)分我本人和我們打造的對話型AI方案Kuki。Guy明顯不以為然，但我也沒有動搖，打算一步步做出論證。

結(jié)合這次對話，我打算向大家公開匯報，說說自己為什么對這樣的預(yù)測有信心。在本質(zhì)上，要想在視頻通話中實現(xiàn)與人類相信的表現(xiàn)，AI必須獲得五大關(guān)鍵實時技術(shù)：

類人化身
類人語音
類人情感
類人行為
類人對話

隨著動作捕捉技術(shù)(MoCap)與生成對抗神經(jīng)網(wǎng)絡(luò)(GAN，也是Deep Fake所依賴的底層機器學(xué)習(xí)技術(shù))的廣泛普及與成本下降，化身方案近年來取得了長足發(fā)展。早期動作捕捉要求演員穿上特殊的服裝，但整個拍攝與調(diào)整過程成本高昂，只有《阿凡達》這類鴻篇巨制才負擔得起。但如今，單靠iPhone X與免費游戲引擎軟件就足以讓動作捕捉“走進尋常百姓家”。眾多在線Web服務(wù)讓創(chuàng)建低分辨率Deep Fake圖像與視頻變得輕而易舉，快速推動這項技術(shù)的大眾化步伐。但如果不加限制，這項技術(shù)也有可能給人類社會造成巨大沖擊。事實上，這種進步還催生出新的產(chǎn)業(yè)，很多主播開始將自己的面部與表情實時轉(zhuǎn)化為動物形象，甚至出現(xiàn)了“Lil’Miquela”等AI意見領(lǐng)袖。就在上周，Epic Games(〈堡壘之夜〉與虛幻引擎的開發(fā)商)公布了MetaHuman創(chuàng)作器，很快每個人都能夠免費創(chuàng)造出無限接近于真人的“假臉”。

生成類人語音的技術(shù)同樣在迅速發(fā)展。Amazon、微軟與谷歌都提供可靈活消費的云文本到語音轉(zhuǎn)換(TTS)API，以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)生成越來越逼真的語音效果。此外，我們還能輕松獲取多種自定義語音風格工具，這些工具由人類演員根據(jù)一定數(shù)量的示例語句建模而成。與現(xiàn)在的高精度語音識別類似，語音合成也將隨著算力與訓(xùn)練數(shù)據(jù)的增強而不斷改善。

單有令人信服的AI語音與人臉，還不足以產(chǎn)生價值——必須有生動的表情與之匹配。事實證明，只需要配合前置攝像頭，計算機視覺技術(shù)就足以分析并生成豐富的面部表情。目前已經(jīng)有多種API可供您分析文本內(nèi)容并理解相應(yīng)的情感。NTT Data等實驗室甚至展示了能夠?qū)崟r模仿人類手勢與表情的方案;Magic Leap的MICA則能夠提供令人印象深刻的非語言化身表情。當然，現(xiàn)有AI還很難摸索出真正自主的精神與情感狀態(tài)，這方面仍有很長的研究道路要走。

為了避免“恐怖谷”問題，AI必須能夠展示出與面部乃至肢體動作相一致的“態(tài)度”，并根據(jù)對話進程動態(tài)觸發(fā)。南加州大學(xué)ICT實驗室的Shaprio項目以及眾多語音圖像初創(chuàng)企業(yè)的探索，已經(jīng)在為游戲角色提供同步口型與面部表情等方面取得了開創(chuàng)性成果。這類系統(tǒng)能夠通過化身轉(zhuǎn)換文字表達、分析情感，并通過既定規(guī)則調(diào)用庫內(nèi)的適當動畫，同時結(jié)合真實人類活動的視頻持續(xù)進行機器學(xué)習(xí)訓(xùn)練。隨著研發(fā)推進與機器學(xué)習(xí)發(fā)展，這類程序動畫有望在兩年之后全面實現(xiàn)無縫運作。

類人對話中最生澀、也是最困難的部分，在于大多數(shù)聊天機器人仍然掙扎在進行基本對話的及格線上。到目前為止，相較于語音合成及計算機視覺等大獲成功的領(lǐng)域，深度學(xué)習(xí)+更多數(shù)據(jù)+更強算力的模式還沒能在自然語言理解方面取得有意義的突破。

類人AI這個思路極具吸引力，目前已經(jīng)吸引到3.2億風險投資;但至少在未來幾年當中，除非其中的核心要素得以“解決”，否則一切恐怕仍只是個幻想。隨著化身技術(shù)真正邁出前進的步伐，人們的期望也會越來越高;而當虛擬助手的仿真面孔無法匹配靈活的大腦與情商表達時，失望之情也會與日俱增。因此，現(xiàn)在預(yù)測聊天機器人什么時候能夠達到真人水平還為時過早。再說點喪氣話：如今的機器智能甚至連基于純文本的圖靈測試都還無法通過。

也許更重要的問題應(yīng)該是：我們有必要弄出這種類人形式的AI嗎?這類成果在媒體交互角色、AI醫(yī)療助手、培訓(xùn)乃至教育領(lǐng)域帶來的收益，真的比潛在風險更大嗎?類人AI必然要無限趨近于人，還是應(yīng)該像很多業(yè)內(nèi)人士們的觀點，盡量避開類人這個坑以消除“恐怖谷”效應(yīng)?

分享至

0贊

好文章，需要你的鼓勵

推薦文章

人工智能
動態(tài)專家搜索
推理優(yōu)化

2025-10-22 13:24

浙江大學(xué)突破：讓AI專家團隊在考試時"動態(tài)組隊"，推理能力飆升

浙江大學(xué)團隊提出動態(tài)專家搜索方法，讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準確率，且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置，為AI推理優(yōu)化開辟新路徑。
人工智能
強化學(xué)習(xí)
模型優(yōu)化

2025-10-22 13:24

清華大學(xué)新突破：AI模型居然能學(xué)會"少說話多做事"，推理效率提升一倍還更準確

清華大學(xué)研究團隊提出SIRI方法，通過"壓縮-擴張"交替訓(xùn)練策略，成功解決了大型推理模型"話多且準確率低"的問題。實驗顯示，該方法在數(shù)學(xué)競賽題上將模型準確率提升43.2%的同時，輸出長度減少46.9%，真正實現(xiàn)了效率與性能的雙重優(yōu)化，為AI模型訓(xùn)練提供了新思路。
人工智能
視頻生成
實時流媒體

2025-10-22 13:24

南洋理工大學(xué)突破性研究：用AI實現(xiàn)多分鐘視頻實時流式生成，就像看電視直播一樣

南洋理工大學(xué)與騰訊聯(lián)合研究團隊開發(fā)出Rolling Forcing技術(shù)，實現(xiàn)AI視頻實時流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓(xùn)練算法三項創(chuàng)新，解決了長視頻生成中的錯誤累積問題，可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻，延遲僅0.76秒，質(zhì)量漂移指標從傳統(tǒng)方法的1.66降至0.01，為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
人工智能
幾何學(xué)習(xí)
空間智能

2025-10-22 10:14

華中科技大學(xué)團隊突破性發(fā)現(xiàn)：讓AI像幾何學(xué)家一樣思考，竟能大幅提升空間理解能力

華中科技大學(xué)研究團隊發(fā)現(xiàn)，通過讓AI模型學(xué)習(xí)解決幾何問題，能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集，使用強化學(xué)習(xí)方法訓(xùn)練多個AI模型。實驗結(jié)果顯示，幾何訓(xùn)練在四個空間智能測試基準上都帶來顯著提升，其中最佳模型達到49.6%準確率，超越此前最好成績。這項研究揭示了基礎(chǔ)幾何知識對培養(yǎng)AI空間智能的重要價值。

浙江大學(xué)突破：讓AI專家團隊在考試時"動態(tài)組隊"，推理能力飆升

浙江大學(xué)突破：讓AI專家團隊在考試時"動態(tài)組隊"，推理能力飆升

2025-10-22 13:24

清華大學(xué)新突破：AI模型居然能學(xué)會"少說話多做事"，推理效率提升一倍還更準確

清華大學(xué)新突破：AI模型居然能學(xué)會"少說話多做事"，推理效率提升一倍還更準確

2025-10-22 13:24

南洋理工大學(xué)突破性研究：用AI實現(xiàn)多分鐘視頻實時流式生成，就像看電視直播一樣

南洋理工大學(xué)突破性研究：用AI實現(xiàn)多分鐘視頻實時流式生成，就像看電視直播一樣

2025-10-22 13:24

華中科技大學(xué)團隊突破性發(fā)現(xiàn)：讓AI像幾何學(xué)家一樣思考，竟能大幅提升空間理解能力

華中科技大學(xué)團隊突破性發(fā)現(xiàn)：讓AI像幾何學(xué)家一樣思考，竟能大幅提升空間理解能力

2025-10-22 10:14

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

友情鏈接

至頂網(wǎng)
管理現(xiàn)代化
和訊IT
TechWeb
第三媒體
速途網(wǎng)
51CTO傳媒
投資界
科技訊
智者新時代

京ICP證15039648號京ICP備15039648號-9 京公網(wǎng)安備 11010802021500號

北京第二十六維信息技術(shù)有限公司（至頂網(wǎng)）版權(quán)所有。 | 聯(lián)絡(luò)我們

舉報電話：010-62641205　涉未成年人舉報專線：010-62641208 舉報郵箱: jubao@zhiding.cn 　網(wǎng)上有害信息舉報專區(qū)：https://www.12377.cn