移動互聯(lián)網(wǎng)已經(jīng)成為互聯(lián)網(wǎng)行業(yè)兵家競爭最激烈的領(lǐng)域之一,各路企業(yè)紛紛以用戶需求為導(dǎo)向進(jìn)行發(fā)展布局。
9月3日,2014年百度世界大會上,百度董事長兼CEO李彥宏與業(yè)界分享了一個關(guān)于用戶行為變化的重要洞察:未來五年用戶的移動需求會發(fā)生質(zhì)的變化,通過語音、圖像等非文字形式表達(dá)的用戶需求將超過50%。
李彥宏指出,移動用戶正在逐漸脫離傳統(tǒng)鍵盤輸入習(xí)慣,相比較鍵盤這樣需要經(jīng)過長久學(xué)習(xí)才能掌握的工具,通過語音、圖像等方式表達(dá)搜索請求,是最自然的,本能的表達(dá)需求方式。它所帶來用戶行為的轉(zhuǎn)變,也注定會成為移動互聯(lián)網(wǎng)最重要入口。
發(fā)展心理學(xué)的研究表明,人類所獲取的70%的外部信息來自視覺,因此人類跟周邊世界中人和物的溝通以及交互,極其依賴于圖像;而從嬰幼兒牙牙學(xué)語開始,通過語言溝通實(shí)現(xiàn)需求表達(dá)即成為人類的本能。因此,在李彥宏看來,移動互聯(lián)網(wǎng)正不斷推動語音、圖像等需求表達(dá),這樣的用戶行為變化也說明未來的科技將更加回歸自然、貼近人性。
當(dāng)前移動網(wǎng)絡(luò)基礎(chǔ)能力的增強(qiáng)使網(wǎng)速大幅提高,為用戶使用語音提供了良好的環(huán)境;智能設(shè)備的推陳出新,也為語音提供了高質(zhì)量的輸入條件。而全民低成本造圖,日均數(shù)億量級的社會化圖片分享也為移動互聯(lián)網(wǎng)提供了大量圖片數(shù)據(jù)。這一趨勢,在移動互聯(lián)網(wǎng)技術(shù)依托下,讓圖像識別、語義理解和人機(jī)對話連在一起,幫助用戶完成任務(wù)。當(dāng)用戶需求隨著技術(shù)自由實(shí)現(xiàn)急劇增長,未來將足夠引起一個劃時代的變革。
“我們正在積極的努力,在技術(shù)上進(jìn)行研發(fā),不斷提升我們的語音識別和圖像識別能力,更好地滿足用戶的需求”,李彥宏說。
試想一下,當(dāng)你在街上看到一個商標(biāo),用攝像頭對其進(jìn)行拍照,后臺可以先進(jìn)行提取,再進(jìn)行模板匹配的方法進(jìn)行圖像結(jié)算——與其特征進(jìn)行匹配,給出用戶最想要的結(jié)果——包括價格、購買信息甚至一鍵下單;對手機(jī)說“中午我想吃漢堡”,12點(diǎn)準(zhǔn)時外賣在敲門,這樣的行為真正地回歸了自然的方式,更方便、更人性地傳遞著互聯(lián)網(wǎng)技術(shù)改變?nèi)藗兩畹闹卮笠饬x。而這些想象,以李彥宏的趨勢洞察來審視,相信會在不遠(yuǎn)的將來即將實(shí)現(xiàn)。
不僅如此,李彥宏在百度世界上還宣布“百度筷搜”1.0版本問世,對于這樣一款僅憑概念就火爆業(yè)界的產(chǎn)品,“百度筷搜”已經(jīng)能夠?qū)崿F(xiàn)檢測油質(zhì)優(yōu)劣、水質(zhì)酸堿度等交互功能,無疑正在向成為“非文字需求”的更多典型應(yīng)用場景而努力。
尼葛洛·龐帝早在《數(shù)字化生存》中提到,信息完全取決于我們眼中所見的品質(zhì)。經(jīng)過近年的技術(shù)研究與布局,百度的語音、圖像技術(shù)現(xiàn)在已經(jīng)到了破繭而出的關(guān)鍵時刻,而李彥宏和他掌舵的百度,正依靠技術(shù)積累和創(chuàng)新,在把握未來用戶移動需求之路上得以先行,并催生移動互聯(lián)網(wǎng)變革的春天
好文章,需要你的鼓勵
這項研究提出了"高效探測"方法,解決了掩碼圖像建模AI難以有效評估的問題。通過創(chuàng)新的多查詢交叉注意力機(jī)制,該方法在減少90%參數(shù)的同時實(shí)現(xiàn)10倍速度提升,在七個基準(zhǔn)測試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質(zhì)量與分類性能的強(qiáng)相關(guān)性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應(yīng)性。團(tuán)隊承諾開源全部代碼,推動技術(shù)普及應(yīng)用。
伊利諾伊大學(xué)研究團(tuán)隊開發(fā)了CLAIMSPECT系統(tǒng),通過層次化分解復(fù)雜爭議、智能檢索相關(guān)文獻(xiàn)、多角度收集觀點(diǎn)的方法,將傳統(tǒng)的"真假"判斷轉(zhuǎn)變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動構(gòu)建爭議話題的分析框架,識別不同觀點(diǎn)及其支撐證據(jù),為科學(xué)和政治爭議提供更全面客觀的分析,已在生物醫(yī)學(xué)和國際關(guān)系領(lǐng)域驗(yàn)證有效性。
清華大學(xué)研究團(tuán)隊首次提出情感認(rèn)知融合網(wǎng)絡(luò)(ECFN),讓AI能像人類一樣理解和表達(dá)情感。該系統(tǒng)通過多層次情感處理架構(gòu),在情感識別準(zhǔn)確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達(dá)自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實(shí)現(xiàn)了跨模態(tài)情感融合、動態(tài)情感追蹤和個性化情感建模,為醫(yī)療、教育、客服等領(lǐng)域帶來革命性應(yīng)用前景。
哈佛大學(xué)研究團(tuán)隊通過創(chuàng)新的多智能體強(qiáng)化學(xué)習(xí)方法,讓AI在戰(zhàn)略游戲中學(xué)會復(fù)雜推理。研究發(fā)現(xiàn)AI通過游戲競爭能發(fā)展出類人思維能力,在邏輯推理、創(chuàng)造性解決問題等方面表現(xiàn)顯著提升。這項突破性成果為未來AI在醫(yī)療、教育、城市管理等領(lǐng)域的應(yīng)用奠定基礎(chǔ),展現(xiàn)了通過模擬人類學(xué)習(xí)過程培養(yǎng)真正智能AI的新路徑。