CNET科技資訊網(wǎng) 9月1日 北京消息: 9月1日,2016年百度世界在北京中國大飯店舉行。百度創(chuàng)始人、董事長兼CEO李彥宏向外界第一次揭開了百度大腦的神秘面紗。集“語音、圖像、自然語言處理和用戶畫像”四大核心能力于一體的百度大腦,經(jīng)過多年的技術(shù)積累,也讓打磨了一年的進(jìn)化版“度秘”,可以媲美真人的體育賽事解說、多語言翻譯等能力,更讓人們看到了“百度大腦”下自然語言處理技術(shù)的日新月異。
在李彥宏看來,人工智能發(fā)展到今天,語音的能力已經(jīng)非常強(qiáng)大,并進(jìn)入到了較為成熟的實(shí)用階段;圖像的能力也有了長足的進(jìn)展,越來越多地被人們認(rèn)可和使用;而同樣作為“百度大腦”四大核心功能之一的自然語言處理技術(shù),難度系數(shù)卻更高。 “語音和圖像技術(shù)更多處在認(rèn)知的階段,而自然語言理解除了要有認(rèn)知能力之外,還需要邏輯推理能力、規(guī)劃能力等等,目前還處在更早期的發(fā)展階段中”,李彥宏說。今天的度秘可能在某些條件下依然聽不懂人類的語言和需求,但這也意味著,自然語言的理解和處理能力還有很大的發(fā)展空間。隨著自然語言處理技術(shù)的發(fā)展,度秘得以展現(xiàn)出更為智能的表達(dá)、也為人們拓展出更為多元的服務(wù)。
演講的中間,李彥宏現(xiàn)場展示了度秘新獲得的一個(gè)能力:解說籃球。著名籃球評(píng)論員楊毅也來到現(xiàn)場,當(dāng)面向李彥宏夸贊了曾與他一起解說比賽的度秘。今年奧運(yùn)會(huì)期間,度秘團(tuán)隊(duì)“約戰(zhàn)”楊毅,共同解說了一場男子籃球賽。解說當(dāng)天,原本看似極具挑戰(zhàn)意味的“人機(jī)大戰(zhàn)”,最終卻變成了一次“友誼合作”——基于計(jì)算機(jī)海量存儲(chǔ)和高效計(jì)算能力、特別是自然語言處理技術(shù)的度秘,在學(xué)習(xí)了幾百場比賽之后,不僅很好地幫助楊毅分析了各種賽況,也用其截然不同的語言風(fēng)格,為楊毅一貫的專業(yè)版解說增添了不少趣味性,“機(jī)智”的度秘讓楊毅感到“出乎意料”,并表示,“度秘對比賽基本知識(shí)的儲(chǔ)備可能比我還強(qiáng),男籃決賽時(shí)語速的加快也更符合體育競技的標(biāo)準(zhǔn)??梢韵胂?,如果成為這項(xiàng)產(chǎn)品逐漸成熟,未來就可以為球迷在看比賽時(shí)解答更多問題,成為球迷的好朋友。”
對于度秘整體技術(shù)能力的進(jìn)階,李彥宏談到,和傳統(tǒng)的文字搜索方式相比,度秘與用戶間的溝通方式已經(jīng)非常不一樣了。 “現(xiàn)在人們與度秘的交互,超過一半都是通過語音或者圖像來完成的”,李彥宏指出,語音和圖像的交互占比已達(dá)到56%,正逐步超越傳統(tǒng)文字的使用頻次,成為人們表達(dá)需求的主流方式。
除了度秘在自然語言處理能力上的應(yīng)用,李彥宏提到,機(jī)器翻譯領(lǐng)域?qū)ψ匀徽Z言理解的技術(shù)同樣相當(dāng)依賴。他介紹,如今的百度翻譯已經(jīng)能夠支持27種語言之間的互譯,隨著技術(shù)的不斷成熟,不同語言互譯衍生的幾百個(gè)翻譯方向能力也將逐漸純熟,而這樣的翻譯也定將給人們帶來不可估量的便利和價(jià)值。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長視頻生成中的錯(cuò)誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測試基準(zhǔn)上都帶來顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對培養(yǎng)AI空間智能的重要價(jià)值。