在聯(lián)想Tech World 科技創(chuàng)新大會上,李彥宏作為壓軸嘉賓出場,他一出場便邀請楊元慶去吃韓國菜,面對講韓語的服務(wù)員和寫滿了韓語的菜單,李彥宏的解決辦法是運用百度的人工智能,將韓文菜單進行語音翻譯。
聯(lián)想TechWorld科技創(chuàng)新大會現(xiàn)場
早在今年兩會期間,李彥宏提出了中國大腦提議,今天他對外展示了百度在這方面的研發(fā)進展,他說:“事實上百度在過去幾年想做的一個項目是百度大腦,這相當(dāng)于中國大腦的迷你版本。迷你版的智能水平達到了三四歲孩子的智力。”
百度公司創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏
計算機的人工智能不僅可以讓你聽得懂,也可以讓你看得明白。李彥宏開場演示的百度語音翻譯就是百度人工智能的一個體現(xiàn)。
李彥宏在現(xiàn)場進行演講
根據(jù)李彥宏介紹:百度翻譯APP目前可支持包括希臘語、葡萄牙語在內(nèi)的18種語言。而百度翻譯的運行原理就是通過大數(shù)據(jù)、人工智能以及機器的學(xué)習(xí)來實現(xiàn)。語音識別通過語音翻譯,來領(lǐng)會到不同語種間的每句話的意思。當(dāng)然他建議"計算機的人工智能不僅要讓人聽得懂,并且還要看得明白。怎樣使得機器看得懂信息,是百度在人工智能方面當(dāng)前需要努力解決的重要問題。"
此外百度人工智能還可以通過2D照片還原出3D場景。比如在尼泊爾地震中,很多加德滿都的文化遺產(chǎn)都被毀了,很多用戶將自己拍攝的古建筑圖片傳到網(wǎng)絡(luò)上,如果是傳統(tǒng)意義上,我們看圖片都是靜態(tài)孤立的一張張圖,并且由于每個人拍照角度不同,就會形成無數(shù)人圍繞很多古建筑拍攝了多張照片的錯覺。那百度要做什么?李彥宏說“百度可以根據(jù)一張照片來判斷這個人拍攝的角度是什么角度,是站在地上的什么位置去拍了古建筑。單單靠一個照片我們判斷不出來角度,判斷不出來時間。但是當(dāng)無數(shù)個照片都串在一起的時候,我們用人工智能的技術(shù)就可以搞清楚在哪個角度是哪個時間拍的,合成起來就成為了還原的古建筑的形象。”
李彥宏還現(xiàn)場演示了看圖說話,“它的原理是通過百度大腦智能讀取信息內(nèi)容,從而理解人在問什么問題。”從演示中我們可以看到看圖說話能辨識人打網(wǎng)球、用網(wǎng)球拍照、辨識道路禁止停車紅色標(biāo)志等。
李彥宏現(xiàn)場演示看圖說話
從歷史的角度看,人工智能已經(jīng)有50-60年歷史,但基本上都不實用,因為頭50年基本上都是學(xué)術(shù)性的探討。不過李彥宏對人工智能的未來表示樂觀。他說"最近幾年隨著計算能力的增加、計算成本的降低,原來我們不敢想、不能做的事情現(xiàn)在能想了、能做了。"而隨著聯(lián)想、微軟、英特爾包括百度等眾多公司間的不斷競爭與促進,人才的激發(fā)與創(chuàng)造,從而可以讓技術(shù)真正改變普通人的生活,從而改變整個世界。
所以,他認(rèn)為:"現(xiàn)在只是剛剛開始,其實其實人工智能還可以做很多的東西。未來隨著我們創(chuàng)新的繼續(xù),隨著大數(shù)據(jù)積累越來越多,隨著人工智能技術(shù)不斷推進,百度大腦會越來越接近一個普通人或成年人的智力水平。"
好文章,需要你的鼓勵
浙江大學(xué)團隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團隊提出SIRI方法,通過"壓縮-擴張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實驗顯示,該方法在數(shù)學(xué)競賽題上將模型準(zhǔn)確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團隊開發(fā)出Rolling Forcing技術(shù),實現(xiàn)AI視頻實時流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓(xùn)練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團隊發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強化學(xué)習(xí)方法訓(xùn)練多個AI模型。實驗結(jié)果顯示,幾何訓(xùn)練在四個空間智能測試基準(zhǔn)上都帶來顯著提升,其中最佳模型達到49.6%準(zhǔn)確率,超越此前最好成績。這項研究揭示了基礎(chǔ)幾何知識對培養(yǎng)AI空間智能的重要價值。