CNET科技資訊網(wǎng) 7月5日 北京消息(文/周雅):在今天百度AI開(kāi)發(fā)者大會(huì)上,百度度秘事業(yè)部的總經(jīng)理景鯤一上場(chǎng),接連從口袋里掏出了三款DuerOS開(kāi)發(fā)套件和一款硬件參考設(shè)計(jì)。比景鯤的“魔術(shù)”更神奇的,就是他變出來(lái)的這些開(kāi)發(fā)套件。“只要接一個(gè)電源,接一個(gè)麥克風(fēng),就可以讓你身邊的家電設(shè)備‘說(shuō)話’了。”
百度人工智能操作系統(tǒng)DuerOS于今年1月在CES上推出。在百度的官方定義中,DuerOS 是一個(gè)“開(kāi)放平臺(tái)”,一種承載新技術(shù)應(yīng)用的生態(tài)系統(tǒng)。
DuerOS開(kāi)放平臺(tái),包括智能設(shè)備開(kāi)放平臺(tái)和技能開(kāi)放平臺(tái)。而支撐這兩個(gè)平臺(tái)的則是DuerOS對(duì)話核心系統(tǒng),通過(guò)幫助開(kāi)發(fā)者最大程度降低對(duì)話式人工智能系統(tǒng)的應(yīng)用門(mén)檻,實(shí)現(xiàn)“喚醒萬(wàn)物”。
在景鯤看來(lái),喚醒萬(wàn)物的核心三要素在于:聽(tīng)清,聽(tīng)懂和滿足。
1、聽(tīng)清是喚醒萬(wàn)物的第一要素。目前,百度語(yǔ)音識(shí)別準(zhǔn)確率達(dá)到97%,百度深度語(yǔ)音識(shí)別系統(tǒng)Deep Speech2入選MIT 2016十大突破性技術(shù)。但這些語(yǔ)音技術(shù)在AI時(shí)代還遠(yuǎn)遠(yuǎn)不夠。景鯤表示,“百度還做了非常多先進(jìn)的技術(shù),包括麥克風(fēng)陣列、回聲消除、語(yǔ)音喚醒、遠(yuǎn)場(chǎng)識(shí)別等,并將這些技術(shù)根植入家庭場(chǎng)景、移動(dòng)場(chǎng)景、車(chē)載場(chǎng)景,實(shí)現(xiàn)用戶聽(tīng)清的需求。”
2、DuerOS是最能聽(tīng)懂用戶的開(kāi)放平臺(tái),而數(shù)據(jù)多和技術(shù)深成為DuerOS聽(tīng)懂用戶的重要支撐。數(shù)據(jù)層面,百度擁有億級(jí)用戶請(qǐng)求、十億級(jí)的知識(shí)圖譜實(shí)體、語(yǔ)音調(diào)用和音頻數(shù)據(jù)、千億的圖片和網(wǎng)頁(yè)等數(shù)據(jù);技術(shù)層面,百度在深度學(xué)習(xí)、自然語(yǔ)言處理技術(shù)、多輪對(duì)話技術(shù)、搜索技術(shù)等方面具有深厚的實(shí)踐經(jīng)驗(yàn)積。
3、聽(tīng)懂并滿足“聽(tīng)一首某某的歌”這樣的用戶需求還不夠,真正用戶想要的是更自然、更復(fù)雜的需求,比如“我要聽(tīng)我手一杯品嘗你的美這首歌”,比如“想聽(tīng)哥哥的歌”,只有把用戶在真實(shí)場(chǎng)景中表達(dá)的復(fù)雜請(qǐng)求做好,才能真正做出一個(gè)真正聽(tīng)懂用戶需求的產(chǎn)品。
景鯤說(shuō),“‘聽(tīng)懂’的目標(biāo),就是要FreeStyle,讓用戶最自然地跟設(shè)備進(jìn)行交互,毫無(wú)拘束。”他現(xiàn)場(chǎng)演示了利用DuerOS的多輪交互過(guò)程,這種交互只有百度的技術(shù)才能驅(qū)動(dòng)。通過(guò)連續(xù)發(fā)問(wèn):“找一找本地人氣最火爆的家常菜”、“雍和宮附近有嗎”、“第二家有什么推薦菜”、“有wifi嗎”、“好停車(chē)嗎”……多輪連續(xù)展開(kāi)的對(duì)話,景鯤都得到了答案。
為了更好地“喚醒萬(wàn)物”,百度宣布將全資收購(gòu)KITT.AI,并將智能設(shè)備語(yǔ)音喚醒和自然語(yǔ)言處理等核心能力免費(fèi)開(kāi)放,賦能合作伙伴。KITT.AI是一家專注于語(yǔ)音喚醒和自然語(yǔ)言理解的人工智能創(chuàng)業(yè)公司,在2017年1月入選了CB Insights公布的“最值得關(guān)注的100家人工智能公司”,曾獲得亞馬遜Alexa和AI2(微軟聯(lián)合創(chuàng)始人保羅阿倫)的投資,擁有世界領(lǐng)先的人工智能技術(shù)。
“在聽(tīng)清聽(tīng)懂的基礎(chǔ)上,也需要有優(yōu)質(zhì)豐富的資源來(lái)滿足用戶的需求。”景鯤介紹說(shuō),DuerOS將為開(kāi)發(fā)者提供最容易上手的軟硬件一體化解決方案,包括多樣化的開(kāi)發(fā)套件和完全開(kāi)放的參考設(shè)計(jì):
1、搭載樹(shù)莓派,利用科勝訊技術(shù)的個(gè)人版。即刻申請(qǐng)就可以搭載一個(gè)個(gè)人可以對(duì)話的語(yǔ)音設(shè)備。
2、輕量版。把一元錢(qián)大小的芯片放在任何一個(gè)設(shè)備里面,設(shè)備就可以對(duì)話。
3、標(biāo)準(zhǔn)版。兩麥、四麥、六麥、八麥的標(biāo)準(zhǔn)版都可以即刻申請(qǐng)。
4、完整一體化的參考設(shè)計(jì)。如開(kāi)放電路板設(shè)計(jì)、開(kāi)放結(jié)構(gòu)設(shè)計(jì)、開(kāi)放麥克風(fēng)陣列等等。
手機(jī)、電視、冰箱等任何設(shè)備,都可以搭載DuerOS,變成一個(gè)能“聽(tīng)懂”的設(shè)備。
個(gè)人開(kāi)發(fā)者杜志鵬現(xiàn)場(chǎng)講述的故事,也印證了設(shè)備開(kāi)放平臺(tái)非常容易上手。這位來(lái)自深圳的電子工程師利用DuerOS的開(kāi)發(fā)套件,將外甥的樂(lè)高玩具改造成為會(huì)說(shuō)話的智能玩具。
來(lái)自度秘的百度工程師羅興現(xiàn)場(chǎng)演示了“如何將百度DuerOS的能力接入搭載Alexa的Anker音箱”,展示了智能設(shè)備開(kāi)放平臺(tái)的便捷性。羅興通過(guò)十七行代碼,用1分鐘的時(shí)間,讓原本只會(huì)英文的音箱馬上變得能聽(tīng)懂中國(guó)話。
景鯤表示,“目前很多公司都在做智能音箱,而百度通過(guò)打造AI時(shí)代的安卓——DuerOS,讓每個(gè)人,無(wú)論你是大公司還是小公司,甚至普通開(kāi)發(fā)者,都能夠以低門(mén)檻打造屬于自己的智能語(yǔ)音交互設(shè)備。”
目前,百度DuerOS已經(jīng)與中信國(guó)安廣視、小魚(yú)在家、美的、海爾、聯(lián)想、HTC等企業(yè)達(dá)成合作,將DuerOS的對(duì)話能力應(yīng)用到多個(gè)生活場(chǎng)景。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專家搜索方法,讓AI能根據(jù)不同問(wèn)題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類(lèi)型問(wèn)題偏愛(ài)不同專家配置,為AI推理優(yōu)化開(kāi)辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過(guò)"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問(wèn)題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開(kāi)發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過(guò)滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問(wèn)題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開(kāi)辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過(guò)讓AI模型學(xué)習(xí)解決幾何問(wèn)題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來(lái)顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。