科技行者 9月19日 北京消息: 9月19日,百度地圖在“‘音’為有你,更有‘AI’”發(fā)布會上正式發(fā)布“語音定制功能”,內(nèi)部代號“百雀靈”。它是全球首個地圖語音定制產(chǎn)品。用戶只需在百度地圖App上錄制20句話,20分鐘左右即可生成個人完整語音包,為即將到來的國慶出行帶來前所未有的新鮮體驗。
“百度地圖的工程師們內(nèi)部叫它‘百雀靈’,百雀是大自然中各種鳥兒的總稱,它們有各種美妙好聽的聲音,‘百雀靈’寓意著千千萬萬的用戶,都能在百度地圖錄制自己的語音包,用自己獨特的聲音,向所愛的人表達關心與陪伴。”百度地圖事業(yè)部總經(jīng)理李瑩表示:“語音定制功能是AI賦能百度地圖的又一力作,我們希望這一次語音技術與百度地圖的融合,能夠釋放科技力量,讓每個人都感受到科技進步帶來的改變和情懷。”
(百度地圖事業(yè)部總經(jīng)理李瑩)
定制專屬語音包的流程十分簡單,只需打開百度地圖App,喚醒“小度小度”后說“錄制我的語音”,或點擊百度地圖首頁的“出行助手”后進入“語音定制”,便可開啟語音定制之旅。在安靜的環(huán)境中,只要跟著百度地圖的指引,念出卡通和影視臺詞等充滿趣味性的錄制文本,等待20分鐘左右,就能擁有一個自己專屬的語音包,并在百度地圖的景區(qū)智能語音導覽、智能語音交互、導航等全部場景使用,大家可免費使用自己或家人的語音包暢游景區(qū)聽播報。此外,錄制的個人語音包還可以分享給親朋好友,無論是思念游子的父母、還是異地的戀人都能通過地圖語音包與親人更“近”一步。用戶的“人氣”語音包還有機會獲得百度地圖官方推薦,成為地圖“好聲音”。
(喊“小度小度”開啟語音包錄制)
過去,制作地圖語音包需要在專業(yè)錄音棚錄制大量語料,再經(jīng)過長達數(shù)月的制作才能生成,流程復雜、耗時長,讓地圖語音包只是“明星專屬”?,F(xiàn)在,有了百度地圖的語音定制功能,人人都可以是“大明星”。
隨著語音定制功能的上線,百度地圖“銀河計劃”也正式啟動,首期邀請到華晨宇、秦嵐等當紅藝人參與個人語音包錄制,成為百度地圖“明星導航員”,讓用戶的每一次出行新鮮感十足。“銀河計劃”的發(fā)布意味著明星語音包錄制的門檻被大大降低,并且人人都可錄制明星品質的語音包,浩如星瀚,給人無限遐想。
百度地圖語音定制功能背后,是百度大腦語音技術的賦能。AI技術的加持讓地圖語音包生產(chǎn)實現(xiàn)了從月級別到分鐘級別的突破性進展,也重新定義了語音包的生產(chǎn)模式。
百度語音首席架構師賈磊在發(fā)布會現(xiàn)場揭秘了背后的技術:“百度地圖語音定制功能基于百度獨創(chuàng)的說話人韻律遷移技術Meitron,其特點主要體現(xiàn)在發(fā)音人音色轉換,多情感朗讀和韻律風格遷移三個方面,從而讓個性化語音合成的定制門檻大大降低,相信百度語音技術在AI時代擁有無限可能”。
(百度語音首席架構師賈磊)
很多家長想給自家萌寶錄制語音包,但又不免會擔心萌寶有發(fā)音不清晰、停頓不規(guī)律、普通話不標準的情況,百度地圖語音定制功能也克服了這類問題,實現(xiàn)了兒童音的完美合成。當天,百度地圖與寶寶巴士發(fā)起“快樂啟蒙 安全出發(fā)”倡議,上線“奇奇妙妙”語音包,通過此類卡通語音包幫助家長在駕車出行場景中安撫寶寶的情緒,為出行安全保駕護航。
對于用戶非常關心的音頻數(shù)據(jù)安全問題,百度地圖表示,百度地圖對于語音定制服務的權限獲取將僅用作語音包錄制,不做他用。百度地圖未經(jīng)用戶的授權同意,不會將用戶的語音包共享給任何人。
在AI技術的深度加持下,新一代人工智能地圖——百度地圖持續(xù)創(chuàng)新和領先。未來,百度地圖還將繼續(xù)加速,為用戶提供更加安全、智能、高效的出行服務。這個十一黃金周,帶上自己的專屬語音包、帶上人工智能地圖出發(fā)吧!
好文章,需要你的鼓勵
浙江大學團隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調整內(nèi)部專家配置。該方法在數(shù)學、編程等任務上顯著提升推理準確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學研究團隊提出SIRI方法,通過"壓縮-擴張"交替訓練策略,成功解決了大型推理模型"話多且準確率低"的問題。實驗顯示,該方法在數(shù)學競賽題上將模型準確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓練提供了新思路。
南洋理工大學與騰訊聯(lián)合研究團隊開發(fā)出Rolling Forcing技術,實現(xiàn)AI視頻實時流式生成的重大突破。該技術通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質量視頻,延遲僅0.76秒,質量漂移指標從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學研究團隊發(fā)現(xiàn),通過讓AI模型學習解決幾何問題,能夠顯著提升其空間理解能力。他們構建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強化學習方法訓練多個AI模型。實驗結果顯示,幾何訓練在四個空間智能測試基準上都帶來顯著提升,其中最佳模型達到49.6%準確率,超越此前最好成績。這項研究揭示了基礎幾何知識對培養(yǎng)AI空間智能的重要價值。