av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

<style id="qbs06"></style>

<sub id="qbs06"></sub>

^{<blockquote id="qbs06"></blockquote>}

微信掃一掃，關(guān)注公眾號

科技行者
算力行者

見證連接與計算的「力量」

阿里公布新語音合成技術(shù) 錄音10分鐘定制AI語音

阿里巴巴語音合成人工智能

阿里公布新語音合成技術(shù) 錄音10分鐘定制AI語音

作者：科技行者

2019-07-10 18:23

分享至：

近日，阿里發(fā)布新一代語音合成技術(shù)KAN-TTS，大幅提高合成語音與真人發(fā)聲的相似度，并將語音合成定制成本降低10倍以上。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2019-07-10 18:23 ? 科技行者

科技行者 7月10日北京消息：近日，阿里發(fā)布新一代語音合成技術(shù)KAN-TTS，大幅提高合成語音與真人發(fā)聲的相似度，并將語音合成定制成本降低10倍以上。

阿里AI的這項突破，將問世80年的語音合成（TTS）技術(shù)推向幾可亂真的水平，有望通過圖靈測試。

當(dāng)前業(yè)界商用系統(tǒng)的合成語音與原始音頻錄音的接近程度通常在85%到90%之間，而基于KAN-TTS技術(shù)的合成語音可將該數(shù)據(jù)提高到97%以上。

KAN-TTS由達(dá)摩院機器智能實驗室自主研發(fā)，深度融合了目前主流的端到端TTS技術(shù)和傳統(tǒng)TTS技術(shù)，從多個方面改進(jìn)了語音合成。

傳統(tǒng)語音合成定制需要10小時以上的數(shù)據(jù)錄制和標(biāo)注，對錄音人和錄音環(huán)境要求很高。從啟動定制到最終交付，項目周期長成本高。

阿里利用Multi-Speaker Model與Speaker-aware Advanced Transfer Learning相結(jié)合的方法，將語音合成定制成本降低10倍以上，周期壓縮3倍以上。也就是說，用1小時有效錄音數(shù)據(jù)和不到兩個月制作周期，就能完成一次標(biāo)準(zhǔn)TTS定制。

普通用戶定制“AI聲音”的門檻更低。只需手機錄音十分鐘，就能獲得與錄制聲音高度相似的合成語音。阿里AI做到這一點，主要基于自動數(shù)據(jù)檢查、自動標(biāo)注方法和對海量用戶場景的利用。

阿里已經(jīng)對外提供開箱即用的TTS解決方案，共有通用、客服、童聲、英文和方言5個場景的34種高品質(zhì)聲音供選擇。

基于新一代技術(shù)，阿里還顯著提高了設(shè)備端離線TTS的效果。這在超低資源設(shè)備端的TTS服務(wù)中非常有用，比如當(dāng)人們駕車行駛于信號微弱區(qū)域，阿里技術(shù)能避免語音導(dǎo)航“掉線”。

阿里巴巴語音合成人工智能

分享至

0贊

好文章，需要你的鼓勵

推薦文章

人工智能
動態(tài)專家搜索
推理優(yōu)化

2025-10-22 13:24

浙江大學(xué)突破：讓AI專家團(tuán)隊在考試時"動態(tài)組隊"，推理能力飆升

浙江大學(xué)團(tuán)隊提出動態(tài)專家搜索方法，讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率，且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置，為AI推理優(yōu)化開辟新路徑。
人工智能
強化學(xué)習(xí)
模型優(yōu)化

2025-10-22 13:24

清華大學(xué)新突破：AI模型居然能學(xué)會"少說話多做事"，推理效率提升一倍還更準(zhǔn)確

清華大學(xué)研究團(tuán)隊提出SIRI方法，通過"壓縮-擴張"交替訓(xùn)練策略，成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實驗顯示，該方法在數(shù)學(xué)競賽題上將模型準(zhǔn)確率提升43.2%的同時，輸出長度減少46.9%，真正實現(xiàn)了效率與性能的雙重優(yōu)化，為AI模型訓(xùn)練提供了新思路。
人工智能
視頻生成
實時流媒體

2025-10-22 13:24

南洋理工大學(xué)突破性研究：用AI實現(xiàn)多分鐘視頻實時流式生成，就像看電視直播一樣

南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊開發(fā)出Rolling Forcing技術(shù)，實現(xiàn)AI視頻實時流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓(xùn)練算法三項創(chuàng)新，解決了長視頻生成中的錯誤累積問題，可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻，延遲僅0.76秒，質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01，為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
人工智能
幾何學(xué)習(xí)
空間智能

2025-10-22 10:14

華中科技大學(xué)團(tuán)隊突破性發(fā)現(xiàn)：讓AI像幾何學(xué)家一樣思考，竟能大幅提升空間理解能力

華中科技大學(xué)研究團(tuán)隊發(fā)現(xiàn)，通過讓AI模型學(xué)習(xí)解決幾何問題，能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集，使用強化學(xué)習(xí)方法訓(xùn)練多個AI模型。實驗結(jié)果顯示，幾何訓(xùn)練在四個空間智能測試基準(zhǔn)上都帶來顯著提升，其中最佳模型達(dá)到49.6%準(zhǔn)確率，超越此前最好成績。這項研究揭示了基礎(chǔ)幾何知識對培養(yǎng)AI空間智能的重要價值。

浙江大學(xué)突破：讓AI專家團(tuán)隊在考試時"動態(tài)組隊"，推理能力飆升

浙江大學(xué)突破：讓AI專家團(tuán)隊在考試時"動態(tài)組隊"，推理能力飆升

2025-10-22 13:24

清華大學(xué)新突破：AI模型居然能學(xué)會"少說話多做事"，推理效率提升一倍還更準(zhǔn)確

清華大學(xué)新突破：AI模型居然能學(xué)會"少說話多做事"，推理效率提升一倍還更準(zhǔn)確

2025-10-22 13:24

南洋理工大學(xué)突破性研究：用AI實現(xiàn)多分鐘視頻實時流式生成，就像看電視直播一樣

南洋理工大學(xué)突破性研究：用AI實現(xiàn)多分鐘視頻實時流式生成，就像看電視直播一樣

2025-10-22 13:24

華中科技大學(xué)團(tuán)隊突破性發(fā)現(xiàn)：讓AI像幾何學(xué)家一樣思考，竟能大幅提升空間理解能力

華中科技大學(xué)團(tuán)隊突破性發(fā)現(xiàn)：讓AI像幾何學(xué)家一樣思考，竟能大幅提升空間理解能力

2025-10-22 10:14

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

友情鏈接

至頂網(wǎng)
管理現(xiàn)代化
和訊IT
TechWeb
第三媒體
速途網(wǎng)
51CTO傳媒
投資界
科技訊
智者新時代

京ICP證15039648號京ICP備15039648號-9 京公網(wǎng)安備 11010802021500號

北京第二十六維信息技術(shù)有限公司（至頂網(wǎng)）版權(quán)所有。 | 聯(lián)絡(luò)我們

舉報電話：010-62641205　涉未成年人舉報專線：010-62641208 舉報郵箱: jubao@zhiding.cn 　網(wǎng)上有害信息舉報專區(qū)：https://www.12377.cn

<cite id="yscqz"></cite>

<s id="yscqz"><li id="yscqz"></li></s>