媒體世界日新月異,而Fraunhofer IIS始終主導(dǎo)著最先進音頻技術(shù)的發(fā)展。Fraunhofer IIS是一家音頻和多媒體技術(shù)的研究機構(gòu),借今年的中國國際信息通信展,他們又來到了中國,目的是讓更多的中國客戶認識他們。
在過去25年的時間里,F(xiàn)raunhofer集成電路研究所(IIS)音頻和多媒體部門始終專注于數(shù)字音頻技術(shù)的研發(fā)。作為MP3技術(shù)的發(fā)明者和AAC(高級音頻編碼)技術(shù)的聯(lián)合開發(fā)者,以及未來廣播電視領(lǐng)域的音頻技術(shù)開拓者Fraunhofer IIS將音頻技術(shù)創(chuàng)新變成了現(xiàn)實。
Toni Fiedler 德國Fraunhofer集成電路研究所(IIS)亞太區(qū)市場及業(yè)務(wù)發(fā)展總監(jiān)
(右)Matthias Rose 德國Fraunhofer集成電路研究所(IIS)音頻和多媒體營銷傳播總監(jiān)
Fraunhofer IIS 亞太區(qū)市場及業(yè)務(wù)發(fā)展總監(jiān)Toni Fiedler表示,F(xiàn)raunhofer IIS最大的愿景就是與移動運營商、 網(wǎng)絡(luò)服務(wù)提供商、廣播電視臺等緊密的合作為中國的消費電子企業(yè)帶來創(chuàng)新的音頻技術(shù),另一方面Fraunhofer IIS也十分愿意幫助中國企業(yè)走出去,攜手中國制造商和中小企業(yè)以滿足國際化的音頻標準和技術(shù)規(guī)范。
目前Fraunhofer IIS致力于研發(fā)兩大塊技術(shù):第一是xHE-AAC和MPEG H的音頻解碼,xHE-AAC是下一代廣播電視將會主要使用的編解碼;第二個是EVS(增強語音服務(wù)),將主要應(yīng)用于4G LTE領(lǐng)域。
今年,中國全面步入4G LTE時代。據(jù)GSMA移動智庫的研究數(shù)據(jù)顯示,預(yù)計到2020年底,中國的4G移動連接總數(shù)將從2014年的1億左右增至近9億。4G移動設(shè)備和服務(wù)將會在人們的工作和生活中扮演著越來越重要的角色。
顯然,LTE時代的高寬帶支持用戶使用很多大流量數(shù)據(jù)業(yè)務(wù),而語音業(yè)務(wù)仍將是手機終端的主要應(yīng)用。但遺憾的是,在我們使用手機打電話時,聽到的語音音質(zhì),幾十年來并沒有太大的不同。
目前3GPP在通信、音頻編解碼的技術(shù)標準上推進并制定全高清語音標準,這意味著在未來LTE的標準之下,整個語音通話的音質(zhì)標準會有大幅提升。
在本屆通信展上,F(xiàn)raunhofer IIS首次帶來4G 時代具有高效通信體驗的全高清語音會議技術(shù),EVS增強型語音服務(wù)以及能夠在平板電腦或智能手機上體驗到影院般的環(huán)繞聲音效的Fraunhofer Cingo技術(shù),以滿足4G用戶和設(shè)備的需求。
全高清語音會議技術(shù):該技術(shù)能夠使電話會議實現(xiàn)高端網(wǎng)真視頻會議般的通話體驗。由AAC-ELD音頻編解碼器實現(xiàn)的全高清語音通話,能夠使參與會議通話的用戶通過耳機感知其他會議參與者的方位,在這一場景下,所有的與會人員好像身處同一房間,因此彼此間的對話也變得更加自然,讓移動會議變得更加輕松和高效。
EVS:增強型語音服務(wù)(Enhanced Voice Service,EVS,TS 26.441)是專為LTE等分組交換網(wǎng)絡(luò)而設(shè)計的下一代3GPP實時通信編解碼器。在當前的目標應(yīng)用VoLTE(Voice over LTE)中使用EVS,可實現(xiàn)全高清語音通話質(zhì)量,而通話保真度可媲美當今所有數(shù)字媒體。通過該技術(shù),我們不僅可以進行自然的語音通信,而完整音頻頻譜還能夠再現(xiàn)音樂和環(huán)境氛圍。
Fraunhofer Cingo:借助Fraunhofer Cingo,無論是使用耳機還是內(nèi)置立體聲揚聲器,用戶能夠在平板電腦或智能手機上體驗到影院般的環(huán)繞聲音效體驗。Cingo不僅可以帶來極致的環(huán)繞聲音效體驗,而且還能將現(xiàn)有的立體聲內(nèi)容變得更加自然和清晰。此外,針對嘈雜的環(huán)境Cingo還具備響度優(yōu)化功能,能夠顯著提升對話和解說的清晰度。
Fraunhofer IIS先后研發(fā)了五代編解碼技術(shù),包括MP3格式,能夠提高編碼效率的AAC技術(shù)以及其組件,目前最流行的、幾乎在每部手機中都配備的HE-AAC技術(shù),主要應(yīng)用在通信領(lǐng)域、能夠?qū)崿F(xiàn)雙向低延遲通信的AAC-ELD技術(shù),以及應(yīng)用于4G LTE電信通信的技術(shù)。
Toni Fiedler提到,“Fraunhofer音頻技術(shù)的最大特征是向后兼容,如果企業(yè)使用了最新的解碼器xHE-AAC,那么之前所有的技術(shù)均能夠使用。因此現(xiàn)在的一些主流的電視臺,比如BBC、NHK和新加坡的MediaCorp都使用了我們的技術(shù)。”
此外,F(xiàn)raunhofer IIS還展出了拓展型HE-AAC技術(shù)方案。xHE-AAC是首個將語音和通用音頻編碼結(jié)合在一個統(tǒng)一系統(tǒng)中的MPEG音頻編解碼技術(shù),xHE-AAC極大提升了8~64 kbit/s及以上的低比特率音頻的音樂和語音品質(zhì),其可應(yīng)用于無線網(wǎng)絡(luò)和衛(wèi)星廣播系統(tǒng)中的音樂流媒體。
Fraunhofer IIS音頻和多媒體營銷傳播總監(jiān)Mathias Rose表示,目前在三網(wǎng)融合和OTT的大背景下,因為Fraunhofer的技術(shù)幾乎已經(jīng)被整合到所有的平臺當中,可以廣泛應(yīng)用于廣播、IT網(wǎng)絡(luò)和移動網(wǎng)絡(luò)中,讓廣播電視商可以將電視上的內(nèi)容傳輸?shù)狡桨搴褪謾C上進行播放,甚至可以做到將手機和平板上的音頻質(zhì)量達到電視的音效水平,這使得HE-AAC處于一個非常最有利的位置。
Fraunhofer IIS表示,目前已與中國的三大運營商建立聯(lián)系,并且Fraunhofer IIS推出的高清語音技術(shù)是能夠支持所有LTE標準,其設(shè)計的出發(fā)點就是希望以非常低的比特率來實現(xiàn)很高的音質(zhì)。
LTE主要是著眼于未來用戶會大量地進行視頻的下載以及可視通話等,F(xiàn)raunhofer IIS希望在音頻領(lǐng)域,消耗最低的碼率,達到最優(yōu)的語音體驗,避免出現(xiàn)網(wǎng)絡(luò)擁塞的情況。蘋果的Facetime就是一個很典型的基于VoIP的服務(wù)。
同時,F(xiàn)raunhofer IIS也在積極地嘗試與中國的中小企業(yè)展開合作,總之,幫助中國制造商以正確的方式來實施AAC系列的技術(shù)、使得他們在全球范圍內(nèi)保持競爭優(yōu)勢是Fraunhofer IIS堅持不懈的目標。
針對在中國市場的發(fā)展,Toni Fiedler表示:“我們幾乎和中國所有的移動運營商進行溝通,希望他們將HE-AAC技術(shù)應(yīng)用在更多的場景中,比如VoIP、VoLTE等技術(shù)在音樂和移動設(shè)備領(lǐng)域的應(yīng)用。此外,我們也極為重視與中小企業(yè)的合作,幫助中國制造商以正確的方式來實施我們的技術(shù),以使得他們在全球范圍內(nèi)保持領(lǐng)先優(yōu)勢。”
好文章,需要你的鼓勵
這項研究提出了"高效探測"方法,解決了掩碼圖像建模AI難以有效評估的問題。通過創(chuàng)新的多查詢交叉注意力機制,該方法在減少90%參數(shù)的同時實現(xiàn)10倍速度提升,在七個基準測試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質(zhì)量與分類性能的強相關(guān)性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應(yīng)性。團隊承諾開源全部代碼,推動技術(shù)普及應(yīng)用。
伊利諾伊大學(xué)研究團隊開發(fā)了CLAIMSPECT系統(tǒng),通過層次化分解復(fù)雜爭議、智能檢索相關(guān)文獻、多角度收集觀點的方法,將傳統(tǒng)的"真假"判斷轉(zhuǎn)變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動構(gòu)建爭議話題的分析框架,識別不同觀點及其支撐證據(jù),為科學(xué)和政治爭議提供更全面客觀的分析,已在生物醫(yī)學(xué)和國際關(guān)系領(lǐng)域驗證有效性。
清華大學(xué)研究團隊首次提出情感認知融合網(wǎng)絡(luò)(ECFN),讓AI能像人類一樣理解和表達情感。該系統(tǒng)通過多層次情感處理架構(gòu),在情感識別準確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實現(xiàn)了跨模態(tài)情感融合、動態(tài)情感追蹤和個性化情感建模,為醫(yī)療、教育、客服等領(lǐng)域帶來革命性應(yīng)用前景。
哈佛大學(xué)研究團隊通過創(chuàng)新的多智能體強化學(xué)習(xí)方法,讓AI在戰(zhàn)略游戲中學(xué)會復(fù)雜推理。研究發(fā)現(xiàn)AI通過游戲競爭能發(fā)展出類人思維能力,在邏輯推理、創(chuàng)造性解決問題等方面表現(xiàn)顯著提升。這項突破性成果為未來AI在醫(yī)療、教育、城市管理等領(lǐng)域的應(yīng)用奠定基礎(chǔ),展現(xiàn)了通過模擬人類學(xué)習(xí)過程培養(yǎng)真正智能AI的新路徑。