科技行者 8月30日 北京消息:28日,搜狗在京舉辦了開放聽寫服務(wù)暨AI創(chuàng)新聯(lián)盟發(fā)布會(huì)。發(fā)布會(huì)現(xiàn)場,搜狗官宣開放“搜狗聽寫”服務(wù),讓更多的錄音筆廠商享受AI紅利,并與愛國者,索尼,紐曼,萬城集團(tuán)四大頭部錄音筆廠商成立AI創(chuàng)新聯(lián)盟。
搜狗介紹,目前搜狗輸入法語音請求峰值已超7億次,穩(wěn)居全球最大的中文語音應(yīng)用,依托于此,搜狗聽寫服務(wù)背后的轉(zhuǎn)寫技術(shù)已處于行業(yè)領(lǐng)先地位。其中,實(shí)時(shí)語音轉(zhuǎn)寫運(yùn)用了搜狗自研的延遲可控的Adaptive Attention-based端到端建模技術(shù),非實(shí)時(shí)語音轉(zhuǎn)寫功能使用業(yè)界領(lǐng)先的深層Transformer-based端到端語音識(shí)別技術(shù),語音轉(zhuǎn)寫準(zhǔn)確率可達(dá)95%以上;在語音增強(qiáng)方面,搜狗自研的Smart Voice麥克風(fēng)陣列算法能夠?qū)υ肼暫突祉戇M(jìn)行多重深度優(yōu)化,確保人聲的高保真還原;在智能輔助編輯方面,搜狗語音轉(zhuǎn)寫可以通過云端智能糾錯(cuò)編輯技術(shù),基于詞圖搜索和輸入糾錯(cuò)模型,針對置信度低的轉(zhuǎn)寫結(jié)果提供多個(gè)候選詞,幫助用戶對轉(zhuǎn)寫結(jié)果進(jìn)行糾正,同時(shí)還具備了良好的自動(dòng)區(qū)分說話人、智能文本順滑和標(biāo)點(diǎn)預(yù)測等能力,可以為用戶提供更多便捷功能。
搜狗表示,自今年3月份發(fā)布一代搜狗智能錄音筆C1后,Q2時(shí)間里C1多次榮獲各大主流電商平臺(tái)銷冠,并宣布上周又發(fā)布了黃、紅、白等時(shí)尚炫彩版智能錄音筆,以滿足用戶多元化的需求。據(jù)悉,錄音筆C1擁有實(shí)時(shí)互譯、云端分享、中英同傳等多種AI功能。
值得一提的是,本次搜狗聽寫服務(wù)實(shí)現(xiàn)了與搜狗輸入法的打通,這不僅為聽寫服務(wù)帶來了流量和數(shù)據(jù)上的巨大優(yōu)勢,同時(shí)更是搜狗輸入法“表達(dá)信息更簡單”使命的延伸,也是搜狗聽寫服務(wù)相比其他語音轉(zhuǎn)寫平臺(tái)的優(yōu)勢所在。目前搜狗輸入法在PC端占有99%的市場份額,在手機(jī)端用戶日活超4.5億,搜狗聽寫服務(wù)基于搜狗輸入法的用戶使用習(xí)慣,能夠自動(dòng)構(gòu)建個(gè)性化識(shí)別網(wǎng)絡(luò),使用戶常用語錯(cuò)誤率下降40%。搜狗開放聽寫服務(wù)后,可以為市場上90%以上的錄音筆產(chǎn)品提供接入服務(wù),讓所有有需求的用戶享受“錄音1小時(shí),出稿5分鐘”的極致體驗(yàn)。
會(huì)上,搜狗與錄音筆行業(yè)的幾家頭部企業(yè)達(dá)成AI創(chuàng)新聯(lián)盟。聯(lián)盟達(dá)成將使錄音筆行業(yè)從以硬件為主的單一收益模式向硬件+服務(wù)的多種收益模式轉(zhuǎn)變,促進(jìn)錄音筆行業(yè)實(shí)現(xiàn)全面智能升級(jí),與AI創(chuàng)新深度融合。通過AI錄音筆創(chuàng)新、開放搜狗語音轉(zhuǎn)寫服務(wù)、建立AI創(chuàng)新聯(lián)盟,搜狗正從產(chǎn)品、技術(shù)與產(chǎn)業(yè)鏈三個(gè)方向,引領(lǐng)著錄音筆行業(yè)進(jìn)入AI時(shí)代。
好文章,需要你的鼓勵(lì)
這項(xiàng)研究提出了"高效探測"方法,解決了掩碼圖像建模AI難以有效評估的問題。通過創(chuàng)新的多查詢交叉注意力機(jī)制,該方法在減少90%參數(shù)的同時(shí)實(shí)現(xiàn)10倍速度提升,在七個(gè)基準(zhǔn)測試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質(zhì)量與分類性能的強(qiáng)相關(guān)性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應(yīng)性。團(tuán)隊(duì)承諾開源全部代碼,推動(dòng)技術(shù)普及應(yīng)用。
伊利諾伊大學(xué)研究團(tuán)隊(duì)開發(fā)了CLAIMSPECT系統(tǒng),通過層次化分解復(fù)雜爭議、智能檢索相關(guān)文獻(xiàn)、多角度收集觀點(diǎn)的方法,將傳統(tǒng)的"真假"判斷轉(zhuǎn)變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動(dòng)構(gòu)建爭議話題的分析框架,識(shí)別不同觀點(diǎn)及其支撐證據(jù),為科學(xué)和政治爭議提供更全面客觀的分析,已在生物醫(yī)學(xué)和國際關(guān)系領(lǐng)域驗(yàn)證有效性。
清華大學(xué)研究團(tuán)隊(duì)首次提出情感認(rèn)知融合網(wǎng)絡(luò)(ECFN),讓AI能像人類一樣理解和表達(dá)情感。該系統(tǒng)通過多層次情感處理架構(gòu),在情感識(shí)別準(zhǔn)確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達(dá)自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實(shí)現(xiàn)了跨模態(tài)情感融合、動(dòng)態(tài)情感追蹤和個(gè)性化情感建模,為醫(yī)療、教育、客服等領(lǐng)域帶來革命性應(yīng)用前景。
哈佛大學(xué)研究團(tuán)隊(duì)通過創(chuàng)新的多智能體強(qiáng)化學(xué)習(xí)方法,讓AI在戰(zhàn)略游戲中學(xué)會(huì)復(fù)雜推理。研究發(fā)現(xiàn)AI通過游戲競爭能發(fā)展出類人思維能力,在邏輯推理、創(chuàng)造性解決問題等方面表現(xiàn)顯著提升。這項(xiàng)突破性成果為未來AI在醫(yī)療、教育、城市管理等領(lǐng)域的應(yīng)用奠定基礎(chǔ),展現(xiàn)了通過模擬人類學(xué)習(xí)過程培養(yǎng)真正智能AI的新路徑。