科技行者 2月26日 北京消息(文/周雅):今日,搜狗公司舉辦了一場(chǎng)線(xiàn)上發(fā)布會(huì),正式發(fā)布S1、E1兩款A(yù)I錄音筆新品,其中S1售價(jià)2698元,E1售價(jià)1298元,即日起在京東天貓首發(fā)銷(xiāo)售,且同步發(fā)售兩款與故宮宮廷文化合作推出的故宮宮廷聯(lián)名款。
提起搜狗,人們的印象大多是「輸入法」以及「搜索引擎」,但基于此,這家公司正在布局 "以語(yǔ)言為核心的 AI 戰(zhàn)略",搜狗創(chuàng)始人兼CEO王小川曾經(jīng)在2019中國(guó)企業(yè)領(lǐng)袖年會(huì)上,分享了他對(duì)語(yǔ)言AI的觀察。
王小川稱(chēng),未來(lái)的語(yǔ)音人工智能硬件產(chǎn)品將有兩大發(fā)展趨勢(shì),一是從固定設(shè)備走向移動(dòng)化、便攜化和可穿戴化;第二是IO(輸入和輸出)導(dǎo)向,即通過(guò)麥克風(fēng)、各種傳感器、GPS、磁力計(jì)等,從環(huán)境當(dāng)中捕獲更多的數(shù)據(jù),逐步從人適應(yīng)機(jī)器走向機(jī)器適應(yīng)人。
基于這兩大趨勢(shì),王小川直言,“搜狗的目標(biāo),是做語(yǔ)言人工智能領(lǐng)域的引領(lǐng)者。”“語(yǔ)言是人工智能皇冠上的明珠。”王小川說(shuō),“甚至我們可以說(shuō)沒(méi)有語(yǔ)言,我們就沒(méi)有能力去做創(chuàng)造力和推理的能力。今天人工智能大家認(rèn)為它能解決重復(fù)性的事情,就是因?yàn)槿斯ぶ悄苓€沒(méi)有創(chuàng)造力和推理能力,就是因?yàn)閷?duì)語(yǔ)言沒(méi)有充分的理解,這就是我們要理解的問(wèn)題。”
自2012年起,搜狗就圍繞著自然交互和知識(shí)計(jì)算去發(fā)展核心的語(yǔ)言AI能力,近一年,搜狗在錄音筆方面頻頻落子。
2019 年 3 月,搜狗推出 AI 錄音筆 C1,據(jù)官方稱(chēng),C1首創(chuàng)集雙麥陣列、實(shí)時(shí)轉(zhuǎn)寫(xiě)、云端分享等功能于一體的 AI 錄音筆 " 新形態(tài) ",上市至今一直在多個(gè)主流電商平臺(tái)保持 " 單品總銷(xiāo)量第一 " 的成績(jī),其后推出的升級(jí)版 C1 Pro 也飽受好評(píng)。
除了產(chǎn)品本身,2019 年 8 月,搜狗還聯(lián)合愛(ài)國(guó)者、Newmine 紐曼、索尼錄音筆、萬(wàn)城集團(tuán)四家行業(yè)企業(yè),成立 AI 創(chuàng)新聯(lián)盟,并宣布面向全行業(yè)開(kāi)放聽(tīng)寫(xiě)服務(wù),利用自身 AI 技術(shù),為合作伙伴賦能。
以 AI 技術(shù),推動(dòng)傳統(tǒng)錄音筆行業(yè)轉(zhuǎn)型升級(jí),既是跨界也是創(chuàng)新,讓錄音筆這個(gè)多年沒(méi)有什么新氣象的行業(yè),有了新的玩法。在此過(guò)程中,搜狗不僅開(kāi)拓了 "AI 錄音筆 " 這一品類(lèi),并且通過(guò)開(kāi)放聽(tīng)寫(xiě)服務(wù)、建立 AI 創(chuàng)新聯(lián)盟,從產(chǎn)品、技術(shù)與產(chǎn)業(yè)鏈三個(gè)方向,帶動(dòng)錄音筆行業(yè)成功完成了產(chǎn)業(yè)升級(jí)。
AI錄音筆還能怎么玩?
AI錄音筆怎么玩,搜狗認(rèn)為,它可以是一個(gè)集語(yǔ)音、轉(zhuǎn)寫(xiě)、編輯、存儲(chǔ)和分享于一體的信息獲取工具。而S1和E1做到了語(yǔ)音、轉(zhuǎn)寫(xiě)、編輯、存儲(chǔ)、分享和翻譯功能。
但無(wú)論如何,既然是錄音筆,“錄音”就是最基礎(chǔ)的功能,而優(yōu)秀的拾音能力,從根本上決定著一款錄音筆的市場(chǎng)表現(xiàn)和生命力。具體到新品,S1具備AI降噪功能,它采用的pureVoice AI降噪算法,可過(guò)濾4萬(wàn)余種真實(shí)噪音,讓人聲收錄更清晰。從產(chǎn)品介紹來(lái)看,它不僅配備了2顆哈曼指向性麥克風(fēng),最遠(yuǎn)拾音距離可達(dá)10米,還配備有6顆全向麥克風(fēng),支持360°全向拾音。同時(shí)基于搜狗領(lǐng)先的clairVoice 8麥陣列算法,S1能夠?yàn)橛脩?hù)帶來(lái)超遠(yuǎn)場(chǎng)景且360°無(wú)死角的拾音體驗(yàn)。
除了錄音問(wèn)題,更多人在意的是,錄音之后的速記整理問(wèn)題。傳統(tǒng)錄音筆在錄音之后需要反復(fù)聽(tīng)寫(xiě),過(guò)程既耗時(shí)又枯燥,若碰到記憶或口音問(wèn)題,更讓人頭疼,而S1和E1的轉(zhuǎn)寫(xiě)功能很好地解決了這些問(wèn)題。在支持錄音實(shí)時(shí)轉(zhuǎn)文字、錄音文件轉(zhuǎn)文字的同時(shí),還具備增強(qiáng)識(shí)別能力,可識(shí)別不同講話(huà)人,掌聲,笑聲等,做到準(zhǔn)確分辨準(zhǔn)確轉(zhuǎn)寫(xiě)。
另外,兩款AI錄音筆均支持搜狗輸入法詞庫(kù)同步,均支持中英日韓德等10種語(yǔ)言、川粵津陜貴等10種方言的錄音和轉(zhuǎn)寫(xiě),此外,搜狗語(yǔ)音團(tuán)隊(duì)經(jīng)過(guò)長(zhǎng)時(shí)間訓(xùn)練,所創(chuàng)建的財(cái)經(jīng)貿(mào)易、醫(yī)療衛(wèi)生、IT科技、政法、文化體育等5個(gè)專(zhuān)業(yè)領(lǐng)域的語(yǔ)言模型,也應(yīng)用到了此次的新品當(dāng)中,以提升行業(yè)特有詞匯的識(shí)別準(zhǔn)確率。
搜狗表示,“兩款產(chǎn)品的轉(zhuǎn)寫(xiě)準(zhǔn)確率均高達(dá)98%。”
搜狗認(rèn)為,如果說(shuō)超強(qiáng)識(shí)音是AI錄音筆的基礎(chǔ)項(xiàng),準(zhǔn)確轉(zhuǎn)寫(xiě)是AI錄音筆的核心項(xiàng),那么高效整理就是AI錄音筆的加分項(xiàng)。在這一方面,S1與E1采用“業(yè)內(nèi)首創(chuàng)的”NLP引擎智能摘要技術(shù),可通過(guò)智能語(yǔ)義組織段落,自動(dòng)提煉關(guān)鍵字形成標(biāo)簽,智能提取段落摘要,方便用戶(hù)整理,還可以用語(yǔ)音一句話(huà)查找錄音內(nèi)容,同時(shí)可基于用戶(hù)的錄音標(biāo)記、錄音中的掌聲、笑聲等節(jié)點(diǎn)提取內(nèi)容重點(diǎn)并進(jìn)行匯總。基于云端存儲(chǔ)技術(shù),用戶(hù)還能在錄音筆、手機(jī) APP、網(wǎng)頁(yè)、PC 客戶(hù)端等,自動(dòng)同步和管理錄音數(shù)據(jù),并實(shí)現(xiàn)一鍵導(dǎo)出、掃碼分享等便捷操作。
除了拾音、轉(zhuǎn)寫(xiě)、整理之外,S1與E1帶來(lái)的額外“驚喜”,無(wú)疑是它們的翻譯能力,是“業(yè)內(nèi)首個(gè)”支持個(gè)人同傳功能的錄音筆,支持實(shí)時(shí)中英互譯,還支持微信小程序多人接入、共享翻譯內(nèi)容。S1支持全球200個(gè)國(guó)家63種語(yǔ)言的在線(xiàn)翻譯,以及中、英、日、韓、法、俄等9種常用語(yǔ)言的離線(xiàn)翻譯,其“行業(yè)首創(chuàng)的”自由對(duì)話(huà)翻譯功能,可實(shí)現(xiàn)多場(chǎng)景下的自在交流。
圖為搜狗AI錄音筆歷代產(chǎn)品參數(shù)
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專(zhuān)家搜索方法,讓AI能根據(jù)不同問(wèn)題靈活調(diào)整內(nèi)部專(zhuān)家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類(lèi)型問(wèn)題偏愛(ài)不同專(zhuān)家配置,為AI推理優(yōu)化開(kāi)辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過(guò)"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話(huà)多且準(zhǔn)確率低"的問(wèn)題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開(kāi)發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過(guò)滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問(wèn)題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開(kāi)辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過(guò)讓AI模型學(xué)習(xí)解決幾何問(wèn)題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來(lái)顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會(huì)友,左手硬核科技,右手浪漫主義。