科技行者 2月26日 北京消息(文/周雅):今日,搜狗公司舉辦了一場(chǎng)線上發(fā)布會(huì),正式發(fā)布S1、E1兩款A(yù)I錄音筆新品,其中S1售價(jià)2698元,E1售價(jià)1298元,即日起在京東天貓首發(fā)銷售,且同步發(fā)售兩款與故宮宮廷文化合作推出的故宮宮廷聯(lián)名款。
提起搜狗,人們的印象大多是「輸入法」以及「搜索引擎」,但基于此,這家公司正在布局 "以語(yǔ)言為核心的 AI 戰(zhàn)略",搜狗創(chuàng)始人兼CEO王小川曾經(jīng)在2019中國(guó)企業(yè)領(lǐng)袖年會(huì)上,分享了他對(duì)語(yǔ)言AI的觀察。
王小川稱,未來(lái)的語(yǔ)音人工智能硬件產(chǎn)品將有兩大發(fā)展趨勢(shì),一是從固定設(shè)備走向移動(dòng)化、便攜化和可穿戴化;第二是IO(輸入和輸出)導(dǎo)向,即通過(guò)麥克風(fēng)、各種傳感器、GPS、磁力計(jì)等,從環(huán)境當(dāng)中捕獲更多的數(shù)據(jù),逐步從人適應(yīng)機(jī)器走向機(jī)器適應(yīng)人。
基于這兩大趨勢(shì),王小川直言,“搜狗的目標(biāo),是做語(yǔ)言人工智能領(lǐng)域的引領(lǐng)者。”“語(yǔ)言是人工智能皇冠上的明珠。”王小川說(shuō),“甚至我們可以說(shuō)沒(méi)有語(yǔ)言,我們就沒(méi)有能力去做創(chuàng)造力和推理的能力。今天人工智能大家認(rèn)為它能解決重復(fù)性的事情,就是因?yàn)槿斯ぶ悄苓€沒(méi)有創(chuàng)造力和推理能力,就是因?yàn)閷?duì)語(yǔ)言沒(méi)有充分的理解,這就是我們要理解的問(wèn)題。”
自2012年起,搜狗就圍繞著自然交互和知識(shí)計(jì)算去發(fā)展核心的語(yǔ)言AI能力,近一年,搜狗在錄音筆方面頻頻落子。
2019 年 3 月,搜狗推出 AI 錄音筆 C1,據(jù)官方稱,C1首創(chuàng)集雙麥陣列、實(shí)時(shí)轉(zhuǎn)寫(xiě)、云端分享等功能于一體的 AI 錄音筆 " 新形態(tài) ",上市至今一直在多個(gè)主流電商平臺(tái)保持 " 單品總銷量第一 " 的成績(jī),其后推出的升級(jí)版 C1 Pro 也飽受好評(píng)。
除了產(chǎn)品本身,2019 年 8 月,搜狗還聯(lián)合愛(ài)國(guó)者、Newmine 紐曼、索尼錄音筆、萬(wàn)城集團(tuán)四家行業(yè)企業(yè),成立 AI 創(chuàng)新聯(lián)盟,并宣布面向全行業(yè)開(kāi)放聽(tīng)寫(xiě)服務(wù),利用自身 AI 技術(shù),為合作伙伴賦能。
以 AI 技術(shù),推動(dòng)傳統(tǒng)錄音筆行業(yè)轉(zhuǎn)型升級(jí),既是跨界也是創(chuàng)新,讓錄音筆這個(gè)多年沒(méi)有什么新氣象的行業(yè),有了新的玩法。在此過(guò)程中,搜狗不僅開(kāi)拓了 "AI 錄音筆 " 這一品類,并且通過(guò)開(kāi)放聽(tīng)寫(xiě)服務(wù)、建立 AI 創(chuàng)新聯(lián)盟,從產(chǎn)品、技術(shù)與產(chǎn)業(yè)鏈三個(gè)方向,帶動(dòng)錄音筆行業(yè)成功完成了產(chǎn)業(yè)升級(jí)。
AI錄音筆還能怎么玩?
AI錄音筆怎么玩,搜狗認(rèn)為,它可以是一個(gè)集語(yǔ)音、轉(zhuǎn)寫(xiě)、編輯、存儲(chǔ)和分享于一體的信息獲取工具。而S1和E1做到了語(yǔ)音、轉(zhuǎn)寫(xiě)、編輯、存儲(chǔ)、分享和翻譯功能。
但無(wú)論如何,既然是錄音筆,“錄音”就是最基礎(chǔ)的功能,而優(yōu)秀的拾音能力,從根本上決定著一款錄音筆的市場(chǎng)表現(xiàn)和生命力。具體到新品,S1具備AI降噪功能,它采用的pureVoice AI降噪算法,可過(guò)濾4萬(wàn)余種真實(shí)噪音,讓人聲收錄更清晰。從產(chǎn)品介紹來(lái)看,它不僅配備了2顆哈曼指向性麥克風(fēng),最遠(yuǎn)拾音距離可達(dá)10米,還配備有6顆全向麥克風(fēng),支持360°全向拾音。同時(shí)基于搜狗領(lǐng)先的clairVoice 8麥陣列算法,S1能夠?yàn)橛脩魩?lái)超遠(yuǎn)場(chǎng)景且360°無(wú)死角的拾音體驗(yàn)。
除了錄音問(wèn)題,更多人在意的是,錄音之后的速記整理問(wèn)題。傳統(tǒng)錄音筆在錄音之后需要反復(fù)聽(tīng)寫(xiě),過(guò)程既耗時(shí)又枯燥,若碰到記憶或口音問(wèn)題,更讓人頭疼,而S1和E1的轉(zhuǎn)寫(xiě)功能很好地解決了這些問(wèn)題。在支持錄音實(shí)時(shí)轉(zhuǎn)文字、錄音文件轉(zhuǎn)文字的同時(shí),還具備增強(qiáng)識(shí)別能力,可識(shí)別不同講話人,掌聲,笑聲等,做到準(zhǔn)確分辨準(zhǔn)確轉(zhuǎn)寫(xiě)。
另外,兩款AI錄音筆均支持搜狗輸入法詞庫(kù)同步,均支持中英日韓德等10種語(yǔ)言、川粵津陜貴等10種方言的錄音和轉(zhuǎn)寫(xiě),此外,搜狗語(yǔ)音團(tuán)隊(duì)經(jīng)過(guò)長(zhǎng)時(shí)間訓(xùn)練,所創(chuàng)建的財(cái)經(jīng)貿(mào)易、醫(yī)療衛(wèi)生、IT科技、政法、文化體育等5個(gè)專業(yè)領(lǐng)域的語(yǔ)言模型,也應(yīng)用到了此次的新品當(dāng)中,以提升行業(yè)特有詞匯的識(shí)別準(zhǔn)確率。
搜狗表示,“兩款產(chǎn)品的轉(zhuǎn)寫(xiě)準(zhǔn)確率均高達(dá)98%。”
搜狗認(rèn)為,如果說(shuō)超強(qiáng)識(shí)音是AI錄音筆的基礎(chǔ)項(xiàng),準(zhǔn)確轉(zhuǎn)寫(xiě)是AI錄音筆的核心項(xiàng),那么高效整理就是AI錄音筆的加分項(xiàng)。在這一方面,S1與E1采用“業(yè)內(nèi)首創(chuàng)的”NLP引擎智能摘要技術(shù),可通過(guò)智能語(yǔ)義組織段落,自動(dòng)提煉關(guān)鍵字形成標(biāo)簽,智能提取段落摘要,方便用戶整理,還可以用語(yǔ)音一句話查找錄音內(nèi)容,同時(shí)可基于用戶的錄音標(biāo)記、錄音中的掌聲、笑聲等節(jié)點(diǎn)提取內(nèi)容重點(diǎn)并進(jìn)行匯總。基于云端存儲(chǔ)技術(shù),用戶還能在錄音筆、手機(jī) APP、網(wǎng)頁(yè)、PC 客戶端等,自動(dòng)同步和管理錄音數(shù)據(jù),并實(shí)現(xiàn)一鍵導(dǎo)出、掃碼分享等便捷操作。
除了拾音、轉(zhuǎn)寫(xiě)、整理之外,S1與E1帶來(lái)的額外“驚喜”,無(wú)疑是它們的翻譯能力,是“業(yè)內(nèi)首個(gè)”支持個(gè)人同傳功能的錄音筆,支持實(shí)時(shí)中英互譯,還支持微信小程序多人接入、共享翻譯內(nèi)容。S1支持全球200個(gè)國(guó)家63種語(yǔ)言的在線翻譯,以及中、英、日、韓、法、俄等9種常用語(yǔ)言的離線翻譯,其“行業(yè)首創(chuàng)的”自由對(duì)話翻譯功能,可實(shí)現(xiàn)多場(chǎng)景下的自在交流。
圖為搜狗AI錄音筆歷代產(chǎn)品參數(shù)
好文章,需要你的鼓勵(lì)
這項(xiàng)研究提出了"高效探測(cè)"方法,解決了掩碼圖像建模AI難以有效評(píng)估的問(wèn)題。通過(guò)創(chuàng)新的多查詢交叉注意力機(jī)制,該方法在減少90%參數(shù)的同時(shí)實(shí)現(xiàn)10倍速度提升,在七個(gè)基準(zhǔn)測(cè)試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質(zhì)量與分類性能的強(qiáng)相關(guān)性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應(yīng)性。團(tuán)隊(duì)承諾開(kāi)源全部代碼,推動(dòng)技術(shù)普及應(yīng)用。
伊利諾伊大學(xué)研究團(tuán)隊(duì)開(kāi)發(fā)了CLAIMSPECT系統(tǒng),通過(guò)層次化分解復(fù)雜爭(zhēng)議、智能檢索相關(guān)文獻(xiàn)、多角度收集觀點(diǎn)的方法,將傳統(tǒng)的"真假"判斷轉(zhuǎn)變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動(dòng)構(gòu)建爭(zhēng)議話題的分析框架,識(shí)別不同觀點(diǎn)及其支撐證據(jù),為科學(xué)和政治爭(zhēng)議提供更全面客觀的分析,已在生物醫(yī)學(xué)和國(guó)際關(guān)系領(lǐng)域驗(yàn)證有效性。
清華大學(xué)研究團(tuán)隊(duì)首次提出情感認(rèn)知融合網(wǎng)絡(luò)(ECFN),讓AI能像人類一樣理解和表達(dá)情感。該系統(tǒng)通過(guò)多層次情感處理架構(gòu),在情感識(shí)別準(zhǔn)確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達(dá)自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實(shí)現(xiàn)了跨模態(tài)情感融合、動(dòng)態(tài)情感追蹤和個(gè)性化情感建模,為醫(yī)療、教育、客服等領(lǐng)域帶來(lái)革命性應(yīng)用前景。
哈佛大學(xué)研究團(tuán)隊(duì)通過(guò)創(chuàng)新的多智能體強(qiáng)化學(xué)習(xí)方法,讓AI在戰(zhàn)略游戲中學(xué)會(huì)復(fù)雜推理。研究發(fā)現(xiàn)AI通過(guò)游戲競(jìng)爭(zhēng)能發(fā)展出類人思維能力,在邏輯推理、創(chuàng)造性解決問(wèn)題等方面表現(xiàn)顯著提升。這項(xiàng)突破性成果為未來(lái)AI在醫(yī)療、教育、城市管理等領(lǐng)域的應(yīng)用奠定基礎(chǔ),展現(xiàn)了通過(guò)模擬人類學(xué)習(xí)過(guò)程培養(yǎng)真正智能AI的新路徑。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會(huì)友,左手硬核科技,右手浪漫主義。