3月22日,釘釘在“科技向?qū)?middot;萬(wàn)物生長(zhǎng)”發(fā)布會(huì)上推出了業(yè)界第一款單機(jī)實(shí)現(xiàn)10米高清音視頻體驗(yàn)的視頻會(huì)議一體機(jī)——F2。釘釘F2采用了行業(yè)領(lǐng)先的高通高性能物聯(lián)網(wǎng)芯片,帶來(lái)強(qiáng)大的計(jì)算和AI性能,進(jìn)一步支持協(xié)作辦公體驗(yàn)和企業(yè)生產(chǎn)力的提升。
隨著云會(huì)議的興起,音視頻與計(jì)算機(jī)視覺(jué)、圖像處理、人工智能等技術(shù)的融合趨勢(shì)也愈發(fā)明顯,共同帶來(lái)高清實(shí)時(shí)的協(xié)同辦公體驗(yàn)。釘釘F2具備單機(jī)10米清晰拾音、智能導(dǎo)播、4K畫(huà)質(zhì)等特點(diǎn)。
在音頻方面,釘釘F2采用麥克風(fēng)陣列技術(shù),首次將麥克風(fēng)聲學(xué)特性和差分波束理論的優(yōu)勢(shì)進(jìn)行結(jié)合,實(shí)現(xiàn)了單機(jī)10米清晰拾音的突破;在視覺(jué)方面,釘釘F2采用多模態(tài)智能導(dǎo)播與視覺(jué)智能算法,結(jié)合頂級(jí)高通物聯(lián)網(wǎng)芯片先進(jìn)的CPU架構(gòu)、高通AI引擎和圖像信號(hào)處理器(ISP)帶來(lái)頂級(jí)性能,可支持最高4K、120幀/秒的視頻處理,實(shí)現(xiàn)對(duì)全空間任意位置的細(xì)節(jié)捕捉,為企業(yè)和個(gè)人用戶(hù)提供實(shí)時(shí)高清畫(huà)質(zhì)。此外,釘釘F2還充分利用高通物聯(lián)網(wǎng)芯片的計(jì)算性能,為發(fā)言人跟蹤、多畫(huà)面自動(dòng)導(dǎo)播等邊緣側(cè)計(jì)算密集型AI功能提供全新的神經(jīng)處理單元,帶來(lái)更具沉浸感的智能會(huì)議體驗(yàn)。
在滿足大中型會(huì)議室高清音視頻體驗(yàn)的同時(shí),如何應(yīng)對(duì)設(shè)備部署、布線繁瑣等難題,成為行業(yè)亟待解決的痛點(diǎn)。以往要滿足高端會(huì)議設(shè)備的音視頻性能要求,通常要采用2到3顆主控級(jí)聯(lián);此次釘釘F2采用了突破性的一體機(jī)形態(tài),僅通過(guò)一顆高通高性能物聯(lián)網(wǎng)芯片即可實(shí)現(xiàn)兼具高質(zhì)量圖像接入及處理能力、強(qiáng)勁的編解碼性能、AI算力以及支持豐富的通用接口等特性,讓All in One的設(shè)計(jì)成為可能,在減少會(huì)議設(shè)備部署的同時(shí)極大地簡(jiǎn)化了設(shè)計(jì)和成本。
釘釘F2視頻會(huì)議一體機(jī)是行業(yè)最新的技術(shù)合作成果,利用前沿的高性能、低功耗計(jì)算技術(shù)創(chuàng)新,更好地服務(wù)于組織數(shù)字化和業(yè)務(wù)數(shù)字化。釘釘F2不僅為用戶(hù)提供了音視頻遠(yuǎn)程協(xié)同溝通的能力,還通過(guò)專(zhuān)用的會(huì)議室硬件終端設(shè)備,打造會(huì)議室與個(gè)人端之間一致的優(yōu)質(zhì)會(huì)議體驗(yàn),并通過(guò)音視頻算法及模組的集成,引領(lǐng)行業(yè)創(chuàng)新并對(duì)生態(tài)進(jìn)行技術(shù)賦能,助力更多組織加速邁入數(shù)字化時(shí)代。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專(zhuān)家搜索方法,讓AI能根據(jù)不同問(wèn)題靈活調(diào)整內(nèi)部專(zhuān)家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類(lèi)型問(wèn)題偏愛(ài)不同專(zhuān)家配置,為AI推理優(yōu)化開(kāi)辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過(guò)"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問(wèn)題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開(kāi)發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過(guò)滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問(wèn)題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開(kāi)辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過(guò)讓AI模型學(xué)習(xí)解決幾何問(wèn)題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來(lái)顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。