av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

微信掃一掃,關(guān)注公眾號(hào)

  • 科技行者

  • 算力行者

見證連接與計(jì)算的「力量」

首頁(yè) 對(duì)話他山科技馬揚(yáng):如何通過觸覺感知技術(shù),推動(dòng)機(jī)器人商業(yè)落地?

對(duì)話他山科技馬揚(yáng):如何通過觸覺感知技術(shù),推動(dòng)機(jī)器人商業(yè)落地?

2025-04-25 19:25
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2025-04-25 19:25 ? 金旺

對(duì)話他山科技馬揚(yáng):如何通過觸覺感知技術(shù),推動(dòng)機(jī)器人商業(yè)落地?

作者 | 金旺

欄目 | 機(jī)器人新紀(jì)元

2023年12月,特斯拉Optimus一個(gè)公開演示視頻,讓人們?cè)俅螌?duì)人形機(jī)器人熱血沸騰。

在這個(gè)視頻中,特斯拉展示的第二代人形機(jī)器人尤其手部靈巧操作能力驚艷出眾,特斯拉官方還將Optimus抓取雞蛋時(shí)手部實(shí)時(shí)的信號(hào)反饋在視頻中進(jìn)行了展示。

而這樣實(shí)時(shí)的信號(hào)反饋源自于一項(xiàng)關(guān)鍵技術(shù)的引入,這項(xiàng)技術(shù)就是觸覺傳感器技術(shù)。

觸覺傳感器技術(shù)起步并不算早,但卻在近年來(lái)被視為機(jī)器人,尤其是人形機(jī)器人靈巧操作能力的一項(xiàng)關(guān)鍵技術(shù)。

他山科技就是這樣一支研究觸覺傳感器的團(tuán)隊(duì),在2022年研發(fā)出首款觸覺感知芯片后,如今他山科技的機(jī)器人指尖傳感器已經(jīng)是國(guó)內(nèi)市占率最高的觸覺傳感器。

在近日的第二屆中國(guó)人形機(jī)器人與具身智能產(chǎn)業(yè)大會(huì)上,我們與他山科技CEO馬揚(yáng)進(jìn)行了一場(chǎng)對(duì)話,一起聊了聊他山科技的成長(zhǎng)經(jīng)歷、觸覺傳感器的研發(fā)難題,以及人形機(jī)器人的商業(yè)化路徑。

01 執(zhí)行任務(wù)的機(jī)器人,需要觸覺傳感器

2017年,時(shí)值國(guó)內(nèi)早期機(jī)器人創(chuàng)業(yè)潮,當(dāng)時(shí)的宇樹剛剛研發(fā)出第一款四足機(jī)器人Laikago,優(yōu)必選、達(dá)闥作為國(guó)內(nèi)第一批機(jī)器人創(chuàng)業(yè)團(tuán)隊(duì)更是風(fēng)頭正盛。

他山科技正是在這一年成立,不過,他山科技的成立還有另一個(gè)故事。

作為他山科技創(chuàng)始人,他山科技董事長(zhǎng)孫滕諶很早就意識(shí)到了機(jī)器人在養(yǎng)老陪護(hù)方向的巨大潛力。

老年人在心智上與小孩類似,但同時(shí)又會(huì)有各種各樣的要求,家庭保姆往往很難滿足老年人各種近乎苛刻的要求。

更何況,隨著老齡化不斷加劇,越來(lái)越多老年人有了養(yǎng)老和看護(hù)的需求,既能任勞任怨地照顧老人、又能進(jìn)行全天候看護(hù)的機(jī)器人在這一領(lǐng)域就有了巨大的應(yīng)用潛力。

于是,同樣希望做機(jī)器人的他山科技在這一年正式成立。

有所不同的是,他山科技并未選擇整機(jī)研發(fā)這一路徑,而是選擇了機(jī)器人觸覺感知這一極具挑戰(zhàn)性,對(duì)機(jī)器人卻又至關(guān)重要的細(xì)分賽道,觸覺傳感器。

觸覺感知是機(jī)器人實(shí)現(xiàn)泛化能力的一項(xiàng)關(guān)鍵技術(shù),不僅是技術(shù)難題,更是機(jī)器人實(shí)現(xiàn)廣泛應(yīng)用的關(guān)鍵所在。

然而,在2017年前后,國(guó)外諸如波士頓動(dòng)力這樣的人形機(jī)器人先驅(qū),機(jī)器人產(chǎn)品還處于“跑跳”階段,國(guó)內(nèi)機(jī)器人創(chuàng)業(yè)團(tuán)隊(duì)更多聚焦于交互層面,還沒有哪個(gè)團(tuán)隊(duì)機(jī)器人有用到觸覺傳感器。

對(duì)話他山科技馬揚(yáng):如何通過觸覺感知技術(shù),推動(dòng)機(jī)器人商業(yè)落地?

不過,馬揚(yáng)告訴我們,“機(jī)器人要真正能執(zhí)行任務(wù),代替人做各種工作,對(duì)靈巧手有著很高的要求,而靈巧手上最關(guān)鍵的就是能夠做任務(wù)執(zhí)行的觸覺傳感器。”

他山科技的第一款觸覺感知芯片是在2019年作為北京市重點(diǎn)合作項(xiàng)目立項(xiàng)研發(fā),對(duì)于他山科技而言,這是一個(gè)機(jī)會(huì),也讓他們面臨著巨大挑戰(zhàn)。

隨后,經(jīng)過三年技術(shù)攻關(guān),他山科技在2022年點(diǎn)亮第一款觸覺感知芯片,這款觸覺感知芯片也被視為“全球首款數(shù)模混合AI觸覺感知芯片”。

在完成芯片研發(fā)后,第二年,他山科技又完成了執(zhí)行端的研發(fā),并與清華大學(xué)人工智能觸覺團(tuán)隊(duì)聯(lián)合開發(fā)了視觸覺融合的自適應(yīng)抓取靈巧手。

據(jù)馬揚(yáng)透露,“當(dāng)時(shí)這一代靈巧手是基于夾爪做的,做完之后我們非常興奮,因?yàn)槲覀冏隽艘豁?xiàng)行業(yè)中開創(chuàng)性的技術(shù)。”

對(duì)話他山科技馬揚(yáng):如何通過觸覺感知技術(shù),推動(dòng)機(jī)器人商業(yè)落地?

“史無(wú)前例”帶來(lái)的是另一種壓力,當(dāng)這款產(chǎn)品被他山科技團(tuán)隊(duì)推向市場(chǎng)后,他們發(fā)現(xiàn),這樣一款被他們視為劃時(shí)代的產(chǎn)品在市場(chǎng)上卻鮮有人問津,一年下來(lái),只有一些做機(jī)器人技術(shù)研發(fā)的高校實(shí)驗(yàn)室買了他們的產(chǎn)品。

這樣的局面一直持續(xù)到了2023年年底。

2023年,在人形機(jī)器人大潮洶涌來(lái)襲時(shí),不少汽車廠商開始下場(chǎng)做人形機(jī)器人,汽車廠商本就是觸覺傳感器的早期用戶,對(duì)觸覺傳感器有著更深的理解。

更重要的是,作為這波人形機(jī)器人浪潮的引領(lǐng)者,特斯拉在2023年12月發(fā)布的第二代Optimus人形機(jī)器人上引入了觸覺傳感器,對(duì)外展示的演示視頻在全球范圍內(nèi)得到了廣泛關(guān)注。

對(duì)話他山科技馬揚(yáng):如何通過觸覺感知技術(shù),推動(dòng)機(jī)器人商業(yè)落地?

也是在這一年年底,一家正在研發(fā)人形機(jī)器人的汽車廠商找到他山科技,一次性下單了50個(gè)觸覺傳感器。

他山科技終于等到了機(jī)器人的新一波浪潮,等到了觸覺傳感器登上歷史舞臺(tái)的時(shí)刻。

02 將抓取任務(wù)成功率提升到90%

大模型,是推動(dòng)觸覺傳感器走向商用的一大助力。

“如果模型能力沒有跟上,應(yīng)用在靈巧手上的觸覺傳感器只有感知能力、沒有執(zhí)行能力是不夠的,”談及觸覺傳感器的作用,馬揚(yáng)解釋稱,“只有當(dāng)擁有了具備一定泛化性的模型,才能支撐觸覺傳感器做任務(wù)執(zhí)行。”

正是基于這樣的理解,他山科技在2019年成立的AI觸覺感知實(shí)驗(yàn)室不僅研發(fā)了觸覺感知芯片和指尖觸覺傳感器,還一直在研發(fā)觸覺感知算法模型。

讓馬揚(yáng)感觸頗深的是,大模型的技術(shù)突破,加速了這一進(jìn)程。

馬揚(yáng)告訴我們,“實(shí)際上,這波人形機(jī)器人的熱潮來(lái)臨與大模型技術(shù)發(fā)展不無(wú)關(guān)系,基于大模型技術(shù)訓(xùn)練機(jī)器人底層通用模型,模型的迭代速度是六七年前不敢想象的。”

就觸覺感知算法模型而言,六七年前花費(fèi)半年進(jìn)行的研發(fā)工作,現(xiàn)在可能一兩天就能完成,他山科技的VTLA任務(wù)分解與協(xié)同執(zhí)行模型就是在這樣的技術(shù)加速下完成的。

對(duì)話他山科技馬揚(yáng):如何通過觸覺感知技術(shù),推動(dòng)機(jī)器人商業(yè)落地?

指尖觸覺傳感器中的模型該如何做?

他山科技團(tuán)隊(duì)最初的想法是,盡可能讓能在手端解決的問題在手端解決,不用交由腦端。

如果不用到云端算力的話,機(jī)器人的腦端算力資源非常緊張,目前來(lái)看仍不夠用,所以最初在做模型設(shè)計(jì)時(shí),他山科技團(tuán)隊(duì)設(shè)計(jì)的手端模型架構(gòu)分為兩步:

第一步,先將數(shù)據(jù)稀疏化。觸覺傳感器采集到的數(shù)據(jù)來(lái)自多個(gè)通道,他山科技團(tuán)隊(duì)先將這些來(lái)自不同通道的原始數(shù)據(jù)轉(zhuǎn)化為物理變量,最終給到腦部的數(shù)據(jù)盡可能是高密度且有效的數(shù)據(jù)。

第二步,在手端完成動(dòng)作執(zhí)行。當(dāng)機(jī)器人完成抓取動(dòng)作后,物體的移動(dòng)、遞交等動(dòng)作執(zhí)行放到手端來(lái)完成。

關(guān)于其中的玄機(jī),馬揚(yáng)解釋稱,“機(jī)器人執(zhí)行抓取動(dòng)作時(shí),在將物體拿起來(lái)這個(gè)過程的動(dòng)作是非常泛化的,即便是同樣一個(gè)水杯放在那里,由于涉及到材料老化等問題,每次抓取物體的反饋都不同,但一旦成功將物體抓起來(lái)、進(jìn)入穩(wěn)態(tài)后,再進(jìn)行移動(dòng)、遞交等動(dòng)作時(shí)就變得非常收斂。”

對(duì)話他山科技馬揚(yáng):如何通過觸覺感知技術(shù),推動(dòng)機(jī)器人商業(yè)落地?

正是基于這些考量,他山科技研發(fā)了VTLA(視覺-觸覺-語(yǔ)言-動(dòng)作)任務(wù)分解與協(xié)同執(zhí)行模型,基于這一模型,可以將一個(gè)動(dòng)作執(zhí)行的長(zhǎng)任務(wù)進(jìn)行分解:

在任務(wù)獲取時(shí),根據(jù)視覺模型、語(yǔ)言模型做任務(wù)輸入;

在任務(wù)執(zhí)行時(shí),通過觸覺模型做任務(wù)執(zhí)行,再輔以視覺模型做任務(wù)檢查,然后通過大模型做任務(wù)輸出。

據(jù)馬揚(yáng)透露,“機(jī)器人在基于VTLA模型執(zhí)行任務(wù)時(shí),數(shù)據(jù)端算力使用可以降低一個(gè)數(shù)量級(jí),任務(wù)執(zhí)行成功率可以提升到90%以上。”

即便如此,觸覺感知技術(shù)仍然處于早期階段。

03 觸覺傳感器,缺少行業(yè)標(biāo)準(zhǔn)

關(guān)于觸覺感知技術(shù)的成熟度,馬揚(yáng)給了我們一個(gè)更直觀的對(duì)比數(shù)據(jù),“如果說視覺感知技術(shù)的成熟度能達(dá)到90分的話,樂觀估計(jì),現(xiàn)在的觸覺傳感器只有60分。”

之所以有這樣的差距,是因?yàn)橐曈X感知技術(shù)自上個(gè)世紀(jì)八十年代研發(fā)至今,已經(jīng)經(jīng)過了近半個(gè)世紀(jì)的發(fā)展,無(wú)論是技術(shù)標(biāo)準(zhǔn),還是軟硬件,都已經(jīng)有了長(zhǎng)足的發(fā)展。

尤其是隨著此前人工智能技術(shù)發(fā)展,諸如ImageNet全球競(jìng)賽的開展,進(jìn)一步將視覺技術(shù)提升到了一個(gè)新高度。

對(duì)話他山科技馬揚(yáng):如何通過觸覺感知技術(shù),推動(dòng)機(jī)器人商業(yè)落地?

馬揚(yáng)認(rèn)為,“現(xiàn)在的視覺感知技術(shù)僅僅是在動(dòng)態(tài)捕捉能力上與人類有一定差距,在靜態(tài)物體感知和計(jì)算上已經(jīng)遠(yuǎn)超人類。”

然而,回看觸覺感知技術(shù)發(fā)展,馬揚(yáng)認(rèn)為,依然需要大量數(shù)據(jù)來(lái)推動(dòng)技術(shù)迭代。

材料技術(shù)是觸覺傳感器面臨的另一個(gè)技術(shù)卡點(diǎn),此前的觸覺傳感器不少技術(shù)應(yīng)用都是從其它場(chǎng)景遷移而來(lái),視觸感知技術(shù)是從表面缺陷檢測(cè)技術(shù)遷移而來(lái),壓阻、壓電相關(guān)技術(shù)是由可穿戴產(chǎn)品的觸屏材料技術(shù)遷移而來(lái),下一代觸覺傳感器需要在容性、阻性、感性上有更好的單向敏感性的新材料。

觸覺感知技術(shù)相關(guān)標(biāo)準(zhǔn)制定是馬揚(yáng)指出的另一個(gè)亟需解決的問題,馬揚(yáng)告訴科技行者,“我們現(xiàn)在亟需將觸覺傳感器數(shù)據(jù)存儲(chǔ)的編解碼標(biāo)準(zhǔn)統(tǒng)一,將核心參數(shù)確定下來(lái),這樣至少可以保證機(jī)器人廠商在進(jìn)行靈巧手研發(fā)時(shí)無(wú)需再考慮數(shù)據(jù)兼容性問題。”

他山科技早在2023年2月就與門頭溝區(qū)人民政府、北京市標(biāo)準(zhǔn)化研究院正式簽約了《人工智能觸覺標(biāo)準(zhǔn)化合作協(xié)議》,旨在推進(jìn)人工智能觸覺技術(shù)標(biāo)準(zhǔn)化戰(zhàn)略規(guī)劃,建立以人工智能觸覺傳感應(yīng)用技術(shù)為核心的標(biāo)準(zhǔn)應(yīng)用體系。

對(duì)話他山科技馬揚(yáng):如何通過觸覺感知技術(shù),推動(dòng)機(jī)器人商業(yè)落地?

他山科技目前也在加強(qiáng)產(chǎn)業(yè)生態(tài)合作,據(jù)馬揚(yáng)透露,“他山科技目前面向機(jī)器人在做的觸覺傳感器包括指尖、手掌、手臂、軀干在內(nèi)的多種觸覺傳感器,除了指尖傳感器是由團(tuán)隊(duì)完全獨(dú)立研發(fā)外,手掌、手臂、軀干在內(nèi)的防撞或交互用途的觸覺傳感器,我們都在與產(chǎn)業(yè)鏈上下游一起合作。”

實(shí)際上,在過去兩年里,他山科技不僅參與了國(guó)地共建具身智能創(chuàng)新中心創(chuàng)新中心的創(chuàng)立,還參與了由上海市人智能行協(xié)協(xié)會(huì)起草的團(tuán)體標(biāo)準(zhǔn)《人形機(jī)器人分級(jí)分類應(yīng)用指南》和《具身智能智能化等級(jí)分級(jí)指南》。

在推動(dòng)人形機(jī)器人、具身智能標(biāo)準(zhǔn)制定和產(chǎn)業(yè)落地上,他山科技都在切身參與其中。

04 大模型+機(jī)器人,2-3年商業(yè)落地

在特斯拉2024年Q4業(yè)績(jī)會(huì)上,馬斯克透露,“特斯拉人形機(jī)器人Optimus生產(chǎn)線月產(chǎn)能已經(jīng)達(dá)到1000臺(tái),明年(2026年)將建設(shè)的第二條生產(chǎn)線月產(chǎn)能將會(huì)達(dá)到10000臺(tái)。”

此外,馬斯克還提到,“預(yù)計(jì)今年Optimus將在特斯拉內(nèi)部投入使用,負(fù)責(zé)完成工廠中最無(wú)聊、最討厭的一系列工作,明年下半年將會(huì)面向其他公司交付產(chǎn)品。”

在機(jī)器人廠商紛紛推進(jìn)人形機(jī)器人量產(chǎn),甚至進(jìn)入產(chǎn)線測(cè)試應(yīng)用時(shí),2025年也被視為人形機(jī)器人商業(yè)落地元年,然而,也是在這時(shí),投資人關(guān)于人形機(jī)器人的短期商業(yè)價(jià)值的質(zhì)疑,讓人形機(jī)器人的商業(yè)化站在了一個(gè)十字路口。

馬揚(yáng)告訴我們,“在談人形機(jī)器人商業(yè)化時(shí),大家其實(shí)需要明確一個(gè)概念,如果是談?wù)嬲哂蟹夯芰Φ拇笮腿诵螜C(jī)器人商業(yè)落地,毫無(wú)疑問需要再等5-10年,但如果是在一些具體細(xì)分場(chǎng)景做有限物體的抓取泛化,我們?cè)谖磥?lái)2-3年就可以支持客戶商業(yè)化落地。”

一個(gè)具體應(yīng)用案例是他山科技與云跡科技在酒店配送場(chǎng)景進(jìn)行的合作,酒店配送機(jī)器人核心任務(wù)是物品運(yùn)送,將一件或多件商品從A點(diǎn)運(yùn)送到B點(diǎn),當(dāng)下酒店配送機(jī)器人是在A點(diǎn)由人將物品放到機(jī)器人箱體中后,在B點(diǎn)再由酒店客人取出。

當(dāng)加入靈巧手和觸覺感知技術(shù)后,酒店配送機(jī)器人需要人介入的工作環(huán)節(jié)將進(jìn)一步簡(jiǎn)化,在A點(diǎn)配送機(jī)器人可以自主將相應(yīng)物品抓取到箱體中,當(dāng)?shù)竭_(dá)房間后,配送機(jī)器人又可以自主將物品抓取放到房間門口或房間中。

對(duì)話他山科技馬揚(yáng):如何通過觸覺感知技術(shù),推動(dòng)機(jī)器人商業(yè)落地?

馬揚(yáng)告訴我們,“在這條工作鏈路中,配送機(jī)器人需要抓取的物品的種類是有限的,我們只需要將配送機(jī)器人需要識(shí)別的95%的物品在模型訓(xùn)練階段實(shí)現(xiàn),其它5%的物品通過端側(cè)具有泛化性的小模型來(lái)做自適應(yīng)抓取,由此我們就可以將機(jī)器人的物品抓取成功率提升到99%以上。”

諸如此類場(chǎng)景在酒店、物流、工業(yè)柔性生產(chǎn)、清潔與輔助分類等領(lǐng)域有大量需求,馬揚(yáng)向我們舉的另一個(gè)剛需應(yīng)用場(chǎng)景是商務(wù)酒店洗衣房的洗衣場(chǎng)景。

國(guó)內(nèi)商務(wù)酒店越來(lái)越多開始配備自助洗衣房,而在這些自助洗衣房中,通常配有3套左右洗衣機(jī)+烘干機(jī),由于洗衣、烘干每個(gè)環(huán)節(jié)都需要1個(gè)小時(shí)左右時(shí)間,酒店客人一般都不會(huì)守在洗衣房中等待,這就導(dǎo)致洗衣機(jī)、烘干機(jī)的空占率很高。

如果酒店配備了上述機(jī)器人,同樣可以提升自助洗衣房洗衣機(jī)、烘干機(jī)的使用效率,降低空占率,從而提升酒店的入住體驗(yàn)。

對(duì)話他山科技馬揚(yáng):如何通過觸覺感知技術(shù),推動(dòng)機(jī)器人商業(yè)落地?

大型人形機(jī)器人面臨的普遍是大型泛化場(chǎng)景,這些場(chǎng)景涉及的泛化需求往往是充分泛化。

人形機(jī)器人在進(jìn)行充分泛化時(shí),執(zhí)行物體抓取任務(wù)時(shí),不僅會(huì)遇到物體形態(tài)的泛化,甚至還會(huì)涉及時(shí)間維度的泛化——在執(zhí)行抓取任務(wù)過程中,每個(gè)時(shí)間點(diǎn)上的動(dòng)作響應(yīng)都會(huì)有所不同。

“要將這樣的大型泛化場(chǎng)景中遇到的泛化問題都學(xué)習(xí)完,這將是一個(gè)漫長(zhǎng)的過程,”馬揚(yáng)特別指出,“而且泛化到一定程度就需要持續(xù)做產(chǎn)品迭代、做數(shù)據(jù)飛輪。”

而當(dāng)談到最初對(duì)于家庭保姆機(jī)器人的暢想,馬揚(yáng)則表示,“早期你可以在家里引入5-10個(gè)機(jī)器人,一個(gè)給你做飯,一個(gè)給打掃衛(wèi)生……,這或許是更快讓我們實(shí)現(xiàn)家庭保姆機(jī)器人自由的方法。”

分享至
0贊

好文章,需要你的鼓勵(lì)

金旺

Wille
關(guān)注智造、硬件、機(jī)器人。
推薦文章
  • LLM情境調(diào)節(jié)與持續(xù)工作流程提示:革新化學(xué)分子式的多模態(tài)驗(yàn)證技術(shù)

    LLM情境調(diào)節(jié)與持續(xù)工作流程提示:革新化學(xué)分子式的多模態(tài)驗(yàn)證技術(shù)

    這項(xiàng)研究探索了如何通過"LLM情境調(diào)節(jié)"和"持續(xù)工作流程提示"技術(shù)來(lái)提高大型語(yǔ)言模型在驗(yàn)證化學(xué)分子式時(shí)的準(zhǔn)確性。研究者發(fā)現(xiàn),普通提示方法往往不可靠,因?yàn)長(zhǎng)LM傾向于自動(dòng)"糾正"錯(cuò)誤而非指出它們。然而,通過精心設(shè)計(jì)的情境調(diào)節(jié)提示,研究成功引導(dǎo)Gemini 2.5 Pro不僅識(shí)別出文本中的錯(cuò)誤,還發(fā)現(xiàn)了之前人工審閱未察覺的圖像中的分子式錯(cuò)誤。這一概念驗(yàn)證研究表明,即使不修改模型本身,也能通過適當(dāng)?shù)奶崾静呗燥@著提高LLM在科學(xué)技術(shù)文檔細(xì)節(jié)驗(yàn)證中的表現(xiàn)。

  • 微生物顯微圖像分割新突破:復(fù)旦大學(xué)研究團(tuán)隊(duì)借助多模態(tài)大語(yǔ)言模型統(tǒng)一顯微鏡下的"萬(wàn)物分割"

    微生物顯微圖像分割新突破:復(fù)旦大學(xué)研究團(tuán)隊(duì)借助多模態(tài)大語(yǔ)言模型統(tǒng)一顯微鏡下的"萬(wàn)物分割"

    復(fù)旦大學(xué)研究團(tuán)隊(duì)開發(fā)的uLLSAM模型成功將多模態(tài)大語(yǔ)言模型(MLLMs)與分割一切模型(SAM)結(jié)合,解決了顯微鏡圖像分析的跨域泛化難題。通過創(chuàng)新的視覺-語(yǔ)言語(yǔ)義對(duì)齊模塊(VLSA)和語(yǔ)義邊界正則化(SBR)技術(shù),該模型在9個(gè)領(lǐng)域內(nèi)數(shù)據(jù)集上提升了7.71%的分割準(zhǔn)確度,在10個(gè)從未見過的數(shù)據(jù)集上也展現(xiàn)了10.08%的性能提升。這一統(tǒng)一框架能同時(shí)處理光學(xué)和電子顯微鏡圖像,大大提高了生物醫(yī)學(xué)圖像分析的效率和準(zhǔn)確性,為科研人員提供了強(qiáng)大的自動(dòng)化分析工具。

  • 用強(qiáng)化學(xué)習(xí)讓大語(yǔ)言模型為匯編代碼提速:斯坦福團(tuán)隊(duì)的優(yōu)化探索

    用強(qiáng)化學(xué)習(xí)讓大語(yǔ)言模型為匯編代碼提速:斯坦福團(tuán)隊(duì)的優(yōu)化探索

    斯坦福大學(xué)等機(jī)構(gòu)研究團(tuán)隊(duì)利用強(qiáng)化學(xué)習(xí)訓(xùn)練大語(yǔ)言模型,使其能夠優(yōu)化匯編代碼性能。研究構(gòu)建了8,072個(gè)程序的數(shù)據(jù)集,并通過近端策略優(yōu)化(PPO)訓(xùn)練模型生成既正確又高效的匯編代碼。實(shí)驗(yàn)表明,訓(xùn)練后的Qwen2.5-Coder-7B-PPO模型實(shí)現(xiàn)了96.0%的測(cè)試通過率和1.47倍平均加速比,超越包括Claude-3.7-sonnet在內(nèi)的所有其他模型。研究發(fā)現(xiàn)模型能識(shí)別編譯器忽略的優(yōu)化機(jī)會(huì),如用單一指令替代整個(gè)循環(huán),為性能敏感應(yīng)用提供了有價(jià)值的優(yōu)化途徑。

  • 播放師傅變聲魔術(shù):讓你的錄音遵循參考風(fēng)格的推理時(shí)間優(yōu)化新方法

    播放師傅變聲魔術(shù):讓你的錄音遵循參考風(fēng)格的推理時(shí)間優(yōu)化新方法

    這項(xiàng)研究提出了一種改進(jìn)的聲樂效果風(fēng)格遷移方法,通過在推理時(shí)間優(yōu)化過程中引入高斯先驗(yàn)知識(shí),解決了傳統(tǒng)ST-ITO方法忽視參數(shù)合理性的問題。研究團(tuán)隊(duì)基于DiffVox數(shù)據(jù)集構(gòu)建了專業(yè)效果器參數(shù)分布模型,將風(fēng)格遷移轉(zhuǎn)化為最大后驗(yàn)概率估計(jì)問題。實(shí)驗(yàn)結(jié)果表明,該方法顯著優(yōu)于基準(zhǔn)方法,參數(shù)均方誤差降低了33%,并在主觀聽感測(cè)試中獲得最高評(píng)分。這一創(chuàng)新為音頻處理領(lǐng)域融合數(shù)據(jù)驅(qū)動(dòng)和專業(yè)知識(shí)提供了新思路。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-