av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

微信掃一掃,關(guān)注公眾號

  • 科技行者

  • 算力行者

見證連接與計(jì)算的「力量」

首頁 印度裔創(chuàng)業(yè)者視角:Perplexity創(chuàng)始人談技術(shù)迭代、開源競爭與搜索革命

印度裔創(chuàng)業(yè)者視角:Perplexity創(chuàng)始人談技術(shù)迭代、開源競爭與搜索革命

2025-04-26 22:37
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2025-04-26 22:37 ? 周雅

作者|周周

看目前的AI圈,Perplexity CEO阿拉溫德·斯里尼瓦斯(Aravind Srinivas)代表了一種獨(dú)特視角,因?yàn)樗?jīng)是學(xué)者,現(xiàn)在是創(chuàng)業(yè)者,所以擅長把學(xué)術(shù)的嚴(yán)謹(jǐn)和商業(yè)的實(shí)用結(jié)合在一起,他創(chuàng)辦的AI搜索引擎Perplexity正在重新定義我們獲取、處理和理解信息的方式,在短短幾年內(nèi)成為AI界的新寵,目前估值90億美元,阿拉溫德功不可沒。

最近我們留意到,阿拉溫德在哈佛商學(xué)院2025創(chuàng)業(yè)峰會上,與Xfund管理合伙人Patrick Chung有一場深度對話,他大談創(chuàng)業(yè)心得。從印度的電氣工程學(xué)生,到改變搜索引擎格局的CEO,阿拉溫德的故事提醒我們,在技術(shù)領(lǐng)域,最具變革性的創(chuàng)新,往往來自于能夠跨越學(xué)術(shù)與商業(yè)鴻溝之處。

印度裔創(chuàng)業(yè)者視角:Perplexity創(chuàng)始人談技術(shù)迭代、開源競爭與搜索革命

從印度工程師到伯克利AI研究者

阿拉溫德的故事始于印度南部城市欽奈,在他的成長環(huán)境中,知識比財(cái)富更受重視,這種文化背景深刻影響了他的價(jià)值觀。

“即使到現(xiàn)在,我父母仍然認(rèn)為,我的博士學(xué)位比Perplexity更讓他們自豪,他們?nèi)栽诖罅渴褂霉雀铻g覽器。”阿拉溫德笑著說。

在印度理工學(xué)院馬德拉斯分校(IIT Madras)學(xué)習(xí)期間,阿拉溫德主修電氣工程,但他一直對計(jì)算機(jī)科學(xué)心存向往。“當(dāng)時(shí)我總覺得,自己應(yīng)該學(xué)計(jì)算機(jī)科學(xué),因?yàn)樗械?lsquo;酷小子’都在學(xué)習(xí)計(jì)算機(jī)科學(xué),參加各種編程比賽。”雖然他嘗試參加競技編程,但卻并不擅長。有意思的是,他的聯(lián)合創(chuàng)始人之一Johnny曾是世界第一的競技程序員,并代表哈佛參加過ICPC(國際大學(xué)生程序設(shè)計(jì)競賽)。

阿拉溫德的機(jī)器學(xué)習(xí)之旅,始于一次校內(nèi)的機(jī)器學(xué)習(xí)比賽,他說自己當(dāng)時(shí)對機(jī)器學(xué)習(xí)一無所知,只是嘗試使用scikit-learn庫中的不同算法,基本上是通過暴力方式贏得了比賽。但那次經(jīng)歷,為他打開了機(jī)器學(xué)習(xí)的大門。

在參加一個(gè)為醫(yī)療網(wǎng)站搭建推薦系統(tǒng)的實(shí)習(xí)后,阿拉溫德開始系統(tǒng)學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)知識。他說,“有人告訴我,所有這些線性代數(shù)很酷,但你得去學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),雖然它不起作用,但你仍然要去學(xué)習(xí)它。”于是,他開始大量的去看吳恩達(dá)和杰弗里·辛頓的在線講座,奠定了基礎(chǔ)知識。

他的學(xué)術(shù)轉(zhuǎn)折點(diǎn),來自著名圖靈獎(jiǎng)得主Yoshua Bengio的推薦信,這幫助他進(jìn)入了加州大學(xué)伯克利分校的研究生院。在美國,他有幸在OpenAI和DeepMind實(shí)習(xí),這些經(jīng)歷讓他大受震撼。“這些經(jīng)歷,讓我謙虛了很多,我原本以為自己很優(yōu)秀,但這里的人更加努力工作,不僅能提出新想法,還能實(shí)現(xiàn)它們。”

從學(xué)者到創(chuàng)業(yè)家的蛻變

阿拉溫德完成了伯克利的博士學(xué)位,但在學(xué)術(shù)道路上發(fā)生了關(guān)鍵轉(zhuǎn)折。在OpenAI實(shí)習(xí)期間,時(shí)任首席科學(xué)家的伊利亞·薩茨克維爾(Ilya Sutskever)否定了他提出的所有強(qiáng)化學(xué)習(xí)想法,直言“這些想法都很糟糕”。

“他在白板上畫了兩個(gè)圓,一個(gè)大圓,里面套了一個(gè)小圓。大圓代表生成式無監(jiān)督學(xué)習(xí),小圓代表強(qiáng)化學(xué)習(xí)。他說你不需要任何新東西,只需要按順序做這些,投入大量計(jì)算資源,在整個(gè)互聯(lián)網(wǎng)上訓(xùn)練,然后你就會構(gòu)建出通用智能,”阿拉溫德回憶道,“這基本上就是ChatGPT的配方。”

回到伯克利后,他開始研究生成式無監(jiān)督學(xué)習(xí),并在伯克利教授了一門相關(guān)課程,這些學(xué)術(shù)背景與他的創(chuàng)業(yè)精神相結(jié)合,最終催生了Perplexity。

對于為何選擇創(chuàng)業(yè)而非繼續(xù)在科技公司工作,阿拉溫德提到了HBO喜劇《硅谷》的影響,他說,“有人告訴我,這部劇不僅僅是幽默,它幾乎以殘酷的方式反映了硅谷的現(xiàn)實(shí)。”該劇探討的無損壓縮技術(shù)與生成式AI直接相關(guān),成為他最初想創(chuàng)業(yè)的靈感。

疫情期間,阿拉溫德看到像GitHub Copilot這樣的產(chǎn)品從OpenAI和微軟中脫穎而出,讓他感受到AI正開始應(yīng)用于實(shí)際產(chǎn)品中——“當(dāng)你親自感受到AI時(shí),你開始意識到,現(xiàn)在是試著創(chuàng)業(yè)的時(shí)刻了。”

Perplexity誕生:從一個(gè)小項(xiàng)目,到估值90億美元

2022年8月,阿拉溫德和聯(lián)合創(chuàng)始人啟動(dòng)了Perplexity項(xiàng)目,公司CTO兼聯(lián)合創(chuàng)始人丹尼斯·亞斯(Dennis Yarats)與他有著類似的研究背景,他們曾經(jīng)幾乎同時(shí)發(fā)表過同一主題的論文。通過丹尼斯,他們認(rèn)識了另一位聯(lián)合創(chuàng)始人約翰尼(Johnny),一位來自問答平臺Quora的程序員。

最初,團(tuán)隊(duì)并不確定具體方向,他們最初在嘗試讓AI回答數(shù)據(jù)集的相關(guān)問題,比如員工薪資數(shù)據(jù)庫查詢。“我們當(dāng)時(shí)并不知道這是否有任何市場影響或商業(yè)模式,實(shí)際上我認(rèn)為至今也沒有特定想法,”阿拉溫德坦言,“在創(chuàng)業(yè)過程中,當(dāng)你有一個(gè)初始團(tuán)隊(duì)時(shí),最重要的是迭代并做些事情。”

他們沒有花6個(gè)月到1年時(shí)間在“想法迷宮”中徘徊,而是快速構(gòu)建產(chǎn)品并獲取用戶反饋,他說,“快速把產(chǎn)品推到市場才是正確的方法,至少在軟件領(lǐng)域是這樣,看到他人使用我們的產(chǎn)品,給我們帶來了多巴胺式的激勵(lì)。”

有意思的是,阿拉溫德聲稱自己不會做傳統(tǒng)的融資演示文稿(deck)。“人們要求演示文稿時(shí),我說我不知道怎么做演示文稿,至今我仍不知道,我做過的唯一一份是A輪融資時(shí)為NEA準(zhǔn)備的。之后我再也沒做過,都是做現(xiàn)場演示,并告訴他們我們想要達(dá)到的目標(biāo)。”

團(tuán)隊(duì)最初的突破來自一個(gè)簡單的應(yīng)用:他們抓取Twitter數(shù)據(jù)(在埃隆·馬斯克成為CEO前),將其放入數(shù)據(jù)表中,讓用戶可以詢問關(guān)于Twitter的任何問題。“當(dāng)Twitter上原有的搜索從來都不好用,而突然大家得到了一個(gè)有效的搜索工具時(shí),人們才會真正理解:大語言模型將徹底改變搜索,不管具體是如何實(shí)現(xiàn)的。”

這個(gè)簡單的演示幫助他們吸引了包括吉爾·納特·弗里德曼(Gil Natt Freidman)、安德烈·卡帕西(Andre Karpathy)和杰夫·迪恩(Jeff Dean)在內(nèi)的種子投資者。更重要的是,這些知名投資者的加入,幫助他們招募到了優(yōu)秀的創(chuàng)始工程師,公司走向正向循環(huán)。

我們不斷迭代,最終推出了核心理念:搜索,這個(gè)全球使用最廣泛的工具,可以從輸入關(guān)鍵詞轉(zhuǎn)變?yōu)樘釂柣蛘Z音提問,并立即得到答案。用戶希望通過來源,驗(yàn)證AI回答的真實(shí)性,這同樣適用于學(xué)術(shù)理念,因?yàn)閷W(xué)術(shù)論文寫作的第一條規(guī)則是不要隨意寫東西,必須有經(jīng)過同行評審的引用。”

Perplexity與谷歌:重新定義搜索的邊界

當(dāng)被問及Perplexity是否與谷歌競爭時(shí),阿拉溫德提出了有趣的觀點(diǎn)。“我認(rèn)為它與谷歌不存在競爭關(guān)系,因?yàn)樗粫Z走谷歌核心搜索行為。目前,每天有10億到20億次搜索只是一兩個(gè)詞,大家只是在Chrome搜索欄中輸入‘天氣’、’Reddit‘、’Instagram’、’YouTube‘、’Twitter’這樣的單詞。”

他進(jìn)一步解釋道,谷歌在這些簡單查詢上做得很好,但卻難以回答復(fù)雜問題,比如,“如果你真想知道’今天我要去哈佛,看起來可能會下雨,我應(yīng)該穿什么?‘,你會得到很多鏈接,但不會得到對這個(gè)問題的針對性回答。在Perplexity出現(xiàn)之前,你會輸入’天氣‘,然后思考該怎么做,再輸入與’雨天穿著‘相關(guān)的內(nèi)容,再看這些內(nèi)容。你會做所有這些認(rèn)知工作,而現(xiàn)在AI為你完成了這些工作,所以它更加直觀。

當(dāng)主持人Patrick提到谷歌現(xiàn)在也有AI概述(AI Overviews)或AI模式時(shí),阿拉溫德直言不諱地指出了谷歌瀏覽器的局限性:

“AI模式并不是萬能,大模型有時(shí)會產(chǎn)生幻覺。但更大的問題是商業(yè)模式?jīng)_突——如果AI直接回答問題,用戶就不會點(diǎn)擊鏈接了,谷歌就賺不到廣告費(fèi)。想想看,即使是查個(gè)體育比分這么簡單的事,谷歌也在旁邊放Ticketmaster的廣告。因?yàn)楣雀璧乃阉髁恳呀?jīng)不再增長了,他們只能通過在每次搜索中塞更多廣告來增加收入。但這與直接給用戶答案的理念完全沖突。”

有人擔(dān)心Perplexity會傷害內(nèi)容創(chuàng)作者的利益,阿拉溫德對此有個(gè)有力反駁:

“我們不僅把原始來源的鏈接放在顯眼位置,對于任何與新聞相關(guān)的查詢,我們還專門設(shè)計(jì)了一個(gè)不同的界面,叫做「趨勢界面」,讓來源更加醒目,用戶一眼就能看到并點(diǎn)擊。”

“更重要的是,我們有個(gè)發(fā)布商計(jì)劃,當(dāng)我們靠某個(gè)問題賺到錢時(shí),會和提供內(nèi)容的發(fā)布商分享收入。谷歌從來不這么做!他們賺了大把廣告費(fèi),只對出版商說‘嘿,我們給你帶來了流量’,卻從不分享廣告收入。我們正在改變這種模式。”

關(guān)于Perplexity的誤解

談到大家對Perplexity的誤解,阿拉溫德忍不住笑了:“最常見的誤解就是——‘這不就是個(gè)套殼工具么,一個(gè)周末就能開發(fā)出來’。確實(shí),你可以在周末做出個(gè)八成像的山寨版。因?yàn)橐粊恚F(xiàn)在有很多編程工具幫你快速寫代碼;二來說實(shí)話,如果我們當(dāng)初不是用一個(gè)周末快速開發(fā)出來,今天也不會坐在這兒聊天了。”

“但大家忽略了后續(xù)的努力。發(fā)布第一版后,我們做了太多工作——深入各個(gè)專業(yè)領(lǐng)域,打造自己的AI模型?,F(xiàn)在即使所有的模型供應(yīng)商都不給我們提供服務(wù)了,我們自己的系統(tǒng)依然能運(yùn)轉(zhuǎn),而且質(zhì)量基本不受影響。我們投入巨資建立自己的網(wǎng)絡(luò)爬蟲基礎(chǔ)設(shè)施,還開發(fā)了先進(jìn)的研究助手,它不只是簡單地抓取幾個(gè)鏈接做總結(jié),而是像偵探一樣有條不紊地瀏覽網(wǎng)頁,分析鏈接,規(guī)劃下一步,并展示整個(gè)思維鏈。”

當(dāng)被問到蘋果公司是否應(yīng)該收購Perplexity時(shí),阿拉溫德巧妙地反問:“問題不該是蘋果要不要買我們,而是我們想不想賣。如果讓我給庫克提建議,我會說:‘嘿,不如讓你們的Apple Intelligence直接接入Perplexity吧!我們在蘋果和安卓平臺都有應(yīng)用,我們的助手已經(jīng)能調(diào)用其他應(yīng)用播放音樂視頻、設(shè)置提醒、發(fā)郵件、打電話,這些功能都已經(jīng)實(shí)現(xiàn)了。如果Apple Intelligence向開發(fā)者開放更多權(quán)限,讓它能調(diào)用Perplexity,我們非常愿意合作,幫Siri變得真正好用。’”

談到Perplexity競購TikTok的計(jì)劃,阿拉溫德解釋得很接地氣:“我們在博客上寫過這一愿景,核心理念是,人們在TikTok上浪費(fèi)太多時(shí)間,這些信息流原本可以更有價(jià)值。我不是說要把蹦迪現(xiàn)場變成圖書館,而是說派對還是派對,但可以加入些營養(yǎng)的東西,同時(shí)用社區(qū)注釋等功能過濾掉假消息。

他指出了下一代用戶使用互聯(lián)網(wǎng)的新習(xí)慣:“現(xiàn)在的年輕人上網(wǎng)方式和我們不一樣。比如找餐廳,他們不會去谷歌地圖或谷歌搜索,而是直接打開TikTok搜,新一代的搜索大量流向了TikTok的搜索框,所以把Perplexity整合進(jìn)去非常有意義。”

學(xué)術(shù)思維與創(chuàng)業(yè)實(shí)踐的融合

經(jīng)歷了從學(xué)者到CEO的轉(zhuǎn)變,阿拉溫德的思維方式有了很大變化——“當(dāng)我還是學(xué)者的時(shí)候,我覺得花大量時(shí)間思考想法很重要,現(xiàn)在我更相信‘行動(dòng)才能產(chǎn)生信息’。

“不過有些東西依然沒變。”阿拉溫德進(jìn)一步分析說:

在學(xué)術(shù)界,大多數(shù)人不愿意做小實(shí)驗(yàn),他們總想在白板上畫個(gè)大框架,然后直接實(shí)施,幻想一切順利后寫篇論文發(fā)表,實(shí)際上真正有效的方法是:迭代地進(jìn)行多次小規(guī)模實(shí)驗(yàn)。

創(chuàng)業(yè)世界也是這樣。“我們在Perplexity同時(shí)嘗試很多不同點(diǎn)子,誰也不知道哪個(gè)會受歡迎。即使某個(gè)功能一開始沒人用,也不一定是失敗。仔細(xì)觀察用戶反應(yīng),批判性思考,設(shè)計(jì)假設(shè)測試——這些其實(shí)都是科學(xué)研究的方法。所以創(chuàng)業(yè)和學(xué)術(shù)研究,本質(zhì)上是相通的。”阿拉溫德說。

當(dāng)被問到他對AI未來的看法,現(xiàn)在業(yè)界有很多派系,是末日論者、還是加速主義者、還是技術(shù)烏托邦主義者?

阿拉溫德回答說:“我肯定更看好探索和發(fā)展,我希望最終能達(dá)到科技烏托邦。我覺得,如果AI能像iPhone那樣普及,不管是領(lǐng)導(dǎo)人還是普通人都用同樣的設(shè)備,大家都能用上差不多水平的AI,那就不會有什么可怕的結(jié)果。真正危險(xiǎn)的是,如果某種超級AI需要巨大算力才能運(yùn)行,只有少數(shù)權(quán)貴能控制它,那才可能帶來災(zāi)難。

對于AI市場的未來格局,他相當(dāng)樂觀:“開源是最好的制衡力量。每次有一兩家大公司推出厲害的閉源模型,大家就擔(dān)心它們會主宰AI的未來。但沒多久,總會有人發(fā)布同樣強(qiáng)大的開源免費(fèi)版本,任何人都能下載使用、自己部署、調(diào)整成自己需要的樣子。要開源社區(qū)繼續(xù)活躍,我真不擔(dān)心會出現(xiàn)寡頭壟斷局面。

AI的下一個(gè)突破口:超長上下文

談到AI技術(shù)的下一個(gè)突破點(diǎn),阿拉溫德表示:“模型架構(gòu)上可能會有些新花樣,比如狀態(tài)空間模型或混合架構(gòu),但大公司很快就會把這些都用上。我覺得真正的突破會來自解決一個(gè)更大的問題:如何讓AI記住更長的對話內(nèi)容,也就是解決超長上下文的問題。

“現(xiàn)在所有AI,包括我們Perplexity,都在用一種叫「檢索增強(qiáng)生成(RAG)」的技術(shù)。說白了,AI模型自己記不住太多東西,所以它每次都要臨時(shí)去數(shù)據(jù)庫或網(wǎng)絡(luò)上找相關(guān)信息,再放到當(dāng)前對話里,然后才能回答你的問題。”

“但想想看,你和一個(gè)認(rèn)識十年的好友聊天,他記得你們共同的經(jīng)歷、你的喜好、上次聊到哪了。而現(xiàn)在的AI不行,你每次都得重新開始對話。如果想讓AI像老朋友一樣和你聊天,記住你們之間所有的互動(dòng),這個(gè)技術(shù)難題還沒解決。我們需要找到方法讓AI能記住幾百萬甚至無限多的信息,而且組織得井井有條。”

關(guān)于行業(yè)面臨的資源挑戰(zhàn),阿拉溫德直言不諱:“現(xiàn)在整個(gè)AI行業(yè)都缺算力。像OpenAI、Grok這些大公司都說他們的GPU不夠用,用戶請求太多,服務(wù)不過來。我們Perplexity也一樣,剛推出DeepSeek和Deep Research這些新功能時(shí),計(jì)算資源很快就用光了,不得不找合作伙伴幫忙?,F(xiàn)在每次查詢的成本其實(shí)在上升,所以我們急需更多算力來想辦法臨時(shí)降低這些成本。”

談到SEO(搜索引擎優(yōu)化)的前景,阿拉溫德認(rèn)為這個(gè)行業(yè)即將迎來大變革:“我覺得未來SEO會變得沒那么重要了,尤其是當(dāng)你用上像我們Deep Research這樣的產(chǎn)品,這類AI會花很多時(shí)間真正思考問題,你甚至可以直接告訴它‘忽略那些為了排名而堆砌關(guān)鍵詞的垃圾內(nèi)容,專注于我真正想要的信息’。面對這樣的系統(tǒng),傳統(tǒng)的SEO招數(shù)根本不管用。

他用通俗的比喻解釋道:“SEO之所以有效,是因?yàn)閭鹘y(tǒng)搜索引擎每次查詢用的計(jì)算力很少,只是簡單地算一下排名,然后列出結(jié)果清單。但AI搜索不一樣,它會像人一樣真正思考,一步步推理,反復(fù)查找信息,并且一直在迭代。SEO想要‘作弊’,必須先猜測搜索引擎是怎么工作的,然后針對性地優(yōu)化內(nèi)容,但如果這個(gè)‘黑盒子’變得超級復(fù)雜,計(jì)算成本高到離譜,那SEO專家再怎么猜也猜不準(zhǔn),就沒法有效優(yōu)化了。”

1-3年的未來規(guī)劃太久,我們只做季度規(guī)劃

當(dāng)被問到Perplexity未來1-3年的規(guī)劃和戰(zhàn)略重點(diǎn)時(shí),阿拉溫德坦言他們不做三年計(jì)劃,因?yàn)锳I發(fā)展太快了,他們只做季度規(guī)劃。

“說實(shí)話,今年頭三個(gè)月的AI變化比我過去兩年還快。DeepSeek的突然崛起、Deep Research功能的快速落地、AI Agent的初步成功——這些都是誰也沒預(yù)料到的。這個(gè)行業(yè)變化太快了,你必須隨時(shí)調(diào)整方向。”

盡管如此,Perplexity對近期發(fā)展方向很明確:“我們要做的是,讓Perplexity能滿足普通人的各種搜索需求,我們稱之為「垂直結(jié)構(gòu)化答案」。比如查天氣、體育比分、金融數(shù)據(jù)、購物信息、旅游攻略或本地服務(wù),不能只給用戶一堆文字,而是要提供可視化、互動(dòng)性強(qiáng)、結(jié)構(gòu)清晰的專業(yè)回答。”

“我們在不斷改進(jìn)產(chǎn)品,這些改進(jìn)會讓Perplexity不僅能回答知識性問題,還能滿足日常生活和商業(yè)需求。”阿拉溫德說,“未來人們不再是搜索后再跳轉(zhuǎn)別處,而是直接在搜索結(jié)果頁面完成交易——研究好要買的產(chǎn)品或住的酒店后,直接在那里下單。這將徹底改變互聯(lián)網(wǎng)的商業(yè)模式。”

阿拉溫德還透露了即將推出的瀏覽器新功能:“我們將提供更智能的「代理式搜索」,不光是搜網(wǎng)絡(luò),還能搜你自己的個(gè)人數(shù)據(jù)——日歷、郵件、瀏覽歷史、Slack或Notion等工作工具。這樣Perplexity就能真正了解你,提供高度個(gè)性化的回答。”

關(guān)于項(xiàng)目優(yōu)先級,阿拉溫德承認(rèn),“我們嘗試過很多沒達(dá)到預(yù)期的項(xiàng)目,但這都是學(xué)習(xí)過程。比如我們做過「Perplexity Pages」項(xiàng)目,想通過SEO增加流量,但谷歌算法把我們的內(nèi)容排名降低了。我們沒有氣餒,而是把這個(gè)項(xiàng)目的資源和經(jīng)驗(yàn)轉(zhuǎn)移到「Perplexity Discover Feed」上,這個(gè)功能不需要用戶主動(dòng)提問,就能推送他們可能感興趣的內(nèi)容。在我們公司,沒有真正的失敗,只有不斷學(xué)習(xí)的嘗試。

分享至
0贊

好文章,需要你的鼓勵(lì)

周雅

Miranda
關(guān)注科技創(chuàng)新、技術(shù)投資。以文會友,左手硬核科技,右手浪漫主義。
推薦文章
  • LLM情境調(diào)節(jié)與持續(xù)工作流程提示:革新化學(xué)分子式的多模態(tài)驗(yàn)證技術(shù)

    LLM情境調(diào)節(jié)與持續(xù)工作流程提示:革新化學(xué)分子式的多模態(tài)驗(yàn)證技術(shù)

    這項(xiàng)研究探索了如何通過"LLM情境調(diào)節(jié)"和"持續(xù)工作流程提示"技術(shù)來提高大型語言模型在驗(yàn)證化學(xué)分子式時(shí)的準(zhǔn)確性。研究者發(fā)現(xiàn),普通提示方法往往不可靠,因?yàn)長LM傾向于自動(dòng)"糾正"錯(cuò)誤而非指出它們。然而,通過精心設(shè)計(jì)的情境調(diào)節(jié)提示,研究成功引導(dǎo)Gemini 2.5 Pro不僅識別出文本中的錯(cuò)誤,還發(fā)現(xiàn)了之前人工審閱未察覺的圖像中的分子式錯(cuò)誤。這一概念驗(yàn)證研究表明,即使不修改模型本身,也能通過適當(dāng)?shù)奶崾静呗燥@著提高LLM在科學(xué)技術(shù)文檔細(xì)節(jié)驗(yàn)證中的表現(xiàn)。

  • 微生物顯微圖像分割新突破:復(fù)旦大學(xué)研究團(tuán)隊(duì)借助多模態(tài)大語言模型統(tǒng)一顯微鏡下的"萬物分割"

    微生物顯微圖像分割新突破:復(fù)旦大學(xué)研究團(tuán)隊(duì)借助多模態(tài)大語言模型統(tǒng)一顯微鏡下的"萬物分割"

    復(fù)旦大學(xué)研究團(tuán)隊(duì)開發(fā)的uLLSAM模型成功將多模態(tài)大語言模型(MLLMs)與分割一切模型(SAM)結(jié)合,解決了顯微鏡圖像分析的跨域泛化難題。通過創(chuàng)新的視覺-語言語義對齊模塊(VLSA)和語義邊界正則化(SBR)技術(shù),該模型在9個(gè)領(lǐng)域內(nèi)數(shù)據(jù)集上提升了7.71%的分割準(zhǔn)確度,在10個(gè)從未見過的數(shù)據(jù)集上也展現(xiàn)了10.08%的性能提升。這一統(tǒng)一框架能同時(shí)處理光學(xué)和電子顯微鏡圖像,大大提高了生物醫(yī)學(xué)圖像分析的效率和準(zhǔn)確性,為科研人員提供了強(qiáng)大的自動(dòng)化分析工具。

  • 用強(qiáng)化學(xué)習(xí)讓大語言模型為匯編代碼提速:斯坦福團(tuán)隊(duì)的優(yōu)化探索

    用強(qiáng)化學(xué)習(xí)讓大語言模型為匯編代碼提速:斯坦福團(tuán)隊(duì)的優(yōu)化探索

    斯坦福大學(xué)等機(jī)構(gòu)研究團(tuán)隊(duì)利用強(qiáng)化學(xué)習(xí)訓(xùn)練大語言模型,使其能夠優(yōu)化匯編代碼性能。研究構(gòu)建了8,072個(gè)程序的數(shù)據(jù)集,并通過近端策略優(yōu)化(PPO)訓(xùn)練模型生成既正確又高效的匯編代碼。實(shí)驗(yàn)表明,訓(xùn)練后的Qwen2.5-Coder-7B-PPO模型實(shí)現(xiàn)了96.0%的測試通過率和1.47倍平均加速比,超越包括Claude-3.7-sonnet在內(nèi)的所有其他模型。研究發(fā)現(xiàn)模型能識別編譯器忽略的優(yōu)化機(jī)會,如用單一指令替代整個(gè)循環(huán),為性能敏感應(yīng)用提供了有價(jià)值的優(yōu)化途徑。

  • 播放師傅變聲魔術(shù):讓你的錄音遵循參考風(fēng)格的推理時(shí)間優(yōu)化新方法

    播放師傅變聲魔術(shù):讓你的錄音遵循參考風(fēng)格的推理時(shí)間優(yōu)化新方法

    這項(xiàng)研究提出了一種改進(jìn)的聲樂效果風(fēng)格遷移方法,通過在推理時(shí)間優(yōu)化過程中引入高斯先驗(yàn)知識,解決了傳統(tǒng)ST-ITO方法忽視參數(shù)合理性的問題。研究團(tuán)隊(duì)基于DiffVox數(shù)據(jù)集構(gòu)建了專業(yè)效果器參數(shù)分布模型,將風(fēng)格遷移轉(zhuǎn)化為最大后驗(yàn)概率估計(jì)問題。實(shí)驗(yàn)結(jié)果表明,該方法顯著優(yōu)于基準(zhǔn)方法,參數(shù)均方誤差降低了33%,并在主觀聽感測試中獲得最高評分。這一創(chuàng)新為音頻處理領(lǐng)域融合數(shù)據(jù)驅(qū)動(dòng)和專業(yè)知識提供了新思路。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-