這項(xiàng)由蘋(píng)果公司的王宇陽(yáng)、魯佳瑞等研究人員完成的突破性研究發(fā)表于2025年9月,論文編號(hào)為arXiv:2509.18480v2。有興趣深入了解的讀者可以通過(guò)這個(gè)編號(hào)查詢(xún)完整論文。
想象一下,你正在嘗試解開(kāi)一條復(fù)雜的項(xiàng)鏈,這條項(xiàng)鏈由數(shù)百個(gè)珠子組成,每個(gè)珠子都有特定的形狀和顏色。傳統(tǒng)的方法需要你仔細(xì)研究每?jī)蓚€(gè)珠子之間的關(guān)系,記錄它們?nèi)绾蜗嗷ビ绊?,然后逐步推斷整條項(xiàng)鏈的最終形狀。這個(gè)過(guò)程不僅耗時(shí),還需要大量的專(zhuān)業(yè)知識(shí)和復(fù)雜的工具。
現(xiàn)在,蘋(píng)果公司的研究團(tuán)隊(duì)提出了一種全新的方法:他們發(fā)明了一種"魔術(shù)眼鏡",戴上這副眼鏡,你只需要看一眼項(xiàng)鏈的組成材料,就能直接看到它最終會(huì)變成什么樣子。這就是SimpleFold的魅力所在——它將蛋白質(zhì)折疊這個(gè)生物學(xué)中最復(fù)雜的問(wèn)題之一,變得如同魔術(shù)般簡(jiǎn)單直觀。
蛋白質(zhì)折疊是生命科學(xué)中的終極謎題之一。每個(gè)蛋白質(zhì)都像是一條由氨基酸串成的長(zhǎng)鏈,就像我們剛才說(shuō)的項(xiàng)鏈一樣。這條鏈必須精確地折疊成特定的三維形狀,才能發(fā)揮其生物功能。如果折疊出錯(cuò),就可能導(dǎo)致各種疾病,包括阿爾茨海默病、帕金森病等。因此,準(zhǔn)確預(yù)測(cè)蛋白質(zhì)的三維結(jié)構(gòu)對(duì)于理解生命過(guò)程和開(kāi)發(fā)新藥物至關(guān)重要。
過(guò)去幾年里,這個(gè)領(lǐng)域被AlphaFold2這樣的巨頭模型統(tǒng)治著。這些模型就像是配備了各種精密儀器的豪華實(shí)驗(yàn)室,需要大量的計(jì)算資源和復(fù)雜的設(shè)計(jì)。它們使用多序列比對(duì)、配對(duì)表示和三角更新等復(fù)雜技術(shù),雖然效果很好,但就像開(kāi)坦克去買(mǎi)菜一樣——功能強(qiáng)大但過(guò)于復(fù)雜。
蘋(píng)果的研究團(tuán)隊(duì)決定挑戰(zhàn)這種"越復(fù)雜越好"的傳統(tǒng)思維。他們提出了一個(gè)大膽的問(wèn)題:如果我們拋棄所有這些復(fù)雜的設(shè)計(jì),僅僅使用最基礎(chǔ)的通用組件,能否同樣解決蛋白質(zhì)折疊問(wèn)題?這就像問(wèn):能否用最簡(jiǎn)單的樂(lè)高積木搭建出一座精美的城堡?
答案是肯定的,而且結(jié)果令人驚嘆。
一、革命性的簡(jiǎn)化設(shè)計(jì)哲學(xué)
SimpleFold的核心理念可以用一個(gè)簡(jiǎn)單的比喻來(lái)理解:傳統(tǒng)的蛋白質(zhì)折疊模型就像是一個(gè)復(fù)雜的鐘表工廠,里面有各種專(zhuān)門(mén)的機(jī)器和工具,每個(gè)部件都有特定的功能。而SimpleFold更像是一個(gè)通用的3D打印機(jī),它不需要那些專(zhuān)門(mén)的工具,僅僅通過(guò)一種基礎(chǔ)技術(shù)就能制造出同樣精美的產(chǎn)品。
具體來(lái)說(shuō),SimpleFold完全基于標(biāo)準(zhǔn)的Transformer塊構(gòu)建。Transformer是目前人工智能領(lǐng)域最成功的架構(gòu)之一,就像是AI世界的"萬(wàn)能積木"。它最初是為處理語(yǔ)言而設(shè)計(jì)的,后來(lái)被證明在圖像、音頻等各個(gè)領(lǐng)域都能發(fā)揮出色的效果?,F(xiàn)在,蘋(píng)果的研究團(tuán)隊(duì)證明了它在生物學(xué)領(lǐng)域同樣強(qiáng)大。
傳統(tǒng)方法的復(fù)雜性主要體現(xiàn)在三個(gè)方面。首先是多序列比對(duì),這就像是在解決一個(gè)拼圖謎題時(shí),不僅要看當(dāng)前這塊拼圖,還要查閱所有歷史上相似的拼圖來(lái)獲取線索。這個(gè)過(guò)程非常耗時(shí),而且對(duì)于那些在歷史上很少見(jiàn)的"孤兒蛋白質(zhì)"來(lái)說(shuō),這種方法效果有限,因?yàn)檎也坏阶銐虻膮⒖紭颖尽?/p>
其次是配對(duì)表示,傳統(tǒng)方法需要明確建模蛋白質(zhì)中每?jī)蓚€(gè)氨基酸之間的關(guān)系。如果一個(gè)蛋白質(zhì)有100個(gè)氨基酸,那就需要考慮將近5000對(duì)關(guān)系。這就像是在管理一個(gè)有100個(gè)人的公司時(shí),你需要記錄每?jī)蓚€(gè)人之間的具體關(guān)系,這個(gè)工作量是驚人的。
第三是三角更新,這是一種特殊的計(jì)算技術(shù),用于優(yōu)化配對(duì)表示。它的計(jì)算復(fù)雜度極高,就像是每次做決策時(shí)都要進(jìn)行復(fù)雜的多方會(huì)議,雖然能得到更準(zhǔn)確的結(jié)果,但效率很低。
SimpleFold徹底拋棄了這些復(fù)雜設(shè)計(jì)。它采用了一種"端到端"的學(xué)習(xí)方式,就像是訓(xùn)練一個(gè)人直接從看到食材就能想象出最終菜品的樣子,而不需要詳細(xì)了解每個(gè)烹飪步驟。這種方法的優(yōu)雅之處在于,它讓模型自己從數(shù)據(jù)中學(xué)習(xí)蛋白質(zhì)折疊的規(guī)律,而不是強(qiáng)制性地編入人類(lèi)對(duì)這個(gè)過(guò)程的理解。
更重要的是,SimpleFold使用了流匹配這種生成建模技術(shù)。傳統(tǒng)方法就像是在解數(shù)學(xué)題——給定輸入,直接計(jì)算出唯一的答案。而流匹配更像是在進(jìn)行藝術(shù)創(chuàng)作——它能生成多種可能的結(jié)果,每種都是合理的。這種差異非常重要,因?yàn)樵谡鎸?shí)的生物環(huán)境中,同一個(gè)蛋白質(zhì)序列可能會(huì)折疊成多種不同但都有效的構(gòu)象,這種多樣性對(duì)于理解蛋白質(zhì)的功能至關(guān)重要。
二、魔術(shù)般的流匹配技術(shù)
要理解SimpleFold的核心技術(shù),我們可以把蛋白質(zhì)折疊過(guò)程想象成一個(gè)魔術(shù)表演。魔術(shù)師從一團(tuán)亂麻開(kāi)始,通過(guò)一系列神秘的步驟,最終變出一個(gè)精美的雕塑。流匹配技術(shù)就是教會(huì)計(jì)算機(jī)如何成為這樣的魔術(shù)師。
傳統(tǒng)的確定性方法就像是按照嚴(yán)格的說(shuō)明書(shū)組裝家具。你知道每一步該怎么做,最終的結(jié)果是固定的。但生物世界并不是這樣運(yùn)作的。同一個(gè)蛋白質(zhì)在不同的環(huán)境中,或者在不同的時(shí)間點(diǎn),可能會(huì)采用略微不同的形狀,就像同一個(gè)人在不同情況下會(huì)有不同的表情和姿態(tài)。
流匹配技術(shù)的巧妙之處在于它模擬了這種自然的不確定性。整個(gè)過(guò)程就像是在時(shí)間軸上播放一部倒放的電影。正常情況下,我們看到的是蛋白質(zhì)從無(wú)序狀態(tài)逐漸折疊成有序結(jié)構(gòu)的過(guò)程。而流匹配反其道而行之,它從隨機(jī)噪聲開(kāi)始,通過(guò)學(xué)習(xí)的"時(shí)間逆轉(zhuǎn)"過(guò)程,逐步將噪聲轉(zhuǎn)化為有意義的蛋白質(zhì)結(jié)構(gòu)。
這個(gè)過(guò)程可以用河流的比喻來(lái)理解。想象有無(wú)數(shù)條小溪從山頂?shù)牟煌攸c(diǎn)出發(fā),它們都朝著山腳的同一個(gè)湖泊流淌。每條小溪的路徑都不完全相同,但它們都能到達(dá)目的地。流匹配就是學(xué)習(xí)這些"水流路徑"的過(guò)程——模型學(xué)會(huì)了如何從任意的起始點(diǎn)(隨機(jī)噪聲)沿著合理的路徑到達(dá)目標(biāo)(正確的蛋白質(zhì)結(jié)構(gòu))。
SimpleFold的訓(xùn)練過(guò)程就像是教一個(gè)學(xué)生如何成為這樣的"導(dǎo)航專(zhuān)家"。訓(xùn)練時(shí),研究團(tuán)隊(duì)給模型展示了大量的蛋白質(zhì)結(jié)構(gòu)示例,就像給學(xué)生看了許多不同的地圖。模型逐漸學(xué)會(huì)了從任何隨機(jī)的起始點(diǎn)找到通往正確結(jié)構(gòu)的路徑。
這種方法的一個(gè)巨大優(yōu)勢(shì)是它天然支持生成多樣性。就像從山頂?shù)胶从卸鄺l路徑一樣,從噪聲到蛋白質(zhì)結(jié)構(gòu)也有多種可能的變換路徑,每條路徑都可能產(chǎn)生略微不同但都合理的最終結(jié)構(gòu)。這種特性對(duì)于研究蛋白質(zhì)的動(dòng)態(tài)行為和構(gòu)象變化極其重要。
更令人興奮的是,SimpleFold在訓(xùn)練過(guò)程中加入了一個(gè)額外的"結(jié)構(gòu)導(dǎo)師"——LDDT損失函數(shù)。這就像是在教學(xué)生畫(huà)畫(huà)時(shí),不僅要求整體效果好,還要特別注意細(xì)節(jié)的準(zhǔn)確性。LDDT專(zhuān)門(mén)關(guān)注原子之間的局部距離關(guān)系,確保生成的結(jié)構(gòu)在原子層面上也是準(zhǔn)確的。
整個(gè)訓(xùn)練過(guò)程還采用了一種聰明的"時(shí)間重采樣"策略。不是在整個(gè)時(shí)間軸上均勻地訓(xùn)練,而是更多地關(guān)注接近最終結(jié)果的時(shí)間點(diǎn)。這就像是在學(xué)習(xí)烹飪時(shí),花更多時(shí)間練習(xí)最后的裝盤(pán)步驟,因?yàn)檫@個(gè)階段的細(xì)節(jié)對(duì)最終效果影響最大。
三、通用積木搭建生物世界
SimpleFold的架構(gòu)設(shè)計(jì)哲學(xué)就像是用最基礎(chǔ)的樂(lè)高積木搭建復(fù)雜的建筑。傳統(tǒng)的蛋白質(zhì)折疊模型就像是專(zhuān)門(mén)的建筑工具——起重機(jī)專(zhuān)門(mén)用來(lái)吊重物,推土機(jī)專(zhuān)門(mén)用來(lái)推土,每種工具都有特定的用途。而SimpleFold更像是一套通用的樂(lè)高積木,雖然每塊積木都很簡(jiǎn)單,但通過(guò)巧妙的組合就能建造出令人驚嘆的結(jié)構(gòu)。
整個(gè)SimpleFold的架構(gòu)可以想象成一個(gè)三層的生產(chǎn)流水線。第一層是原子編碼器,它的工作就像是檢查員,仔細(xì)觀察每個(gè)氨基酸原子的細(xì)節(jié)信息。每個(gè)原子都有自己的"身份證"——包括它是什么類(lèi)型的原子、帶什么電荷、在分子中的位置等。編碼器將這些信息轉(zhuǎn)換成計(jì)算機(jī)能理解的數(shù)字形式,就像是給每個(gè)原子貼上了詳細(xì)的標(biāo)簽。
第二層是殘基主干,這里是整個(gè)系統(tǒng)的"大腦"。如果說(shuō)原子編碼器關(guān)注的是細(xì)節(jié),那么殘基主干關(guān)注的就是全局。它將每個(gè)氨基酸殘基(一個(gè)氨基酸就是一個(gè)殘基)看作一個(gè)整體單位,就像是將一個(gè)復(fù)雜的機(jī)器部件看作一個(gè)黑盒子。這一層使用了預(yù)訓(xùn)練的蛋白質(zhì)語(yǔ)言模型ESM2的嵌入向量,這就像是給每個(gè)氨基酸都配備了一個(gè)"翻譯官",能夠理解它在蛋白質(zhì)語(yǔ)言中的含義。
第三層是原子解碼器,它的作用就像是建筑師,根據(jù)主干層提供的全局信息,精確地確定每個(gè)原子應(yīng)該放在哪里。這一層需要將殘基級(jí)別的信息重新分解到原子級(jí)別,確保最終的結(jié)構(gòu)在原子層面上都是準(zhǔn)確的。
整個(gè)架構(gòu)中最巧妙的設(shè)計(jì)是"分組"和"解組"操作。這就像是在管理一個(gè)大型樂(lè)隊(duì)時(shí),有時(shí)需要按樂(lè)器類(lèi)型分組練習(xí)(小提琴組、大提琴組等),有時(shí)又需要全體合奏。分組操作將屬于同一個(gè)氨基酸的所有原子信息合并成一個(gè)代表性的信息,而解組操作則相反,將氨基酸級(jí)別的信息重新分配給其中的每個(gè)原子。
SimpleFold的一個(gè)突出特點(diǎn)是它使用了自適應(yīng)層。這些層就像是智能調(diào)節(jié)器,能夠根據(jù)當(dāng)前處于流匹配過(guò)程的哪個(gè)時(shí)間點(diǎn)來(lái)調(diào)整自己的行為。在早期階段(接近隨機(jī)噪聲時(shí)),模型需要進(jìn)行大幅度的調(diào)整;在后期階段(接近最終結(jié)構(gòu)時(shí)),模型需要進(jìn)行精細(xì)的微調(diào)。自適應(yīng)層讓模型能夠自動(dòng)適應(yīng)這種變化需求。
位置編碼是另一個(gè)重要的創(chuàng)新點(diǎn)。傳統(tǒng)的Transformer主要處理序列數(shù)據(jù),比如文本中的單詞順序。但蛋白質(zhì)是三維的,每個(gè)原子都有xyz三個(gè)坐標(biāo)。SimpleFold使用了四維軸向RoPE(旋轉(zhuǎn)位置嵌入),就像是給每個(gè)原子配備了一個(gè)GPS定位系統(tǒng),不僅知道它在氨基酸序列中的位置,還知道它在三維空間中的大致位置。
與傳統(tǒng)方法相比,SimpleFold的計(jì)算效率有了顯著提升。AlphaFold2的前向計(jì)算需要大約30萬(wàn)億次浮點(diǎn)運(yùn)算,而SimpleFold-3B只需要大約1.4萬(wàn)億次,效率提升了20多倍。這就像是從需要一整個(gè)工廠才能生產(chǎn)的產(chǎn)品,變成了可以在小作坊里制造的產(chǎn)品,但質(zhì)量卻絲毫不差。
四、規(guī)模化的威力展現(xiàn)
SimpleFold的一個(gè)核心假設(shè)是:如果架構(gòu)足夠通用和強(qiáng)大,那么增加模型規(guī)模和訓(xùn)練數(shù)據(jù)應(yīng)該能夠持續(xù)提升性能。這個(gè)假設(shè)就像是相信一個(gè)聰明的學(xué)生,給他更多的學(xué)習(xí)時(shí)間和更豐富的教材,他就能取得更好的成績(jī)。
研究團(tuán)隊(duì)從最小的100M參數(shù)模型一直擴(kuò)展到巨大的3B參數(shù)模型,就像是從一個(gè)小學(xué)生的大腦擴(kuò)展到一個(gè)博士生的大腦。參數(shù)數(shù)量可以理解為模型的"記憶容量"或"理解能力"。100M參數(shù)的模型就像是一個(gè)聰明的小學(xué)生,能夠處理基本的蛋白質(zhì)折疊問(wèn)題;而3B參數(shù)的模型更像是一個(gè)經(jīng)驗(yàn)豐富的專(zhuān)家,能夠處理最復(fù)雜和最具挑戰(zhàn)性的情況。
實(shí)驗(yàn)結(jié)果清楚地證明了規(guī)?;膬r(jià)值。在CASP14這個(gè)最具挑戰(zhàn)性的蛋白質(zhì)折疊競(jìng)賽中,模型性能隨著規(guī)模增加而穩(wěn)步提升。最小的SimpleFold-100M在TM分?jǐn)?shù)上達(dá)到了0.611,而最大的SimpleFold-3B達(dá)到了0.720。這個(gè)提升看起來(lái)數(shù)字不大,但在蛋白質(zhì)折疊領(lǐng)域,這種程度的改進(jìn)是非常顯著的,就像是從業(yè)余愛(ài)好者水平提升到半專(zhuān)業(yè)水平。
更重要的是,規(guī)?;男?yīng)在更困難的任務(wù)上表現(xiàn)得更明顯。在相對(duì)簡(jiǎn)單的CAMEO22基準(zhǔn)測(cè)試中,不同規(guī)模模型之間的差距較?。坏贑ASP14這樣的困難任務(wù)中,大模型的優(yōu)勢(shì)就非常明顯了。這說(shuō)明了一個(gè)重要的原理:當(dāng)面對(duì)更復(fù)雜的問(wèn)題時(shí),更強(qiáng)大的"大腦"確實(shí)能發(fā)揮更大的作用。
數(shù)據(jù)規(guī)?;瑯又匾Q芯繄F(tuán)隊(duì)使用了大約900萬(wàn)個(gè)蛋白質(zhì)結(jié)構(gòu)進(jìn)行訓(xùn)練,這是迄今為止用于蛋白質(zhì)折疊模型訓(xùn)練的最大數(shù)據(jù)集之一。這些數(shù)據(jù)來(lái)自三個(gè)主要來(lái)源:實(shí)驗(yàn)確定的PDB數(shù)據(jù)庫(kù)結(jié)構(gòu)、AlphaFold數(shù)據(jù)庫(kù)中的高質(zhì)量預(yù)測(cè)結(jié)構(gòu),以及ESM圖譜中的代表性結(jié)構(gòu)。
這種大規(guī)模數(shù)據(jù)訓(xùn)練就像是讓一個(gè)學(xué)生閱讀了人類(lèi)歷史上所有關(guān)于建筑的書(shū)籍。PDB數(shù)據(jù)庫(kù)就像是經(jīng)典的建筑教科書(shū),記錄了人類(lèi)通過(guò)實(shí)驗(yàn)直接觀察到的蛋白質(zhì)結(jié)構(gòu);AlphaFold數(shù)據(jù)庫(kù)就像是現(xiàn)代建筑設(shè)計(jì)圖集,雖然不是真實(shí)建造的,但都是經(jīng)過(guò)仔細(xì)設(shè)計(jì)和驗(yàn)證的;ESM圖譜則像是世界各地建筑風(fēng)格的大全,提供了更廣泛的多樣性。
訓(xùn)練過(guò)程采用了兩階段策略。第一階段叫做預(yù)訓(xùn)練,就像是給學(xué)生打基礎(chǔ),使用所有可用的數(shù)據(jù)讓模型學(xué)習(xí)蛋白質(zhì)折疊的基本規(guī)律。第二階段叫做微調(diào),就像是考前復(fù)習(xí),只使用最高質(zhì)量的數(shù)據(jù)來(lái)優(yōu)化模型的表現(xiàn)。
這種規(guī)模化策略的成功證明了一個(gè)重要觀點(diǎn):在生物學(xué)這樣的復(fù)雜領(lǐng)域,簡(jiǎn)單但可擴(kuò)展的方法往往比復(fù)雜但難以擴(kuò)展的方法更有前途。SimpleFold就像是證明了"大力出奇跡"這個(gè)樸素道理在人工智能時(shí)代依然有效。
五、多樣性生成的生物學(xué)意義
傳統(tǒng)的蛋白質(zhì)折疊預(yù)測(cè)就像是一個(gè)嚴(yán)格的工程師,給定一個(gè)問(wèn)題,總是給出一個(gè)精確的答案。但生物世界并不是這樣運(yùn)作的。真實(shí)的蛋白質(zhì)更像是一個(gè)靈活的舞者,它們會(huì)在不同的環(huán)境中展現(xiàn)不同的姿態(tài),這種多樣性對(duì)它們的功能至關(guān)重要。
SimpleFold的生成式特性讓它能夠捕捉到這種生物學(xué)上的多樣性。當(dāng)給定同一個(gè)氨基酸序列時(shí),SimpleFold可以生成多個(gè)不同但都合理的三維結(jié)構(gòu),就像是一個(gè)藝術(shù)家能夠從同一個(gè)主題創(chuàng)作出多幅風(fēng)格相近但各有特色的畫(huà)作。
這種能力在分子動(dòng)力學(xué)模擬驗(yàn)證中得到了充分體現(xiàn)。研究團(tuán)隊(duì)使用ATLAS數(shù)據(jù)集進(jìn)行測(cè)試,這個(gè)數(shù)據(jù)集包含了1390個(gè)蛋白質(zhì)的完整分子動(dòng)力學(xué)軌跡。分子動(dòng)力學(xué)模擬就像是給蛋白質(zhì)拍攝了一部"慢動(dòng)作電影",記錄了它們?cè)谧匀画h(huán)境中如何運(yùn)動(dòng)和變化。
SimpleFold在這項(xiàng)測(cè)試中表現(xiàn)出色,生成的結(jié)構(gòu)集合能夠很好地匹配真實(shí)的動(dòng)力學(xué)行為。具體來(lái)說(shuō),它在預(yù)測(cè)蛋白質(zhì)柔性方面的表現(xiàn)超越了許多專(zhuān)門(mén)為此設(shè)計(jì)的方法。蛋白質(zhì)柔性就像是衡量一個(gè)舞者有多靈活的指標(biāo)——有些部位可能相對(duì)僵硬,像是身體的主干,而有些部位可能非常靈活,像是手臂和腿部。
更令人印象深刻的是SimpleFold在多狀態(tài)蛋白質(zhì)預(yù)測(cè)中的表現(xiàn)。有些蛋白質(zhì)就像是變形金剛,它們可以在兩種或多種完全不同的形狀之間切換,每種形狀都對(duì)應(yīng)不同的功能。傳統(tǒng)的確定性方法在面對(duì)這種情況時(shí)就像是只能拍攝靜態(tài)照片的相機(jī),無(wú)法捕捉到變化過(guò)程。
SimpleFold在apo-holo構(gòu)象變化和折疊轉(zhuǎn)換蛋白質(zhì)的測(cè)試中表現(xiàn)出了顯著優(yōu)勢(shì)。Apo-holo構(gòu)象變化就像是蛋白質(zhì)的"開(kāi)關(guān)機(jī)制"——當(dāng)特定的小分子結(jié)合到蛋白質(zhì)上時(shí),蛋白質(zhì)會(huì)改變形狀來(lái)激活或關(guān)閉某個(gè)功能。折疊轉(zhuǎn)換蛋白質(zhì)更加神奇,它們可以完全重新折疊成不同的結(jié)構(gòu),就像是魔術(shù)師能夠?qū)⒁粋€(gè)雕塑完全變成另一個(gè)雕塑。
在apo-holo測(cè)試中,SimpleFold-3B達(dá)到了0.639的全局殘基柔性分?jǐn)?shù),這意味著它能夠準(zhǔn)確預(yù)測(cè)蛋白質(zhì)的哪些部分會(huì)發(fā)生較大變化,哪些部分相對(duì)穩(wěn)定。在折疊轉(zhuǎn)換測(cè)試中,它也展現(xiàn)出了與最先進(jìn)方法相當(dāng)?shù)男阅堋?/p>
這種多樣性生成能力對(duì)藥物發(fā)現(xiàn)具有重要意義。許多藥物的作用機(jī)制就是通過(guò)結(jié)合到蛋白質(zhì)的特定部位來(lái)改變其形狀或活性。如果我們只知道蛋白質(zhì)的一種構(gòu)象,就像是只看到了一個(gè)人的正面照片,我們可能會(huì)錯(cuò)過(guò)其他重要的結(jié)合位點(diǎn)。SimpleFold能夠生成多種構(gòu)象,就像是從不同角度拍攝了多張照片,為藥物設(shè)計(jì)提供了更全面的信息。
六、效率革命與實(shí)用價(jià)值
SimpleFold不僅在性能上與復(fù)雜的傳統(tǒng)方法相當(dāng),更重要的是它在計(jì)算效率上實(shí)現(xiàn)了革命性的提升。這種提升的意義就像是從需要超級(jí)計(jì)算機(jī)才能完成的任務(wù),變成了普通人在家用電腦上就能處理的工作。
在推理速度方面,SimpleFold展現(xiàn)出了顯著優(yōu)勢(shì)。研究團(tuán)隊(duì)在蘋(píng)果M2 Max芯片上測(cè)試了不同規(guī)模模型的推理時(shí)間。即使是最大的SimpleFold-3B模型,處理一個(gè)1024氨基酸長(zhǎng)度的蛋白質(zhì)也只需要大約111秒。相比之下,傳統(tǒng)方法往往需要數(shù)小時(shí)甚至數(shù)天的計(jì)算時(shí)間。
更令人驚訝的是SimpleFold-100M的表現(xiàn)。這個(gè)最小的模型在保持了大約90%的預(yù)測(cè)準(zhǔn)確性的同時(shí),推理速度極快,即使在消費(fèi)級(jí)硬件上也能實(shí)現(xiàn)近實(shí)時(shí)的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)。這就像是將一個(gè)需要專(zhuān)業(yè)攝影棚才能完成的攝影工作,壓縮到了手機(jī)攝像頭就能勝任的程度。
這種效率提升帶來(lái)了實(shí)際應(yīng)用上的重大意義。傳統(tǒng)的蛋白質(zhì)折疊預(yù)測(cè)往往需要專(zhuān)門(mén)的高性能計(jì)算集群,這限制了技術(shù)的普及和應(yīng)用。而SimpleFold讓普通研究人員甚至學(xué)生都能在自己的筆記本電腦上進(jìn)行蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè),這種民主化的效應(yīng)可能會(huì)加速整個(gè)領(lǐng)域的發(fā)展。
從部署角度來(lái)看,SimpleFold的通用架構(gòu)也帶來(lái)了顯著優(yōu)勢(shì)。傳統(tǒng)方法使用的三角注意力和配對(duì)表示等復(fù)雜組件,往往需要特殊的優(yōu)化和定制化的實(shí)現(xiàn)。而SimpleFold基于標(biāo)準(zhǔn)的Transformer架構(gòu),可以直接利用現(xiàn)有的深度學(xué)習(xí)框架和優(yōu)化技術(shù)。這就像是使用標(biāo)準(zhǔn)零件組裝的設(shè)備,維護(hù)和升級(jí)都更加容易。
研究團(tuán)隊(duì)還開(kāi)源了完整的代碼和模型權(quán)重,這進(jìn)一步降低了使用門(mén)檻。任何研究人員都可以直接下載預(yù)訓(xùn)練的模型,或者基于自己的數(shù)據(jù)進(jìn)行微調(diào)。這種開(kāi)放性就像是將一個(gè)專(zhuān)利技術(shù)變成了公共資源,能夠促進(jìn)整個(gè)領(lǐng)域的快速發(fā)展。
從能耗角度來(lái)看,SimpleFold的高效性也具有重要的環(huán)境意義。傳統(tǒng)的蛋白質(zhì)折疊計(jì)算往往需要大量的能源消耗,而SimpleFold的效率提升直接轉(zhuǎn)化為能耗的顯著降低。在當(dāng)前全球關(guān)注碳排放的背景下,這種技術(shù)進(jìn)步具有額外的價(jià)值。
置信度評(píng)估是SimpleFold的另一個(gè)實(shí)用特性。模型不僅能給出結(jié)構(gòu)預(yù)測(cè),還能告訴用戶(hù)它對(duì)每個(gè)部分的預(yù)測(cè)有多確信。這種置信度評(píng)估就像是天氣預(yù)報(bào)中的降雨概率,讓用戶(hù)能夠更好地理解和使用預(yù)測(cè)結(jié)果。在實(shí)際應(yīng)用中,用戶(hù)可以重點(diǎn)關(guān)注高置信度的部分,而對(duì)低置信度的部分進(jìn)行額外的驗(yàn)證。
七、突破傳統(tǒng)的技術(shù)創(chuàng)新
SimpleFold的成功挑戰(zhàn)了蛋白質(zhì)折疊領(lǐng)域的幾個(gè)核心假設(shè),這些突破性創(chuàng)新就像是在建筑學(xué)中證明了不需要鋼筋混凝土也能建造摩天大樓一樣令人震撼。
首先是對(duì)多序列比對(duì)依賴(lài)性的顛覆。傳統(tǒng)觀點(diǎn)認(rèn)為,要準(zhǔn)確預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu),必須分析進(jìn)化相關(guān)的序列信息。這就像是認(rèn)為要理解一首詩(shī)的含義,必須研究詩(shī)人的全部作品和文化背景。SimpleFold證明了僅僅通過(guò)蛋白質(zhì)語(yǔ)言模型的嵌入向量,就能獲得足夠的序列信息來(lái)進(jìn)行準(zhǔn)確預(yù)測(cè)。
這種突破對(duì)孤兒蛋白質(zhì)的研究特別重要。孤兒蛋白質(zhì)就像是獨(dú)特的藝術(shù)作品,它們?cè)谶M(jìn)化樹(shù)上沒(méi)有太多相似的"親戚",傳統(tǒng)的多序列比對(duì)方法對(duì)它們效果很差。SimpleFold的方法為研究這些獨(dú)特蛋白質(zhì)開(kāi)辟了新的道路。
其次是對(duì)配對(duì)表示必要性的質(zhì)疑。傳統(tǒng)方法認(rèn)為必須顯式地建模每?jī)蓚€(gè)氨基酸之間的相互作用,這種觀點(diǎn)就像是認(rèn)為要理解一個(gè)交響樂(lè)團(tuán)的演奏,必須記錄每?jī)蓚€(gè)樂(lè)手之間的具體互動(dòng)。SimpleFold證明了通過(guò)隱式學(xué)習(xí),模型能夠自動(dòng)發(fā)現(xiàn)和利用這些相互作用模式,而不需要人為地設(shè)計(jì)復(fù)雜的表示方法。
第三個(gè)重要突破是證明了標(biāo)準(zhǔn)Transformer在三維結(jié)構(gòu)預(yù)測(cè)中的強(qiáng)大能力。Transformer最初是為處理序列數(shù)據(jù)(如文本)而設(shè)計(jì)的,將其應(yīng)用到三維結(jié)構(gòu)預(yù)測(cè)就像是用文字處理軟件來(lái)制作三維模型。SimpleFold通過(guò)巧妙的位置編碼和層次化處理,讓Transformer能夠有效地處理三維幾何信息。
流匹配訓(xùn)練目標(biāo)是另一個(gè)關(guān)鍵創(chuàng)新。傳統(tǒng)的回歸訓(xùn)練就像是教學(xué)生"標(biāo)準(zhǔn)答案",而流匹配更像是教學(xué)生"解題思路"。這種差異讓SimpleFold天然具備了生成多樣性結(jié)構(gòu)的能力,這對(duì)于理解蛋白質(zhì)的動(dòng)態(tài)行為至關(guān)重要。
時(shí)間步重采樣策略也體現(xiàn)了深刻的洞察。研究團(tuán)隊(duì)發(fā)現(xiàn),在接近最終結(jié)構(gòu)的時(shí)間步上進(jìn)行更多訓(xùn)練,能夠顯著提升模型的精度。這就像是在學(xué)習(xí)繪畫(huà)時(shí),花更多時(shí)間練習(xí)最后的細(xì)節(jié)修飾,因?yàn)檫@個(gè)階段的質(zhì)量對(duì)最終效果影響最大。
LDDT損失函數(shù)的引入展現(xiàn)了將生物學(xué)約束融入機(jī)器學(xué)習(xí)的巧妙方式。LDDT專(zhuān)門(mén)關(guān)注局部原子距離的準(zhǔn)確性,這種約束就像是在自由創(chuàng)作中加入了物理定律的限制,確保生成的結(jié)構(gòu)不僅看起來(lái)合理,在原子層面上也是準(zhǔn)確的。
數(shù)據(jù)增強(qiáng)策略也值得關(guān)注。研究團(tuán)隊(duì)使用了SO(3)旋轉(zhuǎn)增強(qiáng),這意味著在訓(xùn)練過(guò)程中,每個(gè)蛋白質(zhì)結(jié)構(gòu)都會(huì)被隨機(jī)旋轉(zhuǎn)到不同的方向。這種策略就像是讓學(xué)生從不同角度觀察同一個(gè)物體,培養(yǎng)他們的空間理解能力。
八、實(shí)驗(yàn)驗(yàn)證與性能比較
SimpleFold的性能驗(yàn)證就像是一場(chǎng)全方位的能力測(cè)試,研究團(tuán)隊(duì)在多個(gè)標(biāo)準(zhǔn)化基準(zhǔn)測(cè)試中對(duì)比了它與當(dāng)前最先進(jìn)方法的表現(xiàn)。這些測(cè)試就像是學(xué)術(shù)界的"標(biāo)準(zhǔn)化考試",確保所有方法在相同條件下進(jìn)行公平比較。
在CAMEO22基準(zhǔn)測(cè)試中,SimpleFold展現(xiàn)出了與傳統(tǒng)方法相當(dāng)?shù)男阅?。CAMEO22包含183個(gè)測(cè)試目標(biāo),這些都是在模型訓(xùn)練之后才解析出結(jié)構(gòu)的蛋白質(zhì),確保了測(cè)試的公平性。SimpleFold-3B在這個(gè)測(cè)試中達(dá)到了0.837的TM分?jǐn)?shù),這個(gè)成績(jī)與RoseTTAFold2和AlphaFold2等頂級(jí)方法的表現(xiàn)非常接近。
更令人印象深刻的是在CASP14測(cè)試中的表現(xiàn)。CASP14是蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)領(lǐng)域最權(quán)威的競(jìng)賽,被稱(chēng)為蛋白質(zhì)折疊領(lǐng)域的"奧林匹克"。這個(gè)測(cè)試包含70個(gè)特別挑戰(zhàn)性的目標(biāo),許多是傳統(tǒng)方法難以處理的復(fù)雜情況。SimpleFold-3B在這里取得了0.720的TM分?jǐn)?shù),超越了ESMFold等其他基于蛋白質(zhì)語(yǔ)言模型的方法。
特別值得注意的是SimpleFold在不同難度任務(wù)上的穩(wěn)定性。許多模型在簡(jiǎn)單任務(wù)上表現(xiàn)很好,但在困難任務(wù)上就會(huì)顯著下降。SimpleFold在從CAMEO22到CASP14的難度跳躍中,性能下降幅度相對(duì)較小,這說(shuō)明了它的魯棒性。
在計(jì)算效率方面的比較更加令人震撼。AlphaFold2的單次前向計(jì)算需要大約30.9萬(wàn)億次浮點(diǎn)運(yùn)算,而SimpleFold-3B只需要1.4萬(wàn)億次,效率提升了22倍。這種效率提升不是以準(zhǔn)確性為代價(jià)的——SimpleFold在保持競(jìng)爭(zhēng)性能的同時(shí)實(shí)現(xiàn)了如此顯著的效率提升。
推理時(shí)間的比較同樣有說(shuō)服力。在處理1024個(gè)氨基酸長(zhǎng)度的蛋白質(zhì)時(shí),AlphaFold2需要111.5秒,ESMFold需要43.6秒,而SimpleFold-3B只需要44.6秒,SimpleFold-100M更是只需要14秒??紤]到SimpleFold-100M的參數(shù)量比AlphaFold2少10倍以上,這種效率提升是非常顯著的。
在ensemble生成任務(wù)上,SimpleFold的優(yōu)勢(shì)更加明顯。傳統(tǒng)的確定性方法在這方面表現(xiàn)較差,因?yàn)樗鼈儽旧砭筒皇菫樯啥鄻有远O(shè)計(jì)的。SimpleFold在ATLAS數(shù)據(jù)集上的表現(xiàn)超越了多數(shù)專(zhuān)門(mén)設(shè)計(jì)的ensemble生成方法,在多個(gè)關(guān)鍵指標(biāo)上都取得了最佳成績(jī)。
置信度預(yù)測(cè)是另一個(gè)重要的評(píng)估維度。SimpleFold的pLDDT模塊能夠預(yù)測(cè)每個(gè)殘基的置信度分?jǐn)?shù),這個(gè)分?jǐn)?shù)與實(shí)際的結(jié)構(gòu)準(zhǔn)確性呈現(xiàn)強(qiáng)相關(guān)性(相關(guān)系數(shù)0.77)。這種置信度評(píng)估對(duì)實(shí)際應(yīng)用非常重要,它讓用戶(hù)能夠識(shí)別出預(yù)測(cè)中最可靠的部分。
值得強(qiáng)調(diào)的是,SimpleFold在不使用MSA信息的情況下取得了這些成績(jī)。這意味著它在計(jì)算資源需求、推理速度和部署便利性方面都有顯著優(yōu)勢(shì),同時(shí)性能上沒(méi)有重大妥協(xié)。這種平衡在實(shí)際應(yīng)用中具有重要價(jià)值。
九、擴(kuò)展性驗(yàn)證與未來(lái)潛力
SimpleFold最令人興奮的特性之一是它展現(xiàn)出的良好擴(kuò)展性,這種特性就像是發(fā)現(xiàn)了一個(gè)具有無(wú)限增長(zhǎng)潛力的投資項(xiàng)目。研究團(tuán)隊(duì)通過(guò)系統(tǒng)性的實(shí)驗(yàn)證明了模型性能與計(jì)算資源、數(shù)據(jù)規(guī)模和模型大小之間存在可預(yù)測(cè)的正相關(guān)關(guān)系。
模型規(guī)模擴(kuò)展實(shí)驗(yàn)揭示了一個(gè)重要規(guī)律:從100M參數(shù)到3B參數(shù)的過(guò)程中,性能提升是持續(xù)且穩(wěn)定的。這種擴(kuò)展性就像是給一個(gè)聰明學(xué)生提供更大的圖書(shū)館——知識(shí)儲(chǔ)備越豐富,解決問(wèn)題的能力就越強(qiáng)。在CASP14測(cè)試中,每增加一個(gè)數(shù)量級(jí)的參數(shù),TM分?jǐn)?shù)大約提升0.02-0.03,這個(gè)提升雖然看起來(lái)不大,但在蛋白質(zhì)折疊領(lǐng)域是非常顯著的進(jìn)步。
數(shù)據(jù)規(guī)模擴(kuò)展同樣重要。研究團(tuán)隊(duì)比較了使用不同數(shù)據(jù)量訓(xùn)練的模型性能,發(fā)現(xiàn)從16萬(wàn)個(gè)結(jié)構(gòu)增加到870萬(wàn)個(gè)結(jié)構(gòu)的過(guò)程中,模型性能持續(xù)提升。這種數(shù)據(jù)擴(kuò)展效應(yīng)就像是讓一個(gè)醫(yī)生見(jiàn)過(guò)更多的病例——經(jīng)驗(yàn)越豐富,診斷能力就越準(zhǔn)確。
特別有趣的是,SimpleFold在困難任務(wù)上的擴(kuò)展效應(yīng)更加明顯。在相對(duì)簡(jiǎn)單的任務(wù)上,小模型和大模型的差距較?。坏诰哂刑魬?zhàn)性的任務(wù)上,大模型的優(yōu)勢(shì)就非常突出。這個(gè)現(xiàn)象說(shuō)明了一個(gè)重要道理:面對(duì)復(fù)雜問(wèn)題時(shí),更強(qiáng)大的"智慧"確實(shí)能發(fā)揮更大的作用。
計(jì)算效率的擴(kuò)展性分析也很有啟發(fā)性。雖然模型參數(shù)增加了30倍(從100M到3B),但計(jì)算時(shí)間只增加了約3倍。這種亞線性的計(jì)算復(fù)雜度增長(zhǎng)意味著擴(kuò)展到更大規(guī)模是可行的,不會(huì)導(dǎo)致計(jì)算成本的爆炸性增長(zhǎng)。
研究團(tuán)隊(duì)還分析了不同訓(xùn)練數(shù)據(jù)源的貢獻(xiàn)。實(shí)驗(yàn)數(shù)據(jù)(PDB)提供了最高質(zhì)量的結(jié)構(gòu)信息,就像是金標(biāo)準(zhǔn)的教科書(shū);高質(zhì)量的計(jì)算預(yù)測(cè)數(shù)據(jù)(如從AlphaFold數(shù)據(jù)庫(kù)篩選的結(jié)構(gòu))提供了可靠的補(bǔ)充,就像是優(yōu)秀的參考書(shū);而大規(guī)模的多樣性數(shù)據(jù)(如AFESM數(shù)據(jù)集)雖然質(zhì)量參差不齊,但提供了寶貴的多樣性,就像是讓學(xué)生接觸到更廣泛的案例。
這種良好的擴(kuò)展性為未來(lái)的發(fā)展指明了方向。隨著計(jì)算資源的持續(xù)增長(zhǎng)和蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)的不斷積累,SimpleFold的性能有望繼續(xù)提升。更重要的是,這種擴(kuò)展性是可預(yù)測(cè)的,研究人員可以根據(jù)可用資源來(lái)合理規(guī)劃模型的規(guī)模。
擴(kuò)展性還體現(xiàn)在應(yīng)用的靈活性上。由于使用了標(biāo)準(zhǔn)的Transformer架構(gòu),SimpleFold可以很容易地與其他技術(shù)結(jié)合。例如,可以將其與語(yǔ)言模型結(jié)合來(lái)處理蛋白質(zhì)設(shè)計(jì)任務(wù),或者與分子動(dòng)力學(xué)模擬結(jié)合來(lái)研究蛋白質(zhì)動(dòng)態(tài)行為。
從生物學(xué)角度來(lái)看,SimpleFold的擴(kuò)展性意味著它有潛力處理更復(fù)雜的生物系統(tǒng)。雖然當(dāng)前版本主要關(guān)注單鏈蛋白質(zhì),但其通用架構(gòu)為擴(kuò)展到蛋白質(zhì)復(fù)合物、蛋白質(zhì)-DNA交互等更復(fù)雜系統(tǒng)奠定了基礎(chǔ)。
說(shuō)到底,SimpleFold代表了一種全新的研究范式。它證明了在生物學(xué)這樣的復(fù)雜領(lǐng)域,簡(jiǎn)單但可擴(kuò)展的方法往往比復(fù)雜但難以擴(kuò)展的方法更有前途。這個(gè)發(fā)現(xiàn)可能會(huì)影響整個(gè)計(jì)算生物學(xué)領(lǐng)域的發(fā)展方向,鼓勵(lì)研究人員更多地關(guān)注通用性和擴(kuò)展性,而不是局限于特定領(lǐng)域的技巧。
這種范式轉(zhuǎn)變的意義超越了技術(shù)本身。它暗示著在人工智能時(shí)代,跨領(lǐng)域的通用方法可能比專(zhuān)門(mén)化的方法更有價(jià)值。SimpleFold不僅解決了蛋白質(zhì)折疊問(wèn)題,更重要的是它為如何將AI技術(shù)應(yīng)用到科學(xué)研究中提供了一個(gè)新的思路。隨著技術(shù)的不斷發(fā)展,我們有理由期待SimpleFold及其后續(xù)版本能夠在蛋白質(zhì)科學(xué)和藥物發(fā)現(xiàn)領(lǐng)域發(fā)揮更大的作用,最終造福人類(lèi)健康。
Q&A
Q1:SimpleFold相比傳統(tǒng)的AlphaFold2有什么主要優(yōu)勢(shì)?
A:SimpleFold的主要優(yōu)勢(shì)在于簡(jiǎn)化和效率。它完全拋棄了AlphaFold2使用的復(fù)雜組件如多序列比對(duì)、配對(duì)表示和三角更新,僅使用標(biāo)準(zhǔn)的Transformer塊就能達(dá)到相當(dāng)?shù)念A(yù)測(cè)準(zhǔn)確性。在計(jì)算效率上,SimpleFold的計(jì)算量比AlphaFold2少了20多倍,推理速度更快,而且可以在普通消費(fèi)級(jí)硬件上運(yùn)行。
Q2:SimpleFold能夠生成多種蛋白質(zhì)構(gòu)象嗎?這有什么生物學(xué)意義?
A:是的,SimpleFold基于流匹配技術(shù),天然具備生成多樣性構(gòu)象的能力。這種特性在生物學(xué)上非常重要,因?yàn)檎鎸?shí)的蛋白質(zhì)會(huì)在不同環(huán)境中展現(xiàn)不同的形狀,這些形狀變化與蛋白質(zhì)的功能密切相關(guān)。SimpleFold在分子動(dòng)力學(xué)模擬和多狀態(tài)蛋白質(zhì)預(yù)測(cè)任務(wù)中表現(xiàn)出色,為研究蛋白質(zhì)動(dòng)態(tài)行為和藥物發(fā)現(xiàn)提供了有價(jià)值的信息。
Q3:普通研究人員可以使用SimpleFold嗎?有什么技術(shù)要求?
A:是的,蘋(píng)果公司已經(jīng)開(kāi)源了SimpleFold的完整代碼和模型權(quán)重。由于它基于標(biāo)準(zhǔn)的Transformer架構(gòu),普通研究人員可以很容易地下載和使用。最小的SimpleFold-100M模型甚至可以在普通筆記本電腦上運(yùn)行,為蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的民主化提供了可能。研究人員也可以根據(jù)自己的數(shù)據(jù)對(duì)模型進(jìn)行微調(diào)。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專(zhuān)家搜索方法,讓AI能根據(jù)不同問(wèn)題靈活調(diào)整內(nèi)部專(zhuān)家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類(lèi)型問(wèn)題偏愛(ài)不同專(zhuān)家配置,為AI推理優(yōu)化開(kāi)辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過(guò)"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問(wèn)題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開(kāi)發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過(guò)滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問(wèn)題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開(kāi)辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過(guò)讓AI模型學(xué)習(xí)解決幾何問(wèn)題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來(lái)顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。