隨著致命性新冠病毒在全球范圍內(nèi)的持續(xù)擴散,科學(xué)家們正利用基因測序加開源軟件工具跟蹤其具體傳播路徑。
這款名為Nextstrain的軟件工具雖然無法確切預(yù)測病毒的下一步蔓延,但卻能夠及時提醒我們新的病例來自何處。對于全球各地的衛(wèi)生官員來說,這類信息可謂至關(guān)重要。只要快速發(fā)現(xiàn)新病例,他們就能及時跟進,了解這些病例源自境外抑或是本地傳播。
Nextstarin項目成員、計算科學(xué)家James Hadfield表示,這種基因組流行病學(xué)分析“對于公共衛(wèi)生而言極具價值。這類數(shù)據(jù)的處理時間越早,后續(xù)響應(yīng)補救措施的效果就越好。”
此番導(dǎo)致嚴重呼吸系統(tǒng)疾病的COVID-19新型冠狀病毒于去年12月首次出現(xiàn)在中國,隨后快速感染80000余人。截至目前,新冠病毒已經(jīng)傳播至趤85個國家/地區(qū),且韓國、伊朗與意大利的發(fā)病率最高。到本文撰稿時,美國也已經(jīng)確認超過250起病例。
隨著新病例的出現(xiàn),確定病毒來源就變得非常重要,特別是明確感染者來自本地、還是在其他地區(qū)感染到病毒。在準確把握這部分信息之后,公共衛(wèi)生官員即可立足出行限制、學(xué)校停課、疑似病例隔離以及防疫資源分配等層面做出明智決策。
利用基因測序技術(shù)為冠狀病毒“畫像”
基因組分析能夠幫助我們找到揭示病毒起源的線索。在本次疫情爆發(fā)期間,病毒的遺傳密碼會隨著傳播過程不斷發(fā)生穩(wěn)定突變。但每一次突變往往影響不大,只表現(xiàn)為基因中的單一堿基變換——例如由ATC變化為ATTC。著眼于突變,我們能夠在一定程度上把握病毒的傳播時間與地理軌跡。(目前尚無證據(jù)證明這種突變已經(jīng)對新冠病毒的生物活性造成影響。)
通過比較全球范圍內(nèi)采集到病毒樣本基因,新型工具即可繪制出病毒在世界各地傳播時所發(fā)生的突變圖譜。Nextstrain的意義也正在于此。Hafield指出,“我們偽造這些自然發(fā)生的基因突變,協(xié)助生成與病毒傳播相關(guān)的可視化信息。”
Nextstrain繪制的病毒圖譜涵蓋病毒家譜以及進化時間表。對于此次新冠病毒,其家譜起源于中國武漢市,并在此后不斷衍生分支。當新病例出現(xiàn)時,Nextstrain可以將新病毒樣本的基因與數(shù)據(jù)庫內(nèi)的原有基因進行比較,借此確定其起源區(qū)域。
例如,美國的研究人員已經(jīng)從加利福尼亞州出現(xiàn)的8起病例中讀取或測得冠狀病毒基因組序列。Hafield指出,其中至少6例在遺傳學(xué)層面存在差異,因此證明這些病例由美國之外傳播入境。
Hafield解釋道,“從基因組數(shù)據(jù)角度來看,此次調(diào)查中至少有6例病毒毒株由境外傳入加利福尼亞。當然,這并不是說加利福尼亞州內(nèi)就不存在任何本地傳播,只是當前的基因組數(shù)據(jù)還無法證實這一點。”
西雅圖地區(qū)傳播的冠狀病毒
相比之下,根據(jù)Nextstrain的分析,西雅圖地區(qū)已經(jīng)成為病毒的傳播溫床。該軟件比較了兩起病例,其一采樣自今年1月中旬,其二則采樣自今年2月下旬,且全部發(fā)生在西雅圖附近的斯諾霍米什縣。由于這些病毒存在遺傳相似性,因此可以證明屬于本地傳播。
弗雷德哈欽森癌癥研究中心研究員Trevor Bedford是Nextstrain項目的參與者,他表示在以上兩起病例發(fā)現(xiàn)間隔的六周之內(nèi),病毒很可能已經(jīng)在本地社區(qū)間進行大范圍傳播。他預(yù)計單西雅圖區(qū)域一地就存在約600名潛在感染者,而預(yù)計感染者上限可能多達1500人。(大多數(shù)新冠病毒病例的發(fā)病癥狀比較輕微,感染者很可能不會前往醫(yī)院就診。)
當然,Nextstrain的成功也高度依賴于科學(xué)家們對病毒樣本的努力測序,特別是將測序結(jié)果發(fā)布至可免費訪問的網(wǎng)站之上。到目前為止,全球研究人員都在積極發(fā)布自己的測序發(fā)現(xiàn)。Hadfield表示,大多數(shù)從業(yè)者都會將測序數(shù)據(jù)上傳至公開訪問的GISAID庫當中。感謝整個社區(qū)的貢獻,Nextstrain團隊得以在這里找到軟件開發(fā)所必需的寶貴數(shù)據(jù)。
然而,在資源相對有限的區(qū)域,科學(xué)家可能拿不到進行此類分析所需要的實驗室工具或者培訓(xùn)素材。為此,一支名為ARTIC Network的小組正在提供協(xié)議與培訓(xùn)資源,幫助全球科學(xué)家順利完成疾病監(jiān)測與基因測序。他們還開發(fā)出“案例實驗室”,引導(dǎo)用戶輕松將資源部署至遠程位置。
上周,巴西也傳出令人振奮的成功故事。在不到48小時之內(nèi),研究人員即從圣保羅的一位病患身上收集到新冠病毒樣本,利用ARTIC協(xié)議對病毒基因組完成測序,并將數(shù)據(jù)共享至GISAID庫??茖W(xué)家們在這里使用的基因組測序工具為MinION。
好文章,需要你的鼓勵
浙江大學(xué)團隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團隊提出SIRI方法,通過"壓縮-擴張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準確率低"的問題。實驗顯示,該方法在數(shù)學(xué)競賽題上將模型準確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團隊開發(fā)出Rolling Forcing技術(shù),實現(xiàn)AI視頻實時流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓(xùn)練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團隊發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強化學(xué)習(xí)方法訓(xùn)練多個AI模型。實驗結(jié)果顯示,幾何訓(xùn)練在四個空間智能測試基準上都帶來顯著提升,其中最佳模型達到49.6%準確率,超越此前最好成績。這項研究揭示了基礎(chǔ)幾何知識對培養(yǎng)AI空間智能的重要價值。