▲ 人工智能可高速?gòu)臄?shù)百萬(wàn)遺傳變異里進(jìn)行搜索,并確定引發(fā)罕見(jiàn)疾病的原因,還可以快速閱讀和查閱現(xiàn)有醫(yī)學(xué)文獻(xiàn)
據(jù)統(tǒng)計(jì),全球有4億人患有罕見(jiàn)疾病。這個(gè)數(shù)字比美國(guó)總?cè)丝跀?shù)字還大。此外,根據(jù)全球基因組織的相關(guān)資料顯示,80%的罕見(jiàn)疾病由基因缺陷引起,而基因缺陷的準(zhǔn)確診斷結(jié)果平均需要4.8年時(shí)間。這就是為什么30%的患有罕見(jiàn)疾病的兒童活不到五歲的重要原因之一。
此外,95%的罕見(jiàn)疾病并不存在獲FDA批準(zhǔn)的治療。這也是件很無(wú)助的事情。好消息是,近年來(lái)興起的人工智能和機(jī)器學(xué)習(xí)成了對(duì)抗罕見(jiàn)病的重要工具。
如今,業(yè)界已經(jīng)有不少公司開(kāi)發(fā)了各種平臺(tái),借助人工智能確認(rèn)罕見(jiàn)疾病基因變異的根源,并提供給醫(yī)學(xué)研究人員和業(yè)內(nèi)人士使用。
其中一家公司是總部在以色列的Emdgene。Emdgene公司建的平臺(tái)不僅可以掃描罕見(jiàn)疾病患者的DNA數(shù)據(jù),還可以使用自然語(yǔ)言處理(NLP)閱讀最新的醫(yī)學(xué)文獻(xiàn)。借此,該平臺(tái)就能夠找到病人遺傳變異與病人目前狀態(tài)之間相關(guān)的書(shū)面記錄,進(jìn)而加快病情診斷。Emdgene聯(lián)合創(chuàng)始人兼CEO Einat Metzer解釋說(shuō),假若沒(méi)有這個(gè)平臺(tái),要做到這一點(diǎn)的話會(huì)是一個(gè)艱苦和耗時(shí)的過(guò)程。
他表示:“每個(gè)人的DNA都包含了數(shù)百萬(wàn)種無(wú)害的遺傳變異,實(shí)驗(yàn)室里的遺傳學(xué)家們必須從這么多變異中識(shí)別出導(dǎo)致某個(gè)疾病的一種變異。在不使用算法的情形下,他們通常是通過(guò)手動(dòng)過(guò)濾這幾百種基因變異。此外,他們還必須搜索現(xiàn)有的文獻(xiàn),以確保不會(huì)錯(cuò)過(guò)任何新發(fā)現(xiàn)的信息或其它證據(jù)。”
Metzer還表示,Emedgene機(jī)器學(xué)習(xí)算法可完成所有上述步驟,并自動(dòng)識(shí)別致病的變異基因以及文獻(xiàn)里和數(shù)據(jù)庫(kù)里的支持證據(jù)。遺傳學(xué)家所要做的,就只是審查產(chǎn)生的結(jié)果,而不是從頭開(kāi)始做整體分析。
另外,Emedgene上個(gè)月還推出了一種名為Pathorolo的新算法。這一算法可以計(jì)算一個(gè)具體的遺傳病例可能得到解決的可能性,也可以用于重新評(píng)估過(guò)去未解決的病例——這樣的病例占所有罕見(jiàn)遺傳病例的60%之多。
Metzer 表示:“實(shí)驗(yàn)室一般會(huì)定期重新分析過(guò)去未解決的病例,希望新發(fā)布的信息或新生物信息學(xué)工具可以協(xié)助解決一些病例。這樣的做法,通常可以將解決病例的百分比提高10%。但這個(gè)過(guò)程隨著過(guò)去未解決病例的積累和不斷增長(zhǎng)而變得十分復(fù)雜,如果沒(méi)有機(jī)器學(xué)習(xí)的幫助是不可持續(xù)的。而通過(guò)Pathorolo算法,我們就可以識(shí)別出那些過(guò)去未解決而今天有可能得到解決的病例,然后讓實(shí)驗(yàn)室把時(shí)間和精力集中放在有望解決以及可定期再分析未解決的病例上。”
當(dāng)然,除了Emdgene之外,也有不少公司正在將AI用于罕見(jiàn)遺傳性疾病的診斷。比如,德國(guó)的初創(chuàng)公司Nostos基因組學(xué)。和Emedgene一樣,Nostos基因組學(xué)也在利用機(jī)器學(xué)習(xí)處理病人的遺傳變異及確定可能的原因。另一個(gè)有意思的例子是總部在美國(guó)波士頓的FDNA:今年一月FDNA在《自然醫(yī)學(xué)》(Nature Medicine)雜志上發(fā)表了一篇論文(https://www.nature.com/articles/d41586-019-00027-x),論文詳細(xì)介紹了FDNA打造的名為Face2Gene的智能手機(jī)應(yīng)用程序,經(jīng)過(guò)大量圖像的訓(xùn)練,該應(yīng)用程序可以識(shí)別出患有罕見(jiàn)遺傳性疾病的人。
還有一些比較復(fù)雜的案例,比如Fabric Genomics公司。Fabric Genomics公司總部在美國(guó)舊金山,主打用AI進(jìn)行各種遺傳分析。據(jù)了解,F(xiàn)abric Genomics擁有一些授權(quán)超過(guò)1000個(gè)臨床實(shí)驗(yàn)室和學(xué)術(shù)機(jī)構(gòu)使用的算法。其中,一些算法可用于篩選遺傳變異體可能造成的罕見(jiàn)疾病,診斷成功率能達(dá)約50%,而業(yè)界的平均成功率則只有25%至30%。
Fabric Genomics的算法今年四月曾被美國(guó)圣迭戈的Rady兒童基因組醫(yī)學(xué)研究所的研究人員采用,利用機(jī)器學(xué)習(xí)過(guò)程和臨床自然語(yǔ)言處理(CNLP),研究所的罕見(jiàn)遺傳性疾病診斷時(shí)長(zhǎng)甚至創(chuàng)下了記錄。具體來(lái)說(shuō),研究所通過(guò)使用整個(gè)系統(tǒng)協(xié)助診斷重癥監(jiān)護(hù)室的嬰幼兒,在20小時(shí)內(nèi)提供了基因組測(cè)序,共涉及95名患兒及97種遺傳病,精確度達(dá)99%。
Rady兒童基因組醫(yī)學(xué)研究所總裁兼CEO Stephen Kingsmore醫(yī)生表示:“有些人稱其為人工智能,我們稱其為增強(qiáng)智能。病人護(hù)理自始至終都是醫(yī)生的事。我們通過(guò)技術(shù)的力量可以迅速準(zhǔn)確地確定遺傳性疾病的根本原因,然后再迅速地將這一關(guān)鍵信息提供給重癥監(jiān)護(hù)室的醫(yī)生,讓他們能夠?qū)W⒌貙?duì)那些艱難求生存的嬰兒進(jìn)行個(gè)性化護(hù)理。”
這些成功的案例表明,AI對(duì)罕見(jiàn)病診斷是一劑良方,對(duì)4億患有罕見(jiàn)疾病的人來(lái)說(shuō)更是如此。目前這些罕見(jiàn)疾病經(jīng)常被醫(yī)院忽視,醫(yī)院也沒(méi)有足夠的資源來(lái)處理這些疾病。因此,AI和機(jī)器學(xué)習(xí)在這個(gè)領(lǐng)域的引入將讓所有人受益。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專家搜索方法,讓AI能根據(jù)不同問(wèn)題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問(wèn)題偏愛(ài)不同專家配置,為AI推理優(yōu)化開(kāi)辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過(guò)"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問(wèn)題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開(kāi)發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過(guò)滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問(wèn)題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開(kāi)辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過(guò)讓AI模型學(xué)習(xí)解決幾何問(wèn)題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來(lái)顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。