科技行者 3月6日 北京消息 開發(fā)新藥絕不是一件容易的事。平均而言,新型藥品的開發(fā)工作需要耗時(shí)十年,且研發(fā)成本高達(dá)26億美元——只有這樣的巨額投入之下,藥物才能由實(shí)驗(yàn)室真正走向市場(chǎng)。而由于其安全性及有效性的不確定性,最終往往只有約5%的實(shí)驗(yàn)性藥品能夠被實(shí)際投放市場(chǎng)。
不過藥物制造商與各大科技企業(yè)正投入數(shù)十億美元以建立人工智能解決方案,希望借此加快藥物發(fā)現(xiàn)速度并降低藥物成本。
華盛頓州雷蒙德市微軟研究實(shí)驗(yàn)室主任Eric Horvitz在近期于德克薩斯州奧斯汀市召開的美國(guó)科學(xué)促進(jìn)會(huì)年會(huì)上指出,“我認(rèn)為人工智能堪稱醫(yī)療衛(wèi)生領(lǐng)域的沉睡巨人。”他解釋稱,微軟公司正積極投資人工智能技術(shù)以推動(dòng)藥物設(shè)計(jì)與藥理學(xué)研究,研究藥物如何在體當(dāng)中發(fā)揮作用,并將這項(xiàng)技術(shù)描述為“巨大的機(jī)遇”。
微軟公司絕不是惟一在人工智能技術(shù)身上押下重注的廠商。截至2月底,位于多倫多的生物技術(shù)企業(yè)BenchSci已經(jīng)發(fā)布統(tǒng)計(jì)結(jié)論,發(fā)現(xiàn)目前已經(jīng)有16家制藥公司以及60多家初創(chuàng)企業(yè)在利用人工智能技術(shù)進(jìn)行藥物開發(fā)。
最大的瓶頸
藥物開發(fā)領(lǐng)域最大的瓶頸通常在于研究工作的早期階段,特別是從確定潛在致病目標(biāo)(通常為人體內(nèi)的蛋白質(zhì))到測(cè)試候選藥物能否達(dá)成治療目的之間所需要的時(shí)間。
眾多最具發(fā)展雄心的人工智能組織——包括ATOM私營(yíng)-公共財(cái)團(tuán)——希望能夠?qū)⑦@一過程由原本的四到六年周期縮短至一年之內(nèi)。
由于只有5%的實(shí)驗(yàn)性藥物能夠最終被投放市場(chǎng),因此人工智能技術(shù)的引入將有助于改善周期漫長(zhǎng)且以勞動(dòng)密集型為主的藥物發(fā)現(xiàn)過程。
當(dāng)然,這項(xiàng)崇高的目標(biāo)暫時(shí)還未能達(dá)成。不過總部位于倫敦的歐洲最大私營(yíng)人工智能企業(yè)BenevolentAI公司表示,一旦確定了有望攻克的疾病目標(biāo),那么此項(xiàng)技術(shù)的引入將能夠顯著減少候選藥物所需試驗(yàn)數(shù)量與錯(cuò)誤量。到目前為止,該公司估計(jì)其能夠?qū)⑾嚓P(guān)研發(fā)成本降低60%,并將藥物的研發(fā)時(shí)間由原本的三年縮短至一年。
其它以人工智能為導(dǎo)向的藥物開發(fā)工作也顯示出振奮人心的早期收益,其中包括更有效地治療艾滋病、高血壓、傳染病以及癌癥等。
提前預(yù)測(cè)失敗
由于成功開發(fā)出新藥的可能性極低,因此制藥業(yè)已經(jīng)習(xí)慣了這種“幾乎總是以失敗告終”的狀況。但英國(guó)葛蘭素史克公司新近于巴爾的摩建立的AI藥物發(fā)現(xiàn)部門負(fù)責(zé)人John Baldoni表示,人工智能檢測(cè)方法能夠有效清除部分候選藥物,同時(shí)提取其中的有價(jià)值數(shù)據(jù)以推動(dòng)其它項(xiàng)目的發(fā)展。
舉例來說,通過對(duì)其所在公司的數(shù)據(jù)庫(kù)進(jìn)行搜索,Baldoni和他的同事們發(fā)現(xiàn)超過23萬種用于對(duì)大腦疾病進(jìn)行靶向治療的候選藥物。他指出,這些分子雖然都不適合其目前所推動(dòng)的項(xiàng)目(專注于其它疾病),但人工智能算法仍有助于揭示這類能夠進(jìn)入大腦的化學(xué)成分中的共通性結(jié)構(gòu)特征。
Baldoni的團(tuán)隊(duì)目前正在明智其它人工智能程序來模擬如何將這些分子以新的方式組合在一起,并預(yù)測(cè)其中哪些部分可能有助于滲透至大腦之內(nèi)以達(dá)到治療疾病的目的——而哪些組合可能產(chǎn)生毒性。
BenevolentAI公司已經(jīng)擴(kuò)大了其研究規(guī)模,其中涉及20多種針對(duì)罕見型癌癥、炎癥、神經(jīng)退行性疾病以及中樞神經(jīng)系統(tǒng)疾病的藥物研發(fā)計(jì)劃。在接受NBC新聞的采訪時(shí),該公司董事長(zhǎng)Ken Mulvany表示,他們所使用的計(jì)算機(jī)經(jīng)過訓(xùn)練以了解生物醫(yī)學(xué)語言,并能夠在人體之內(nèi)找到藥物、疾病以及蛋白質(zhì)之間存在的神秘關(guān)聯(lián)。
該公司的一項(xiàng)臨床實(shí)驗(yàn)?zāi)壳罢跍y(cè)試一種名為bavisant的失敗藥物對(duì)帕金森患者日間過度嗜睡癥狀的治療效果。在2012年利用bavisant對(duì)患有注意力缺陷多動(dòng)障礙的成年病人進(jìn)行臨床實(shí)驗(yàn)時(shí),雖然藥物最終未能起到應(yīng)有療效,但研究人員們發(fā)現(xiàn)其副作用之一正是失眠。該公司利用AI算法建模方式證實(shí)了該化合物對(duì)睡覺的潛在影響,而這也正是目前治療帕金森相關(guān)嗜睡癥狀臨床實(shí)驗(yàn)的契機(jī)。
BenevolentAI公司還利用其它AI計(jì)算機(jī)算法為肌萎縮側(cè)索硬化(簡(jiǎn)稱ALS)探索新的治療方案選項(xiàng)——這是一種退行性神經(jīng)系統(tǒng)疾病。2016年,該公司在一周之內(nèi)確定了五種假造藥物。如果沒有人工智能技術(shù)的幫助,這一過程可能需要數(shù)年時(shí)間才能完成。
前景與挑戰(zhàn)
當(dāng)然,并不是所有人都相信人工智能技術(shù)會(huì)改變藥物的開發(fā)前景。
哈佛大學(xué)化學(xué)家Alan Aspuru-Guzik博士曾經(jīng)開發(fā)出面向材料科學(xué)的人工智能應(yīng)用,而目前其正轉(zhuǎn)向藥物研發(fā)領(lǐng)域。在他看來,這一領(lǐng)域確實(shí)充斥著大量炒作氣息。盡管如此,他認(rèn)為“脾氣暴躁”的反對(duì)者們顯然忽略了他在這方面付出的努力,而真正的從業(yè)者也不會(huì)受到影響。他表示,“在不同領(lǐng)域之間的邊界位置,總會(huì)出現(xiàn)眾多令人興奮的新生事物,而摩擦也將同樣不可避免。”
目前的一大主要挑戰(zhàn),在于如何收集充足且可靠的信息來正確訓(xùn)練沃森以及其它人工智能系統(tǒng)。Aspuru-Guzik指出,“人工智能的實(shí)際質(zhì)量取決于數(shù)據(jù)質(zhì)量。”
基于他自己設(shè)計(jì)的、用于工業(yè)類分子應(yīng)用的人工智能策略,他解釋了應(yīng)如何立足藥物研發(fā)領(lǐng)域?qū)τ?jì)算機(jī)進(jìn)行更好地訓(xùn)練。首先,他將數(shù)十萬種類似藥物的分子信息輸入到AI算法當(dāng)中,以幫助其學(xué)習(xí)各類分子間的共通性特征。最終,計(jì)算機(jī)將變得足夠聰明,從而自行預(yù)測(cè)新藥的結(jié)構(gòu)表達(dá)。
他指出,“沒錯(cuò),人工智能會(huì)無數(shù)次預(yù)測(cè)出垃圾結(jié)果。”然而,科學(xué)家們可以設(shè)計(jì)出對(duì)應(yīng)方法以排除那些無用的預(yù)測(cè),并獎(jiǎng)勵(lì)好的預(yù)測(cè)結(jié)果,從而訓(xùn)練計(jì)算機(jī)并不斷提升其準(zhǔn)確性水平。
目前受到廣泛關(guān)注的生成對(duì)抗網(wǎng)絡(luò)(簡(jiǎn)稱GAN)方法就是在兩套人工智能網(wǎng)絡(luò)之間建立一種競(jìng)爭(zhēng)機(jī)制。其中的發(fā)生器網(wǎng)絡(luò)負(fù)責(zé)猜測(cè)藥物分子,而鑒別器網(wǎng)絡(luò)則對(duì)每一項(xiàng)猜測(cè)結(jié)果作出對(duì)錯(cuò)判斷。Aspuru-Guzik表示,“剛開始,這兩套網(wǎng)絡(luò)都愚蠢得不忍直視。但隨著時(shí)間的推移,兩套網(wǎng)絡(luò)會(huì)相互學(xué)習(xí)并同時(shí)變得更加聰明。”
當(dāng)然,計(jì)算機(jī)仍然會(huì)被人類所愚弄,這一點(diǎn)相信對(duì)于GPS導(dǎo)入死路或者因臨時(shí)封道而無法前進(jìn)的用戶們可謂深有體會(huì)。在Aspuru-Guzik看來,人工智能會(huì)提升人類的能力,但絕不會(huì)取而代之。他總結(jié)稱,“人工智能會(huì)給我們帶來新的超能力,但最終仍將由人類對(duì)其進(jìn)行控制與使用。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。