制造行業(yè)可能是世界唯一一個(gè)從基本創(chuàng)意到市場(chǎng)推廣,整個(gè)周期需要耗費(fèi)大約十年、總投入達(dá)數(shù)十億美元、且失敗機(jī)率高達(dá)90%的高風(fēng)險(xiǎn)領(lǐng)域。這一切顯然與IT業(yè)務(wù)截然不同——在IT領(lǐng)域,雖然偏執(zhí)狂們更加搏人眼球,但真正負(fù)責(zé)任的高管能夠規(guī)劃更多長(zhǎng)遠(yuǎn)目標(biāo)、并一步步引導(dǎo)業(yè)務(wù)前行。因此,當(dāng)深度學(xué)習(xí)支持下的人工智能革命在2013年-2014年期間攜一大批輝煌成果席卷而來(lái)時(shí),制藥業(yè)的高管們開(kāi)始快速關(guān)注,但卻沒(méi)有立即加入這股潮流。
不少制藥企業(yè)確實(shí)開(kāi)始在內(nèi)部數(shù)據(jù)科學(xué)研發(fā)方面投入大量資金,但由于缺乏統(tǒng)籌協(xié)調(diào)的戰(zhàn)略指導(dǎo),這些工作更像是單一部門(mén)之內(nèi)由數(shù)據(jù)科學(xué)、數(shù)字化、AI等技術(shù)人員推動(dòng)的品牌重塑活動(dòng)。
而且雖然部分制藥企業(yè)已經(jīng)開(kāi)始投資AI企業(yè),但目前為止還沒(méi)有出現(xiàn)任何大規(guī)模的收購(gòu)。與AI初創(chuàng)企業(yè)的大部分討論,以“讓我們看看你的第三階段臨床資產(chǎn),證明你們?cè)趺丛谄渲写_定目標(biāo)并使用AI技術(shù)生成分子”,或者“你們跟其他AI初創(chuàng)企業(yè)有什么區(qū)別”作為開(kāi)端。很明顯,負(fù)責(zé)這方面工作的數(shù)據(jù)科學(xué)戰(zhàn)略負(fù)責(zé)人才剛剛上崗,對(duì)市場(chǎng)的當(dāng)前形勢(shì)并不怎么了解。
但也有一些制藥企業(yè),設(shè)法在藥物發(fā)現(xiàn)與開(kāi)發(fā)等各個(gè)環(huán)節(jié)中,帶來(lái)了令人印象深刻的AI應(yīng)用結(jié)果。以阿斯利康為例,該公司從2018年開(kāi)始發(fā)表合成化學(xué)文章,并在2019年拿出了幾篇真正受到社區(qū)關(guān)注的重量級(jí)論文。其他幾家制藥企業(yè)同樣建立起不錯(cuò)的內(nèi)部探索成果——禮來(lái)公司與某家初創(chuàng)企業(yè)合作,打造出令人過(guò)目難忘的AI驅(qū)動(dòng)型機(jī)器人實(shí)驗(yàn)室。
但時(shí)至今日,還沒(méi)有哪家主要制藥企業(yè)能夠在AI研究以及臨床開(kāi)發(fā)層面拿出基于大數(shù)據(jù)的全面概述與成果比較。今年6月15日,論文《成長(zhǎng)為數(shù)字化制藥企業(yè)的優(yōu)勢(shì)(The upside of being a digital pharma player)》在知名行業(yè)期刊《今日藥物發(fā)現(xiàn)》上發(fā)表。筆者收到了Google Scholar發(fā)來(lái)的相關(guān)通知,因?yàn)槠渲幸昧宋覀兊膸灼撐?。我本?lái)打算草草瀏覽一下就算了,但在讀到作者名單部分的時(shí)候,我看到了一大群學(xué)識(shí)淵博的學(xué)者、行業(yè)領(lǐng)袖與顧問(wèn):羅伊特林根大學(xué)的Alexander Schuhmacher、索尼公司的Alexander Gatto、諾華公司的Markus Hinder、普華永道的Michael Kuss以及圣加侖大學(xué)的Oliver Gassmann等等。在認(rèn)真閱讀之后,我發(fā)現(xiàn)這不是那種灌水的綜述性論文,而是一項(xiàng)真正全面的研究,對(duì)各制藥企業(yè)在研發(fā)層面的AI嘗試進(jìn)行了一番正面對(duì)比。
此項(xiàng)研究通過(guò)內(nèi)部AI研發(fā)項(xiàng)目、與AI初創(chuàng)企業(yè)間的合作伙伴關(guān)系、對(duì)AI初創(chuàng)企業(yè)的投資以及各研發(fā)聯(lián)盟/財(cái)團(tuán)之間的評(píng)估,對(duì)各家制藥公司的AI探索情況做出比較。此外,文章還比較了各制藥企業(yè)從2014年-2019年間,在科學(xué)出版物上發(fā)表的AI相關(guān)論文數(shù)量。從下圖中可以看到,諾華在市場(chǎng)競(jìng)爭(zhēng)中占據(jù)著顯著優(yōu)勢(shì),阿斯利康的學(xué)術(shù)出版量也同樣一路領(lǐng)先。
▲ 圖:各大制藥巨頭企業(yè)2014-2018年AI相關(guān)活動(dòng)概述,摘自Schuhmacher等人在《今日藥物發(fā)現(xiàn)》上發(fā)表的《成長(zhǎng)為數(shù)字化制藥企業(yè)的優(yōu)勢(shì)》論文。
在這篇論文發(fā)表之前,根據(jù)業(yè)內(nèi)人士定期進(jìn)行的文獻(xiàn)回顧,阿斯利康的AI相關(guān)學(xué)術(shù)成果發(fā)表量遠(yuǎn)超任何其他制藥企業(yè)。單在2019年,阿斯利康的科學(xué)家們就發(fā)表了約1300篇科學(xué)論文。另外,拜耳也有多篇不錯(cuò)的論文。但制藥巨頭們的文章發(fā)表數(shù)量仍然嚴(yán)重不足,其中發(fā)表量最大的阿斯利康在所有細(xì)分領(lǐng)域的論文總量也只有65篇。作為參考,Insilico Medicine公司同期發(fā)表了約100篇論文與約30項(xiàng)專利,其中不包括AI會(huì)議論文。其他幾家初創(chuàng)企業(yè)在領(lǐng)域中也表現(xiàn)良好,共同為整個(gè)行業(yè)的發(fā)展做出貢獻(xiàn)。
▲ 圖:2014年-2019年期間,各大制藥企業(yè)在AI領(lǐng)域發(fā)表的科學(xué)論文數(shù)量,摘自Schuhmacher等人在《今日藥物發(fā)現(xiàn)》上發(fā)表的《成長(zhǎng)為數(shù)字化制藥企業(yè)的優(yōu)勢(shì)》論文。
筆者在自己的LinkedIn上發(fā)布了這項(xiàng)研究的截屏,轉(zhuǎn)瞬之間,來(lái)自制藥行業(yè)的同事們就給文章增加了20000次瀏覽量。令人驚訝的是,鮮有讀者給它點(diǎn)贊。我懷疑很多從業(yè)者對(duì)于制藥行業(yè)在長(zhǎng)久的探索之后,仍在AI領(lǐng)域處于起步階段而感到沮喪。研究表明,成長(zhǎng)為數(shù)字化制藥企業(yè)雖然優(yōu)勢(shì)多多,但目前還沒(méi)有幾家公司真正邁開(kāi)步伐。
此項(xiàng)研究的作者當(dāng)然是行業(yè)內(nèi)的制藥/AI研究與開(kāi)發(fā)專家,而他們做出的大量研究工作只針對(duì)行業(yè)內(nèi)三個(gè)相對(duì)簡(jiǎn)單的數(shù)據(jù),更可怕的是,在此之前甚至不存在類似的研究。
為了解這項(xiàng)研究的更多詳細(xì)信息,我寫(xiě)信給作者們,向他們?cè)儐?wèn)了關(guān)于此項(xiàng)研究及其對(duì)制藥行業(yè)未來(lái)前景的影響等問(wèn)題:
Gassmann: 確實(shí),這是一項(xiàng)艱巨的任務(wù)。雖然專利與科學(xué)出版物中都有不少公開(kāi)可用的內(nèi)容,但總體來(lái)講,最有價(jià)值的還是對(duì)制藥業(yè)高管的采訪。采訪的過(guò)程不怎么耗時(shí),但為了讓對(duì)方接受采訪,我們這幫人大概在業(yè)內(nèi)打拼了二十多年。
Gatto: 另外,獲得成功的另一項(xiàng)關(guān)鍵因素,在于幾位作者擁有豐富的跨學(xué)科教育背景,包括藥學(xué)策略、研發(fā)與AI能力等。
Kuss: 倒是沒(méi)什么可驚訝的。真正需要注意的是,整個(gè)行業(yè)似乎難以找到將AI技術(shù)引入藥物研發(fā)體系的初步成熟方法。
Schuhmacher: AI應(yīng)用程序的成本越來(lái)越低,再配合速度更快且更廉價(jià)的硬件,整個(gè)制藥研發(fā)領(lǐng)域都將踏上數(shù)字化轉(zhuǎn)型的道路。技術(shù)普及終歸要由需求驅(qū)動(dòng),行業(yè)對(duì)于研發(fā)效率的追求,終將令A(yù)I技術(shù)在制藥行業(yè)中獲得全面成功。
Gatto: 我們已經(jīng)確定了幾種場(chǎng)景,其中AI技術(shù)有望取代實(shí)際實(shí)驗(yàn)或者表現(xiàn)出超越人類的潛力。最重要的就是最近發(fā)表在《自然:生物技術(shù)》雜志上的“從零開(kāi)始設(shè)計(jì)小分子”的文章,其中強(qiáng)調(diào)了人工智能在藥物發(fā)現(xiàn)中的無(wú)窮可能性。
Schuhmacher: 我們還沒(méi)有收到什么直接反饋,畢竟論文才剛剛發(fā)表不久??傮w來(lái)講,我們注意到,制藥企業(yè)的研發(fā)主管開(kāi)始對(duì)我們近期在「虛擬制藥研發(fā)」方面的工作表現(xiàn)出興趣。
Gassmann: 另外,我們還觀察到,制藥行業(yè)正沿著「醫(yī)療保健的數(shù)字化」方向緩慢發(fā)展。十年前,相當(dāng)一部分制藥企業(yè)的經(jīng)理還無(wú)法相信,基于數(shù)據(jù)的公司能夠在醫(yī)療保健價(jià)值鏈中占據(jù)相當(dāng)?shù)谋壤5缃瘢?strong>軟件已經(jīng)吞噬整個(gè)世界,數(shù)據(jù)改變了制藥行業(yè),這些都成為不爭(zhēng)的事實(shí)。
Schuhmacher: 看起來(lái),仍有不少領(lǐng)先制藥企業(yè)沒(méi)有把AI技術(shù)視為核心戰(zhàn)略的組成部分。另外,他們?nèi)匀贿^(guò)度依賴于封閉式的創(chuàng)新模式:論文發(fā)表并不屬于其收入與研發(fā)模型中的固有環(huán)節(jié)。但這一切可能發(fā)生改變:制藥企業(yè)需要吸引更多數(shù)據(jù)科學(xué)家與其他技術(shù)專家,并通過(guò)學(xué)術(shù)成果數(shù)量,表現(xiàn)自身卓越的技術(shù)能力與競(jìng)爭(zhēng)優(yōu)勢(shì)。
Gatto: 單從AI相關(guān)專利的數(shù)量來(lái)看,制藥企業(yè)確實(shí)無(wú)法與谷歌等IT巨頭相提并論。但是,隨著時(shí)間的推移,制藥企業(yè)可能會(huì)轉(zhuǎn)變自身研發(fā)模式以及對(duì)AI相關(guān)知識(shí)產(chǎn)權(quán)的運(yùn)用方式,屆時(shí)情況可能出現(xiàn)巨大變化。
Gassmann: 對(duì)于制藥行業(yè)來(lái)說(shuō),一兩年時(shí)間實(shí)在太短了,但AI技術(shù)本身一定會(huì)繼續(xù)發(fā)展。蘋(píng)果等消費(fèi)電子產(chǎn)品公司,以及谷歌等數(shù)據(jù)業(yè)務(wù)公司,已經(jīng)開(kāi)始在美國(guó)藥監(jiān)局注冊(cè)可穿戴設(shè)備。雖然目前這類設(shè)備的可靠性還很差,但相信其性能將快速提高。未來(lái)一兩年中,老年癡呆癥、糖尿病或者癌癥等慢性疾病,將成為數(shù)字化健康方案的理想切入點(diǎn)。由此收集到的垂直數(shù)據(jù)將提供巨大價(jià)值。與之對(duì)應(yīng),制藥企業(yè)需要重新考慮自身創(chuàng)新方式,并將創(chuàng)新手段與現(xiàn)有生態(tài)系統(tǒng)統(tǒng)一起來(lái)。
Kuss: 在我看來(lái),將「藥物研發(fā)」轉(zhuǎn)化為「眾包式生態(tài)系統(tǒng)」將成為制藥業(yè)未來(lái)成功的關(guān)鍵所在。到那時(shí),藥物研發(fā)不再局限于內(nèi)部?jī)r(jià)值創(chuàng)造,而是真正將來(lái)自內(nèi)部與外部的思維、技術(shù)(包括AI)以及資源整合成統(tǒng)一而強(qiáng)大的網(wǎng)絡(luò)。
Gassmann: 這項(xiàng)研究應(yīng)該只是個(gè)開(kāi)始。在未來(lái)幾年中,我們計(jì)劃建立一處關(guān)于藥物創(chuàng)新研究的合作中心,希望在人工智能及其他新興技術(shù)的背景之下,推動(dòng)行業(yè)對(duì)于藥物及生物技術(shù)研發(fā)管理的深刻理解。
Schuhmacher: AI技術(shù)必將對(duì)未來(lái)的研發(fā)模式以及制藥研發(fā)生態(tài)系統(tǒng)產(chǎn)生巨大影響。這一切,加上相關(guān)的戰(zhàn)略與技術(shù)變革,將成為我們未來(lái)幾個(gè)月研究議程中的重點(diǎn)內(nèi)容。
Kuss: 基于分布式分類賬技術(shù)的智能合約,也將在這場(chǎng)變革當(dāng)中發(fā)揮關(guān)鍵作用。
<附>:如需了解論文《成長(zhǎng)為數(shù)字化制藥企業(yè)的優(yōu)勢(shì)(The upside of being a digital pharma player)》,關(guān)注科技行者公眾號(hào)(ID:itechwalker)并回復(fù)關(guān)鍵詞“制藥”即可獲得。
好文章,需要你的鼓勵(lì)
浙江大學(xué)團(tuán)隊(duì)提出動(dòng)態(tài)專家搜索方法,讓AI能根據(jù)不同問(wèn)題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問(wèn)題偏愛(ài)不同專家配置,為AI推理優(yōu)化開(kāi)辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過(guò)"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問(wèn)題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競(jìng)賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長(zhǎng)度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開(kāi)發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過(guò)滾動(dòng)窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長(zhǎng)視頻生成中的錯(cuò)誤累積問(wèn)題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開(kāi)辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過(guò)讓AI模型學(xué)習(xí)解決幾何問(wèn)題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測(cè)試基準(zhǔn)上都帶來(lái)顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績(jī)。這項(xiàng)研究揭示了基礎(chǔ)幾何知識(shí)對(duì)培養(yǎng)AI空間智能的重要價(jià)值。