
科技行者 2月24日 北京消息:一大批計算機科學(xué)家正在追蹤新冠病毒的動向。這種被正式定名為“COVID-19”的新型冠狀病毒,可導(dǎo)致嚴(yán)重呼吸道疾病,重癥者可致死,該病毒最初于2019年12月在武漢爆發(fā),截至目前累計感染超過75000人,死亡人數(shù)以千計,盡管中國境內(nèi)的新增病例數(shù)量已經(jīng)開始下降,但人們普遍擔(dān)心這波疫情會在新加坡、日本、韓國、香港以及泰國引發(fā)新一輪動蕩。
來自波士頓東北大學(xué)(Northeastern University)計算機科學(xué)家Alessandro Vespignani已經(jīng)開發(fā)出一種針對“COVID-19”的預(yù)測模型,他的團隊打造出EpiRisk工具,用于評估感染者將疾病傳播到世界其他地區(qū)的可能性,此外,該工具還能跟蹤各國旅行禁令,核實政府管控是否有效。為阻止這波全球流行性疾病,Alessandro Vespignani介紹了計算機行業(yè)如何抵御疫情。
Alessandro Vespignani: 過去幾天,我們看到不少振奮人心的跡象,特別是中國境內(nèi)的新增病例在減少。
Alessandro Vespignani: 可以說沒有特別的重點,因為我們得采取一切必要措施。我們需要了解中國內(nèi)地的疾病傳播情況,以及干預(yù)措施效果;我們需要了解,其他地區(qū)是否出現(xiàn)了疫情蔓延的信號;我們需要了解,是否已經(jīng)有某些區(qū)域成為新的流行病中心。在這一階段,每個問題都很重要,沒有輕重緩急之分。
Alessandro Vespignani:EpiRisk工具建模方案的核心,在于利用一切可用的數(shù)據(jù)源。
目前,我們主要關(guān)注來自中國及其周邊國家的監(jiān)控數(shù)據(jù),當(dāng)然,社交媒體與新聞內(nèi)容也會被整理起來。
首先,我們會對這種流行病進行建模,實現(xiàn)態(tài)勢感知,特別是建立起對中國境外的疫情態(tài)勢感知體系——因為我們已經(jīng)基本掌握有多少人從中國疫情重災(zāi)區(qū)前往其他國家,所以配合目前國際上發(fā)現(xiàn)的COVID-19境外病例,就能基本推斷出其他地區(qū)的疫情規(guī)模。一般來說,這類預(yù)測通常只能由官方確認(rèn)并發(fā)布,但我們在掌握數(shù)據(jù)后往往能夠提前做出這些預(yù)測。
接下來,我們會利用模型研究出行限制等干預(yù)性措施會給疾病的實際傳播帶來哪些影響。在武漢及其周邊地區(qū),機場全面關(guān)閉、長途運輸叫停、學(xué)校停課。我們正努力了解這些措施能夠在中國本土帶來怎樣的疫情控制效果,同時分析中國境外出現(xiàn)新增病例的可能性。
▲ 圖為EpiRisk
Alessandro Vespignani:在我們這個領(lǐng)域中,工作內(nèi)容基本分為兩種:在不存在緊急狀況或者健康威脅地,進行正常研究——或者說和平時期研究;另外就是現(xiàn)在這種,我們可以稱其為「戰(zhàn)爭時期」。
遺憾的是,每當(dāng)發(fā)生“COVID-19”疫情這類突發(fā)情況時,我們只能利用有限的數(shù)據(jù)配合一系列假設(shè),對不斷變化的形勢做出有限的預(yù)測。有時候,新的消息一到,我們就得把前一天整理出的所有結(jié)果全部推翻。很忙,確實很忙。
但在這場戰(zhàn)爭中,真正沖鋒陷陣的是那些前線醫(yī)生、護士以及公共衛(wèi)生人員,他們才是承擔(dān)起風(fēng)險的群體。作為計算機科學(xué)家與計算流行病學(xué)家,我們的工作為他們提供情報,幫助他們找出敵人的行動規(guī)律。
Alessandro Vespignani:我們經(jīng)常跟其他研究團隊以及機構(gòu)進行全球電話會議,我在電話會議里見過的團隊至少有80到100個。這些團隊帶來各種專業(yè)知識,有些團隊負(fù)責(zé)進行系統(tǒng)發(fā)育分析與遷移建模,有些人主要關(guān)注預(yù)測、即時預(yù)報以及長期投影分析等等。與以往的流行病應(yīng)對情況相比,如今各類科學(xué)團隊與機構(gòu)之間的協(xié)作與溝通水平,明顯上了臺階。
Alessandro Vespignani:我覺得沒必要。這有點像天氣預(yù)報或者自然災(zāi)害預(yù)報。如果所有模型都指向同一個大體方向,而且結(jié)果基本保持統(tǒng)一,那么結(jié)果就是可信的。疾病建模也是如此,畢竟沒有哪兩套模型會完全相同。每個人都會使用不同的人口統(tǒng)計數(shù)據(jù),對于某些年齡段的相對易感性采取不同的假設(shè)。如果非要把這么多不同的模型整合起來,肯定會帶來新的問題——有新問題,就有與之對應(yīng)的處理需求,這會讓問題變得更復(fù)雜。
Alessandro Vespignani:例如,美國的疾控中心(美國疾病控制與預(yù)防中心)幾年前曾建立“FluSight”項目,通過引入建模研究團隊,協(xié)助預(yù)測季節(jié)性流感。這類項目最終建立起一個社區(qū)體系,并以為樞紐打通各機構(gòu)之間的聯(lián)系通道。世界各地的其他機構(gòu)也參與到類似的體系中來,希望將原本分散的力量統(tǒng)一,為防疫抗疫提供輔助。
Alessandro Vespignani:肯定可以,項目中也包含諸如計算與算法開發(fā)之類的工作,既然不了解什么是計算流行病學(xué),普通的計算機科學(xué)家也完全能夠很好地解決這些任務(wù)。另外,如果大家有意參與其中,首先應(yīng)該與已經(jīng)在傳染病建模領(lǐng)域具備一定經(jīng)驗的老手們合作,這樣可以盡量規(guī)避最初接觸時的種種常見錯誤,盡快投身到對抗疫情的核心工作當(dāng)中。
好文章,需要你的鼓勵
浙江大學(xué)團隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團隊提出SIRI方法,通過"壓縮-擴張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實驗顯示,該方法在數(shù)學(xué)競賽題上將模型準(zhǔn)確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團隊開發(fā)出Rolling Forcing技術(shù),實現(xiàn)AI視頻實時流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓(xùn)練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團隊發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強化學(xué)習(xí)方法訓(xùn)練多個AI模型。實驗結(jié)果顯示,幾何訓(xùn)練在四個空間智能測試基準(zhǔn)上都帶來顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績。這項研究揭示了基礎(chǔ)幾何知識對培養(yǎng)AI空間智能的重要價值。