因?yàn)閷ι窠?jīng)網(wǎng)絡(luò)深層功能的理解,不僅有助于我們了解其決策機(jī)制,同時我們構(gòu)建更為強(qiáng)大的人工智能系統(tǒng)也至關(guān)重要。
中,也解釋了他們?nèi)绾瓮ㄟ^逐一刪除單個神經(jīng)元的方式去理解和判斷神經(jīng)網(wǎng)絡(luò)的性能。他們認(rèn)為,理解神經(jīng)科學(xué)與深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)之間關(guān)聯(lián)性的重要方法之一,正是調(diào)查個體神經(jīng)元的作用,特別是那些易于解釋的神經(jīng)元。
研究人員開發(fā)了專門的圖像分類模型,然后逐一刪除其中幾個神經(jīng)元,從而測量每個刪除對模型結(jié)果的影響。
據(jù)DeepMind稱,他們的發(fā)現(xiàn)產(chǎn)生了兩個結(jié)果:
研究人員廣泛分析了只能對單一輸入圖像類別作出響應(yīng),且易于解釋的神經(jīng)元(即“選擇性”神經(jīng)元)。他們發(fā)現(xiàn),在深度學(xué)習(xí)當(dāng)中,此類神經(jīng)元包括了"貓神經(jīng)元"、情緒神經(jīng)元以及概括神經(jīng)元; 而在神經(jīng)科學(xué)領(lǐng)域,此類神經(jīng)元則包括Jennifer Aniston神經(jīng)元等。然而,這些僅占少數(shù)比例的高選擇性神經(jīng)元在重要性上到底與其它低選擇性、更令人費(fèi)解且難以解釋的神經(jīng)元有何區(qū)別,目前還不得而知。
具有清晰響應(yīng)模式的神經(jīng)元(例如對貓的圖像活躍,但對其它圖像皆不敏感的神經(jīng)元)比綜合性的神經(jīng)元(即能夠?qū)Ω黝愲S機(jī)圖像集發(fā)生反應(yīng)的神經(jīng)元)更易于解釋
而為了評估神經(jīng)元的重要性,研究人員在測試當(dāng)中移除了部分神經(jīng)元,從而觀察網(wǎng)絡(luò)的分類任務(wù)處理效能所發(fā)生的變化。如果其中某個神經(jīng)元非常重要,那么將其移除就會產(chǎn)生極大的破壞性,并顯著降低網(wǎng)絡(luò)效能。相反,如果移除的神經(jīng)元并不太重要,那么就不會造成什么影響。
神經(jīng)元缺失對簡單神經(jīng)網(wǎng)絡(luò)所造成影響的概念示意圖。較深的神經(jīng)元往往更為活躍。嘗試點(diǎn)擊隱藏層神經(jīng)元并將其移除,觀察輸出神經(jīng)元的活動所發(fā)生的改變。需要注意的是,移除一個或兩個神經(jīng)元對輸出結(jié)果的影響很小,而移除大部分神經(jīng)元則會產(chǎn)生顯著的影響,并且其中一部分神經(jīng)元確實(shí)比其它神經(jīng)元更為重要!
這一發(fā)現(xiàn)與最近在神經(jīng)科學(xué)方面的研究進(jìn)展相互印證,目前科學(xué)家們已經(jīng)證明那些作用不明的神經(jīng)元實(shí)際上能夠提供豐富的信息。這意味著我們必須邁過易解釋神經(jīng)元這道難關(guān),才有可能真正搞清楚深層神經(jīng)網(wǎng)絡(luò)的運(yùn)作機(jī)制。
雖然"貓神經(jīng)元"可能更易于解釋,但其重要性并不比綜合性且不具備明確偏好的神經(jīng)元更高??梢渣c(diǎn)擊圖中標(biāo)記,看看重要性與解釋性之間到底存在著怎樣復(fù)雜的關(guān)系
因此,研究人員的結(jié)論是,盡管可解釋神經(jīng)元在直覺上更易于理解(比如"它喜歡狗"),但其重要性并不一定會比缺少明顯偏好的綜合性神經(jīng)元更高。
推廣能力更強(qiáng)的網(wǎng)絡(luò)也具有更大的彈性
舉例來說,如果一套圖像分類網(wǎng)絡(luò)只能對以前見過的特定小狗圖片進(jìn)行分類,卻無法對新的小狗圖像完成識別,就可以說是不具備智能。Google Brain、伯克利以及DeepMind最近在ICLR 2017上獲得最佳論文獎項(xiàng)的合作論文就提到,深層網(wǎng)絡(luò)能夠簡單記住其訓(xùn)練當(dāng)中所見到的每一幅圖像,這代表著其學(xué)習(xí)方式與人類仍然存在巨大差異。
然而,目前我們往往很難判斷一套神經(jīng)網(wǎng)絡(luò)是否已經(jīng)學(xué)會了足以推廣到新場景應(yīng)用的能力。為此,通過逐漸移除越來越大的神經(jīng)元組,研究人員發(fā)現(xiàn)相對于簡單記憶以往在訓(xùn)練期間見到過的網(wǎng)絡(luò),適應(yīng)性更強(qiáng)的網(wǎng)絡(luò)對神經(jīng)元缺失擁有更好的彈性表現(xiàn)。換句話說,適應(yīng)性較強(qiáng)的網(wǎng)絡(luò)更難被破壞(當(dāng)然,如果神經(jīng)元移除至一定程度,其仍然會遭到破壞)。
隨著越來越多的神經(jīng)元被移除,具有廣泛適應(yīng)性的網(wǎng)絡(luò)在效能下降速度方面遠(yuǎn)低于記憶性網(wǎng)絡(luò)
通過這種網(wǎng)絡(luò)穩(wěn)健性衡量方式,科學(xué)家將能夠評估是否能夠通過為一套網(wǎng)絡(luò)提供不符合要求的記憶而對其進(jìn)行"欺騙"。此外,了解網(wǎng)絡(luò)在記憶過程當(dāng)中的變化也將有助于我們構(gòu)建新的網(wǎng)絡(luò),從而保證更少地依賴記憶、更多地建立概括能力。
總而言之,這些發(fā)現(xiàn)確實(shí)能夠被用于理解神經(jīng)網(wǎng)絡(luò)的力量。通過這些方法,我們發(fā)現(xiàn)高選擇性神經(jīng)元在重要性上并不強(qiáng)于非選擇性神經(jīng)元,而適應(yīng)性更高的網(wǎng)絡(luò)對單一神經(jīng)元的依賴性也要低于單純記憶型網(wǎng)絡(luò)。這些結(jié)果意味著,單一神經(jīng)元的重要性并不像人們想象中的那么高。
好文章,需要你的鼓勵
這項(xiàng)研究提出了"高效探測"方法,解決了掩碼圖像建模AI難以有效評估的問題。通過創(chuàng)新的多查詢交叉注意力機(jī)制,該方法在減少90%參數(shù)的同時實(shí)現(xiàn)10倍速度提升,在七個基準(zhǔn)測試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質(zhì)量與分類性能的強(qiáng)相關(guān)性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應(yīng)性。團(tuán)隊(duì)承諾開源全部代碼,推動技術(shù)普及應(yīng)用。
伊利諾伊大學(xué)研究團(tuán)隊(duì)開發(fā)了CLAIMSPECT系統(tǒng),通過層次化分解復(fù)雜爭議、智能檢索相關(guān)文獻(xiàn)、多角度收集觀點(diǎn)的方法,將傳統(tǒng)的"真假"判斷轉(zhuǎn)變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動構(gòu)建爭議話題的分析框架,識別不同觀點(diǎn)及其支撐證據(jù),為科學(xué)和政治爭議提供更全面客觀的分析,已在生物醫(yī)學(xué)和國際關(guān)系領(lǐng)域驗(yàn)證有效性。
清華大學(xué)研究團(tuán)隊(duì)首次提出情感認(rèn)知融合網(wǎng)絡(luò)(ECFN),讓AI能像人類一樣理解和表達(dá)情感。該系統(tǒng)通過多層次情感處理架構(gòu),在情感識別準(zhǔn)確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達(dá)自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實(shí)現(xiàn)了跨模態(tài)情感融合、動態(tài)情感追蹤和個性化情感建模,為醫(yī)療、教育、客服等領(lǐng)域帶來革命性應(yīng)用前景。
哈佛大學(xué)研究團(tuán)隊(duì)通過創(chuàng)新的多智能體強(qiáng)化學(xué)習(xí)方法,讓AI在戰(zhàn)略游戲中學(xué)會復(fù)雜推理。研究發(fā)現(xiàn)AI通過游戲競爭能發(fā)展出類人思維能力,在邏輯推理、創(chuàng)造性解決問題等方面表現(xiàn)顯著提升。這項(xiàng)突破性成果為未來AI在醫(yī)療、教育、城市管理等領(lǐng)域的應(yīng)用奠定基礎(chǔ),展現(xiàn)了通過模擬人類學(xué)習(xí)過程培養(yǎng)真正智能AI的新路徑。