深度神經(jīng)網(wǎng)絡(luò)已經(jīng)掌握了解決各種問題的方法——從識別、推理圖像中的物體,到成為“圍棋上帝”。隨著這些任務(wù)變得越來越復雜,神經(jīng)網(wǎng)絡(luò)摸索出來的解決方法也變得越來越繁瑣。
因為這個系統(tǒng)太復雜了,即使是設(shè)計該系統(tǒng)的工程師可能也無法分析出它發(fā)出某一指令的原因。當然,你也不能強求這個神經(jīng)網(wǎng)絡(luò)能夠給出它下達每一個指令的原因:目前為止還沒有一套能夠讓 AI 自己解釋自己行為的系統(tǒng)。
實際上,這就是人工智能領(lǐng)域著名的“黑盒子”問題,隨著神經(jīng)網(wǎng)絡(luò)在現(xiàn)實世界中的應(yīng)用越來越廣泛,對這一問題的研究也開始變得無比重要。對此,《麻省理工科技評論》曾以“人工智能核心地帶的黑暗秘密”為題刊發(fā)專題文章,來深入探討神經(jīng)網(wǎng)絡(luò)的不可解釋性問題。
圖丨《麻省理工科技評論》關(guān)于人工智能的“黑盒子”問題的封面文章
作為人工智能研究領(lǐng)域的先鋒,DeepMind對“黑盒子”問題也在持續(xù)關(guān)注——目前,該團隊正著手開發(fā)更多的工具,用于解釋人工智能系統(tǒng)。6 月 26 日,在最新發(fā)布的一篇論文中,DeepMind提出了一種基于認知心理學來研究深度神經(jīng)網(wǎng)絡(luò)的新方法。
那么,什么是認知心理學?一般而言,該學科通過評估行為來推測認知機制,并涵蓋了大量與認知機制相關(guān)的細節(jié),同時還設(shè)計了很多實驗來證明這些機制。隨著神經(jīng)網(wǎng)絡(luò)在解決某些具體問題上的能力已經(jīng)達到或超越人類水平,認知心理學的研究方法將與人工智能的黑盒子問題愈發(fā)相關(guān)。
為了證明這一點,DeepMind設(shè)計了一個實驗來解釋人類認知,從而幫助人類進一步了解深度神經(jīng)網(wǎng)絡(luò)是如何解決圖像分類問題。
實驗結(jié)果顯示,認知心理學家觀察到的人類行為,在深度網(wǎng)絡(luò)中也有類似的體現(xiàn)。總體上說,實驗的成功也證明,認知心理學完全可以用來幫助人們更好地理解深度學習系統(tǒng)。
在 DeepMind 的案例研究中,甚至考慮到了孩子們是如何辨識物體的,這是認知心理學的一大研究領(lǐng)域。
通常而言,孩子們從單個例子中猜測詞語意思的能力,被稱為“單次語義學習”(one-shot word learning)——這種認知能力看起來非常自然,會讓人們覺得,這一過程其實沒什么太復雜的機制。
然而,美國著名哲學家威拉德·奧曼·奎因多年前設(shè)計的一個經(jīng)典思想實驗,卻向人們展示了這一過程到底有多復雜:
一個語言學家要去一個地方,但那里的語言和這個語言學家所使用的完全不一樣。于是,這位語言學家想找一位當?shù)厝藖韺W習一些本地語言中的詞匯。這時,正巧有一只兔子從他們身邊跑過,當?shù)厝嗣摽诙觥癵avagai”,于是語言學家就開始推測這個詞的意思。
圖丨“gavagai”到底指的是什么?
當然,這個詞可能表示很多意思,可以是“兔子”、“白色的東西”,甚至指兔子身上的某一部位。
那么,面對這么多的可能性,人類如何去選擇哪個正確的意思?
時至今日,我們在使用深度神經(jīng)網(wǎng)絡(luò)進行單次語義學習時也會遇到了同樣的問題,而 DeepMind 團隊所開發(fā)的名為“匹配網(wǎng)絡(luò)”(Matching Network)的新型神經(jīng)網(wǎng)絡(luò)模型或許可以解決這些問題。
實際上,匹配網(wǎng)絡(luò)憑借著在關(guān)注度和記憶方面的進步,完全可以做到僅憑一個案例就對ImageNet圖像識別數(shù)據(jù)庫中的海量數(shù)據(jù)進行分類篩選,而且表現(xiàn)絕對是無可爭辯的。
圖丨“匹配網(wǎng)絡(luò)”的結(jié)構(gòu)
為了闡明這一點,研究團隊參照了認知心理學家的研究結(jié)果——他們發(fā)現(xiàn),孩子們往往是通過歸納出偏好來消除許多錯誤推論,從而得出正確推論。這些典型的偏好包括:
整體偏好(whole object bias):孩子們會更傾向于認為一個詞指代的是整個物體,而不是它的組成部分(兔子未被關(guān)注的部分);
類別偏好(taxonomic bias):將一類物體歸于類別中的某一種物體(所有動物都可能被當做“兔子”);
形狀偏好(shape bias):孩子們往往會根據(jù)事物的形狀,而不是顏色或條紋來描述一個物體。(所有白色的東西都可能被歸類為“兔子”)。
在上面三種偏好中,DeepMind的研究團隊選擇了“形狀偏好”作為檢測神經(jīng)網(wǎng)絡(luò)的切入點,這是因為“形狀偏好”在人類偏好研究中占據(jù)了很大的比重。
圖丨從左至右:原物體、形狀匹配物體、顏色匹配物體
更為關(guān)鍵的是,在接下來的試驗中,DeepMind 研究團隊向深度神經(jīng)網(wǎng)絡(luò)展示三個物體的圖像——原物體、形狀匹配物體(形狀相似但顏色不同的參照物體)以及顏色匹配物體(顏色相似但形狀不同的參照物體)。同時,研究團隊記錄了原物體和形狀匹配物體被歸為一類的次數(shù),以及原物體和顏色匹配物體被歸到一類的次數(shù)。
在對上述歸類次數(shù)進行比對后,研究人員發(fā)現(xiàn),正如人類一樣,該網(wǎng)絡(luò)對形狀的感知有著超過對顏色和材質(zhì)的偏好——也就是說,神經(jīng)網(wǎng)絡(luò)也有著“形狀偏好”。
圖 | DeepMind在匹配網(wǎng)絡(luò)中進行的認知心理學實驗。A為形狀匹配物體,B為顏色匹配物體。由于匹配網(wǎng)絡(luò)對形狀的偏好,會傾向于將原物體于A相匹配。
然而,除了觀察到深度網(wǎng)絡(luò)的形狀偏好外,還有一些值得注意的結(jié)果:
首先,形狀偏好在對網(wǎng)絡(luò)訓練的早期就開始出現(xiàn)。這很容易令人聯(lián)想到了人類思維方式對于形狀的偏好。心理學家表示,兒童所展示的形狀偏好比青少年要少,而成年人的形狀偏好最為明顯;
其次,取決于不同的組合和訓練模式,深度網(wǎng)絡(luò)對形狀偏好的程度也不一樣。所以當研究團隊對深度學習系統(tǒng)進行測試時,必須使用大量的訓練模型來得到可靠的結(jié)果,就像心理學家對不同對象的測試一樣;
最后,即使形狀偏好程度不同,每個網(wǎng)絡(luò)在同種單次語義學習測試上的表現(xiàn)是一樣的。這說明不同的網(wǎng)絡(luò)可以針對同一個復雜問題找到同樣有效的解決辦法。
總之,DeepMind團隊認為,此次實驗的重大成功就在于證明了認知心理學在解釋和推測神經(jīng)網(wǎng)絡(luò)行為方面的潛力。而由于人類在認知心理學研究領(lǐng)域具備豐富的知識儲備,這將為解決人工智能“黑盒子”問題提供全新的思路,讓人類更深刻的理解深度神經(jīng)網(wǎng)絡(luò)的行為。
(審核編輯: 林靜)
分享