sponsored links

佐治亞理工學院發文:不要迷信可解釋性,小心被誤導



編譯 | 王曄

校對 | 琰琰

可解釋性對人工智慧發展來說至關重要,但在可解釋系統的可信度方面,理解其可能帶來的負面效應亦同等重要。

近日,佐治亞理工學院研究團隊發表最新研究,重點討論了可解釋人工智慧系統(XAI)中一種重要卻未被闡明的負面效應



論文地址:https://arxiv.org/pdf/2109.12480.pdf在這篇論文中,作者提出“可解釋性陷阱(EPs)”的概念,指出即使設計者最初沒有操控使用者的意圖,模型的可解釋性也可能帶來意料之外的負面影響,它不同於具有刻意欺騙性質的黑暗模式(DPs),但又與之相關。本文透過一項案例研究具體闡述了Eps概念,並證實解釋的負面影響不可避免,最後作者進一步從研究、設計和組織三個層面提出了具體的應對策略。

1

可解釋性的“兩面性”

發展可解釋、可信的新一代人工智慧越來越重要,因為人工智慧已被廣泛應用於醫療保健、金融、刑事司法等高風險決策領域。為了提高人工智慧的安全性,我們需要開啟AI內部運作的黑匣子,為使用者提供可理解的解釋。

目前關於可解釋AI(XAI)的研究已經取得了令人稱讚的進展,但最新研究發現,這些解釋所帶來的的影響不一定是積極的,也可能在下游任務中產生消極影響。例如設模型計者故意製造不合理的解釋,讓人們對人工智慧系統產生信任,從而隱瞞其可能帶來的風險。更重要的是,儘管模型設計的最初意圖是好的,這種負面影響似乎也不可避免。

在這種情況下,我們要如何區分有意和無意的負面解釋?又如何將有意的負面效應概念化?



作者引入“可解釋性陷阱(Explainability pitfalls ,EPs)”的概念,指出人工智慧解釋可能會誤導使用者在不知情、無防備的情況下做出符合第三方利益的決策。使用者對人工智慧的信任,能力的高估,以及對某些解釋的過度依賴,是他們在無意識中被“可解釋性”操控的主要原因。

EPs和DPs之間的最大區別在於“意圖”不同——DPs存在故意欺騙的性質,不考慮到使用者的利益。但EPs透過故意設定“陷阱(pitfalls)”也可以變成黑暗模式。

EPs的概念並不是純粹的理論推導後的結果,而是在大量實際工作和經驗的基礎上提出的。這項工作展示了儘管沒有欺騙的意圖,但在人工智慧解釋的確會出現意料之外的負面影響.

本文不是一篇關於EPs的全面論述,而是在現有概念和實踐上邁出了基礎性的一步。作者表示,提出可解釋性陷阱的概念,是為了讓人們認識到未曾發掘的知識盲點(圍繞人工智慧解釋的負面影響),並以此擴大XAI系統的設計空間。

2

多智慧的“解釋陷阱”

在這項研究中,作者調查了兩個不同的群體——有人工智慧背景和沒有人工智慧背景的人,他們如何看待不同型別的人工智慧解釋。以下是使用者對AI生成的三種解釋的看法:

(1)有正當理由的自然語言(2)沒有正當理由的自然語言(3)為智慧體行為提供無語境下的數字

在這項研究中,參與者觀看了三個智慧體在連續決策環境中的導航影片,並提供了定性和定量的感知資訊——在一個滿是滾動的巨石和流動的熔岩的環境中,為被困的探險者取回必須供應的食物。

智慧體透過簡單地輸出當前狀態的數字Q值執行 "思考"過程(如圖1)。Q值代表智慧體對每個行動的信任程度(不包含 "為什麼"可信),參與者事前沒有被告知這些Q值的意義,所以他們不知道哪些數值對應哪些行動。



圖1:顯示了智慧體在任務環境中導航

實驗發現,兩類參與者都對數字盲目信任,但信任的程度和原因不同。作者採用"認知啟發"的概念,試圖理解背後的原因。他們發現,

對於有人工智慧背景的參與者來說,僅僅是出現的數字就能引發啟發式思考。他們不完全理解智慧體決策背後的邏輯,但也會將數學表示法與邏輯演算法的思維過程聯絡起來。有意思的是,他們還把最聰明的AI投給了“行為最奇怪”的智慧體,這說明,他們不僅過度重視數字結果,而且將“含義不明”的數字視為潛在的可操作性。這裡的"可操作性"指的是在判斷或預測未來行為方面,人們可以用這些資訊做什麼。

那麼,智慧體在實際場景中的可操作性到底如何?正如之前所強調的,Q值不能表明決策背後的 "原因"。除了評估現有行動的質量,這些數字並沒有太多可操作性。也就是說,參與者對智慧體產生了過度信任和錯位評估。

對於沒有人工智慧背景的參與者來說,即使無法理解複雜的數字也會引發啟發式推理,在他們看來,智慧體就一定是智慧的,這些數字代表了智慧體“神秘而不可理解”的獨特語言。需要說明的是,這種推理方式與之前有人工智慧背景的人的推理過程不同,他們假設了未來的可操作性(儘管目前缺乏可理解性)。

如我們所看到的,沒有標記的、無法理解的數字反而增加了兩類群體對智慧體的信任和評估。這項案例研究表明,即使沒有欺騙的意圖,EPs也會出現未曾預料到的結果,並誤導參與者對數字生成過度依賴。

需要強調的是,本次案例假設Q值的“本意”是好的,如果這些數字被操縱了,一些人利用這些隱患惡意設計黑暗模式,鑑於案例中使用者對數字的啟發式信任,這將會誤導更多人對系統產生過度信任和不正確認知。

3

有何規避策略?

總結來看,可解釋性陷阱(EPs)有兩個特性,一是它僅是存在,但並不一定會對下游產生危害;二是現有知識不能預測給定的一個人工智慧解釋何時、如何以及為何會引發意料之外的負面下游效應。

基於以上兩點,作者認為雖然我們不太可能完全消除解釋的負面效應,但需要意識到“陷阱”的存在,瞭解它們何時容易出現,又是如何運作的,並制定相應的措施,做到防微杜漸。文中作者從研究、設計和組織三個相互關聯的層面提出了幾點策略:

在研究層面,開展更多以人為本的情境和經驗性研究,以獲得不同解釋對不同利益相關者在多維度下的精細理解。這是因為當下遊效應(如使用者對人工智慧解釋的看法)表現出來時,陷阱就會表顯露並被識別。如上述案例,具有不同人工智慧背景的使用者引發了同樣的陷阱(即,對數字過度信任),但卻有不同的啟發模式。

其實,基於這則案例,我們還可以從使用者知識背景和理解分歧兩個維度進一步探討:使用者的組合特徵(如教育背景和專業背景)如何影響 EPs的易感性?不同的啟發式方法如何發現不利影響?不同的使用者如何適應意料之外的解釋?在這些探索中,具備陷阱意識可以幫助我們提高洞察力,發現人們對人工智慧解釋的反應是如何與設計者的意圖相背離的。

在設計層面上,一個有效的策略是強化使用者在解釋過程中的反思(而不是一味地接受)。最近以人為本的XAI工作也主張將透過反思來促進信任的方法概念化。Langer等人指出,如果我們不對解釋進行有意識的和慎重的思考,就會增加掉進“陷阱”的可能。為了引發人們的注意,Langer等人建議設計 "努力的反應 "或 "有思想的反應",它可以採用縫合設計的視角來幫助提高注意力。有縫設計是對計算系統中 "無縫 "概念的補充,其概念根源在於普適計算。接縫的概念與XAI非常吻合,這是由於:(a)人工智慧系統被部署seamful spaces空間中;(b)該方法可以被看作是對“seamless”的黑暗模式人工智慧決策的回應,具有“zero friction”或理解力。

就形式和功能而言,seams戰略性地揭示了不同部分之間的複雜性和連線機制,同時隱藏了分散注意力的元素。這種 "戰略性揭示和隱藏 (strategic revealing and concealment)的概念是seamful design的核心,因為它將形式和功能聯絡起來,而對這種聯絡的理解可以促進反思性思維。因此,Seamful explanations戰略性地揭示了系統的缺陷和承受力,並掩蓋了那些分散注意力的資訊,對它們的認識可以促進有用的反思。

在組織層面上,為設計者和終端使用者引入教育(培訓)計劃。搭建一個生態系統是很重要的,因為EPs具有社會維度的複雜性,我們需要一種超越技術層面的策略。近期工作表明,對黑暗模式的掃盲可以促進自我反思和減輕危害。EPs掃盲計劃可以制定如下:(a)幫助設計者意識到EPs可能出現的表現;(b)讓終端使用者提高識別“陷阱”的能力。

總的來說,這些策略有助於我們用積極地預防EPs,促進對陷阱的復原力。雖然不夠詳盡和規範,但它在解決潛在有害問題上邁出了重要的一步。

4

總結

從安全性和可靠性的角度來說,XAI系統對人工智慧解釋所產生的影響進行分類非常重要。這項研究透過“可解釋性陷阱(EPs)”概念的討論,揭露了人工智慧解釋可能帶來的意料之外的負面影響。文中關於EPs的操作化和應對策略的解讀和見解,有助於改善XAI系統的問責和安全機制。

基於這項研究發現,作者認為關於XAI還有一些開放性的問題值得進一步討論:

1. 如何制定有效的 EPs 分類法,以更好地識別和減少負面影響?2. 如何使用不恰當解釋來說明“陷阱”在現實中的影響?3. 如何評估訓練過程,以減輕“陷阱”可能帶來的影響

最後作者表示,從人機互動到人工智慧社群,他們正在透過基礎概念與應用進一步研究可解釋性陷阱。相信通過了解XAI系統中陷阱的位置、方式和原因,可以顯著提高人工智慧系統的安全性。

佐治亞理工學院發文:不要迷信可解釋性,小心被誤導


雷鋒網

分類: 數碼
時間: 2021-10-24

相關文章

好訊息!好訊息!湯普森終於回來了

好訊息!好訊息!湯普森終於回來了
之前咱們不是總調侃湯普森是失蹤人口嘛,人家養傷都是各種秀康復訓練的照片,他養傷,不是秀狗就是秀玩具,或者下海--哦,不出海玩. 遊玩的湯普森 遊玩的湯普森2 遊玩的湯普森3 不過看起來並沒有因為養傷, ...

AMD向NVIDIA看齊:下代顯示卡也漲價,Intel成遊戲玩家救星?

AMD向NVIDIA看齊:下代顯示卡也漲價,Intel成遊戲玩家救星?
之前有傳聞RTX 40顯示卡將會在明年10月釋出,不過真正讓大家關心的是據說這次RTX 40顯示卡要全線漲價,RTX 4070的價格將和目前RTX 3080的價格相同,而 RTX 4090的價格對比R ...

AMD Radeon RX6600評測:更親民的次世代體驗

AMD Radeon RX6600評測:更親民的次世代體驗
[[[前言:次世代遊戲技術,以及它所帶來的尷尬]]] 經常關注我們三易生活的朋友可能知道,最近幾年整個消費電子行業在圖形計算技術方面的發展,可以說是非常的迅猛. 一方面,例如硬體光線追蹤.GPU直連S ...

已經有零售商在測試AMD Radeon RX 6600挖礦效能,雜湊率可超過30 MH/s

已經有零售商在測試AMD Radeon RX 6600挖礦效能,雜湊率可超過30 MH/s
AMD面向主流市場的Radeon RX 6600 XT在釋出後,曾被指出其Navi 23核心在挖礦方面有著很不錯的效率.與英偉達的Ampere架構的顯示卡相比,AMD的RDNA 2架構顯示卡在挖礦效率 ...

400W耗電大戶 AMD下代RDNA3顯示卡曝光

400W耗電大戶 AMD下代RDNA3顯示卡曝光
據外媒爆料的訊息,RDNA3架構顯示卡的頻率依然可以達到2.4GHz到2.5GHz,FP32浮點效能可以達到75TFLOPS,是RX 6900 XT顯示卡的三倍,也就是說效能是增加了 200%. RX ...

忘掉顯示卡吧,銳龍APU送上網遊玩家裝機攻略

忘掉顯示卡吧,銳龍APU送上網遊玩家裝機攻略
在想升級電腦的玩家看來,近來的這段時間可以說是難上加難,好不容易等到了顯示卡價格有下探的趨勢,忽然它又一飛沖天了,這可怎麼辦啊?不過如果你常玩的遊戲是網遊和電競遊戲的話,獨立顯示卡反倒不是一件很必要的 ...

Radeon RX 6600天梯榜首發評測:能耗比驚人的新一代甜品

Radeon RX 6600天梯榜首發評測:能耗比驚人的新一代甜品
今年整個一年晶片產業都受到產能不足的困擾,AMD的顯示卡業務或許真的是被產能不足嚴重影響,可以看到其新一代顯示卡的釋出步伐上明顯要比競爭對手英偉達要慢一些,在英偉達定價2499元的"入門級& ...

AMD 表示:GPU 是給遊戲玩家準備的,而不是挖礦的

AMD 表示:GPU 是給遊戲玩家準備的,而不是挖礦的
根據 Jon Peddie Research 的資料,英偉達在 2021 年第二季度的銷量相比 AMD 達到 9:2.因此有玩家指責 AMD 將其 Radeon 顯示卡賣給了大型礦場,導致大量普通使用 ...

又漲了!NVIDIA AMD最近一個半月價格雙雙持續走高

又漲了!NVIDIA AMD最近一個半月價格雙雙持續走高
德國3DCenter公佈了最新的電腦顯示卡市場走勢統計分析,來源於德國和鄰近的奧地利店家,結果--又漲了! 現在,NVIDIARTX30系列產品的價位相比較官方提議零售價格人均貴了74%,自打七月初至 ...

Intel和AMD齊上DP2.0,DP介面未來有戲

Intel和AMD齊上DP2.0,DP介面未來有戲
目前我們在市場上常見的顯示器標配仍然HDMI2.0介面和DP1.4介面,首先是因為當前主流顯示器是1080P解析度,即便在一些遊戲畫面達到144Hz的情況下也僅需要8Gbit/s的頻寬,這兩個介面都可 ...

甜品卡新選擇,電競玩家心頭好,華碩RX6600XT上市

甜品卡新選擇,電競玩家心頭好,華碩RX6600XT上市
為了充實Radeon RX6000系列在中端"甜品卡"的產品線,AMD釋出全新的Radeon RX 6600XT,瞄準中端"甜品卡"市場. 作為一線板卡廠商,華 ...

3899元!華為新臺式機開售:造型小巧,介面是最大亮點

3899元!華為新臺式機開售:造型小巧,介面是最大亮點
9月13日訊息,近日,華為在電商平臺上架了MateStation S臺式主機,搭載銳龍4000G系列APU,支援多屏協同,這與之前的海外版一致,售價3899元起. 具體售價方面: AMD R5 460 ...

我們不需要奇形怪狀的方向盤

我們不需要奇形怪狀的方向盤
➤今天這個話題,我們需要先把時間往後撥兩個多月,從2021年6月10日,特斯拉開始正式交付Model S Plaid車型時聊起. 雖然這臺特斯拉純電旗艦在外觀上與9年前推出的第一代Model S相差並 ...

7位懷孕瞞得很好的明星:林依晨懷孕8月才曝光,趙麗穎婚後才承認

7位懷孕瞞得很好的明星:林依晨懷孕8月才曝光,趙麗穎婚後才承認
近日,從林依晨經紀人口中傳來了好訊息,林依晨終於懷孕了,而且已經懷孕八個月了! 林依晨懷孕的訊息,最開始是由媒體曝光的,媒體稱林依晨已經於近期悄悄當媽,他老公林於超特地從外地趕來陪伴林依晨.林依晨的預 ...

年輕人的膝上型電腦,必須有顏有才

年輕人的膝上型電腦,必須有顏有才
知名的3C品牌華碩a豆,以智造向新力的品牌定位,在產品顏值.創新設計.產品效能等方面打破陳舊定式,推出一系列以膝上型電腦為基礎的智慧A lot生態圈,成為了年輕人的數碼首選.近日華碩a豆與中國航天聯名 ...

細思極恐第39期——《樹林傳說》

細思極恐第39期——《樹林傳說》
社會是一個大樹林 樹林是社會的縮影 細思極恐的細節你發現了麼? 明天公佈答案哦!關注我不走丟! #打卡美好生活##推理恐怖漫畫# 作者:畫手歌者 本文轉載自微信公眾號:畫手歌者(ID:huashoug ...

明日中秋,民間為何有老話“八月十五天門開”說法?有啥典故?

明日中秋,民間為何有老話“八月十五天門開”說法?有啥典故?
明日就到了傳統佳節中秋了,中秋是民間傳統四大節日之一,老話常說:"八月十五月兒圓",而月圓有人之團圓的寓意:所以,中秋是萬家團圓念親思鄉的日子:中秋也是民間僅次於春節的第二大傳統節 ...

財經早餐2021.09.22
國際市場 1.經合組織釋出最新經濟展望報告 當地時間9月21日,經濟合作與發展組織在最新發布的經濟展望報告中預測,2021年全球經濟將增長5.7%,二十國集團成員經濟將增長6.1%,這與今年5月的預測 ...

假期外盤大跌加速國內市場洗牌2021.9.22

假期外盤大跌加速國內市場洗牌2021.9.22
中秋假期內外盤普遍下跌,其中和國內市場聯動相對緊密的港股下跌對國內市場情緒影響比較大,假期很多人擔心國內市場會受影響暴跌.港股目前從市值和交易量角度,都屬於從屬市場,港股的流動性跟隨美國,基本面跟隨大 ...

突發的感慨隨筆,獨生子女的悲哀
最近碰上的事情太多了,除了重新整理聞也沒任何辦法平復自己糟亂的心情. 看見好多人討論人口下降的危害,房價的危害.事實就是獨生子女承受得太多,我不是抖音頭條上那種動不動年入幾十萬.百萬的家庭.就是東北一 ...