sponsored links

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


曠視研究院張祥雨團隊的張培圳研究員深入淺出地為我們介紹了其團隊被 NeurIPS 2021 錄用的論文「用於物體檢測的例項條件知識蒸餾」。本期報告首先簡要回顧了用於影象識別、物體檢測的知識蒸餾技術的發展歷程,介紹了論文的研究動機、模型架構、訓練技巧以及實驗結果。

本文整理自青源 LIVE 第 31 期,影片回放連結:https://event.baai.ac.cn/activities/204

主講丨張培圳

整理丨熊宇軒

審校丨李夢佳

1 背景知識

早在 NIPS 2014 上,Hinton 等人在論文「Distilling the knowledge in a Neural Network」中就開始研究用於影象分類的知識蒸餾技術。根據知識源的不同,我們可以將用於影象分類的知識蒸餾技術分為「基於 Logits 響應」、「基於中間特徵圖啟用」和「基於關係建模」的知識蒸餾。

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


如上圖所示,基於響應的知識蒸餾往往會在弱監督場景下計算預訓練教師網路和學生網路用於分類的 Logits 的 KL 散度;基於啟用的知識蒸餾會計算教師網路和學生網路中間特徵圖的 MSE;基於關係建模的知識蒸餾則會針對教師網路和學生網路對每一個 mini-batch 中圖片經過全域性平均池化後的特徵矩陣計算 MSE 等距離。

面向物體檢測任務的知識蒸餾技術大多屬於基於中間特徵圖啟用的知識蒸餾。近年來,一些面向工程化的工作也會嘗試系統地使用上述知識蒸餾方式的組合(例如,FBKD、GID、DeFeat、G-DetKD,等)

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


相較之下,分類模型需要處理的影象往往包含單個物體,待分類的物體位於影象的中央;而檢測模型需要處理的影象中往往包含多個物體,這些物體從屬於各種類別、分佈於影象的各個位置,影象中還包含大量冗餘的背景資訊。

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


在針對中間特徵圖進行蒸餾時,蒸餾特徵的位置是十分關鍵的,我們通常會利用以下三類拓撲資訊:

(1)前景先驗:給定訓練圖片中物體的邊界框 BBOX,我們將其對映到中間特徵圖上,對該區域進行知識蒸餾;對於基於 anchor 的物體檢測任務,重點對與 groundtruth 重疊比例較高的 anchor 區域進行蒸餾;對於多階段物體檢測任務,針對 proposal 進行蒸餾;

(2)前景和背景先驗:將前景、背景分開蒸餾/在全圖上使用注意力機制;

(3)基於度量的區域:根據設計出的度量方式找出有效的蒸餾資訊(例如,教師網路與學生網路的差異)。

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


如上圖所示,藍色和棕色的實線方框代表真實的物體邊界框;黑色的方框代表物體附近的 anchor;藍色、棕色、紅色的虛線方框代表多階段檢測模型提出的 proposals,可以透過非極大抑制等手段對其進行修正。

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


在考慮背景先驗時,我們可以透過二值掩膜將前景和背景分隔開,進而分別進行蒸餾。此外,我們可以在全圖中分別在空間和通道上使用注意力機制,我們可以分別對教師和學生網路計算空間維度和通道維度上的注意力圖,進而對這些注意力兩兩進行知識蒸餾。

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


在利用教師網路、學生網路評分差異進行知識蒸餾時,假設教師網路和學生網路預測頭的預測特徵圖的維度相同,影象上的某個畫素點鄰近於某個 anchor 的預測框,模型會計算出該預測框從屬於某一類的置信度以及物體迴歸的位置編碼資訊。在典型的情況下,教師網路可以很好地預測出類別和邊框位置資訊,而學生網路對於某些類別物體的預測效能較差。因此,我們可以基於度量學習的方式,重點對學生網路學習效能較差的類別進行蒸餾。

以 ADL 模型為例,其關鍵之處在於計算自適應蒸餾權重(ADW)。如上圖所示,紅色圓圈代表教師網路和學生網路在某個空間位置上預測評分的 KL 散度。此外,在 GID 模型中,作者定義了一種通用例項(General Instance)代表教師網路或學生網路的 proposal,這兩種網路對proposal 會產生預測得分的差異,GI Score 為針對所有類的得分差異的最大值,該值越大說明不確定性越強。

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


基於前景/背景的建模方法非常直接,符合人類的認知習慣,但是這些方法獲得的知識可能是次優的。基於度量的方法相對來說較為靈活,但是往往並不直觀,並且存在多種可能的度量方法。

2 用於物體檢測的例項條件知識蒸餾

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


為了解決上述問題,曠視研究院張祥雨組提出了「用於物體檢測的例項條件知識蒸餾」,在保證模型具有直觀性、可解釋性的同時,兼具了基於度量的蒸餾方法的靈活性。模型的整體架構如上圖所示。

具體而言,該方法利用人類標註的例項作為條件,來查詢教師網路的特徵,從而檢索出有用的知識,用於蒸餾學生網路的特徵圖。

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


如上圖所示,左側為 Query 的特徵構造過程,右側為抽象的建模過程。從抽象建模過程開始,我們可以將圖中物體的 one-hot 類別資訊和例項的位置嵌入透過多層感知機編碼到 Query 中。這樣一來,每個例項的特徵都可以被表示為一個低維向量。

我們利用上述例項標註在教師網路的特徵圖上提取有效資訊。每個特徵圖是一個三維(H*W*D)的張量,我們可以將其在空間維度上展平,得到特徵

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


(指展平後教師特徵的個數)。

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


接著,我們透過「鍵-值」形式的注意力,將物體標註和保留了空間-拓撲資訊的特徵影象素之間的關係例項化,從而得到了「例項感知注意力掩模」。這樣一來,我們就可以衡量物體和影象位置的關係。其中,基於 Query、Key、Value 的自注意力的計算正規化與原始的 Transformer 架構中的計算正規化相同。

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


如上圖所示,我們獲得的例項條件知識為

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


。其中,

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


為注意力掩模,

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


為教師網路的特徵圖,i 為圖中第 i 個物體的索引,j 為多頭注意力機制中的第 j 個注意力頭。

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


為了保證掩模與待檢測物體的位置相關,我們設計了面向檢測任務的輔助任務引導對掩模的學習。具體而言,我們利用注意力機制的輸出作為識別、定位輔助任務的監督訊號。值得注意的是,輔助任務不會更新學生網路的引數。在識別任務中,我們首先根據資料集先驗取樣出一些偽樣本。對於識別出的真實樣本,我們進一步對其位置進行定位。

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


如上圖所示,在公式(10)中,輔助損失中的第一項是針對識別任務的二值交叉熵損失,第二項為對真實樣本的定位迴歸損失。其中,

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


為例項查詢與教師特徵圖之間注意力機制的輸出,

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


為由多層感知機和 Sigmoid 函式構成的分類頭,當查詢的標註物體為真時

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


,反之其值為 0。

然而,注意力機制的輸出依賴於注意力掩模和教師網路特徵圖,而注意力掩模又依賴於標註。因此,透過公式(10)懲罰注意力機制的輸出和之間的分類誤差,往往會使網路學習到一個平凡解,從而使「例項感知注意力掩模」失效。

為此,我們引入了資訊丟失(information dropping)技術,破壞例項標註的資訊。對於迴歸任務,我們對物體邊界框的中心進行抖動,並且對尺度資訊進行量化。這樣一來,我們就會強迫模型從教師網路特徵圖上學習到更多的資訊。

因為資訊丟失和定位迴歸損失之間有聯絡,資訊丟失能強迫從教師網路特徵圖上學習到更多的資訊。我們的定位任務不是像一般檢測器那樣去迴歸物體框,而正是去迴歸抖動的物體框中心和抖動前的框中心的這個抖動距離。因為 本身是基於抖動後的框資訊編碼的,它如果想把上面這個任務做好,降低其損失,必須從教師特徵圖上面去感知到這個真實物體中心。

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


整體而言,本文所提出的框架的損失函式由蒸餾損失、學生網路的檢測損失、輔助任務損失構成,其中

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


為真實樣本個數。

3 實驗結果

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


與現有的知識蒸餾方法相比,本文提出的方法在 COCO 資料集上取得了較優的效能。在使用 RetinaNet 作為物體檢測網路,採用多尺度訓練時,本文提出的方法可以將學生網路(ResNet-50)的物體檢測 AP 從 37.4 提升到 40.7,這一數字甚至超過了教師網路(ResNet-101)的 40.4 的 AP。在訓練過程中進行的,涉及物體Groundtruth資訊的例項建模為學生從單純的教師網路特徵圖資訊以外獲得更好訓練,提供了可能。

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


在其它的檢測和分割模型上,本文提出的知識蒸餾方法也取得了優秀的效能表現。如上圖所示,繼承策略(Inheriting Strategy)是一種非常有用的訓練技巧:當教師網路和學生網路的Neck部分和檢測頭部分的架構相同時,學生網路就可以繼承上面兩個部分的引數進行良好的初始化,從而進一步提升效能或快速收斂。

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


在使用 EfficientNet-B0、MobileNet-V2 等面向移動裝置的主幹網路時,本文提出的知識蒸餾方法可以大大提升物體檢測的 AP。

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


Transformer 解碼器的注意力頭在原圖中的啟用視覺化結果如上圖所示。實驗結果表明,注意力頭可以有效注意到例項周圍的資訊。

4 討論

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


在整體的計算過程中,計算量主要體現在教師網路的預訓練和學生網路本身的訓練開銷,而本文加入的輔助任務和知識蒸餾的計算開銷相對較小。在知識遷移方面,本文提出的方法可以直觀地檢索影象中有意義的內容,引入了類似基於度量的蒸餾方法的靈活特性,具有一定的可解釋性。本文采用的繼承策略訓練技巧可以有效地加快收斂。

5 結語

張祥雨團隊最新工作:用於物體檢測的例項條件知識蒸餾 | NeurIPS 2021


在本文中,曠視研究院提出了一種面向物體檢測的新型知識蒸餾框架,該框架可以學習特徵解碼器模組從而檢索有用的知識,設計了輔助任務來最佳化解碼器。作者設計了基於例項的條件,從而適應目標檢測任務,其中 Query 為標註的例項資訊,Key 和 Value 為教師網路的表徵知識。

GAIR 2021大會首日:18位Fellow的40年AI歲月,一場技術前沿的傳承與激辯

2021-12-10

致敬傳奇:中國並行處理四十年,他們從無人區探索走到計算的黃金時代 | GAIR 2021

2021-12-09

時間的力量——1991 人工智慧大辯論 30 週年紀念:主義不再,共融互生|GAIR 2021

2021-12-12

論智三易,串聯通訊,貫通邊緣,演進認知,匯於機器:聽五位IEEE Fellow暢談AI未來 | GAIR 2021

2021-12-25

分類: 家居
時間: 2022-01-05

相關文章

侯佩岑真的是很優雅了,穿露肩的裙子氣質高階,既精緻還高階

侯佩岑真的是很優雅了,穿露肩的裙子氣質高階,既精緻還高階
露肩設計也有許多不同的具體區別,比如斜肩設計和一字肩等等,可以根據不同的設計風格搭配不同的元素,比如,真絲的裙裝可以搭配刺繡的珠片設計配合斜肩設計展示民族風,同樣比如優雅的一字肩設計可以搭配比較長的禮 ...

張衛健帶著老婆出門,張茜的穿搭是很優雅的,帶出門真有面子

張衛健帶著老婆出門,張茜的穿搭是很優雅的,帶出門真有面子
隨著年齡和閱歷的不斷增長,大多數人會變得越來越沉穩,一改之前的浮躁心態,就像一杯剛開始有些渾濁的水,在經過沉澱之後越發清透明亮起來,這也是一種抽絲剝繭,撥雲見霧的過程. 所以很多人在選擇服裝時,也會想 ...

陳法蓉和朱茵站一起好養眼,雖然身高有差距,但氣質很優雅

陳法蓉和朱茵站一起好養眼,雖然身高有差距,但氣質很優雅
比較精緻的穿著總是能幫助人們表現更強的時尚感,而女性的穿著風格也是有很多選擇的.不管是淑女感覺的服飾還是帶著運動的輕快感覺穿搭,都能讓個人魅力有著不同方向的提升. 穿著最重要的步驟是搭配,搭配總是比單 ...

7個技巧讓你的臥室看起來很優雅
你可以在臥室放鬆.在氛圍.功能和個性之間找到適當的平衡很重要.而且不必花費很多錢.提供給你7個簡單而廉價的技巧,讓你的臥室真正一流.透過這種方式,你無疑會給自己以及家人朋友留下深刻印象. 1. 看看你 ...

林心如這樣的女人值得細品,平時看著就很優雅,五官精緻有魅力

林心如這樣的女人值得細品,平時看著就很優雅,五官精緻有魅力
連體褲是咱們生活中非常多見的穿搭單品,高低一體的褲身計劃能夠讓身段比例趨近於完善. 種種樣式和樣式的連體褲都能讓穿搭者穿出本人的特色和樣式.高低一樣的色彩也不會把身材線條舉行切割,能夠到達顯高顯瘦的結 ...

為何國內有些機場名字那麼土?機場也很委屈:你以為我想土啊

為何國內有些機場名字那麼土?機場也很委屈:你以為我想土啊
近些年,隨著城市建設的不斷髮展,人民生活水平的不斷提高,出門旅遊的方式也是越來越多樣,從自駕游到乘火車,從乘坐高鐵到乘坐飛機,有時候還可以坐船旅遊,真是非常方便. 但是,如果說目的地距離較遠,最快的出 ...

45歲的李小冉真不顯老,穿牛仔裙優雅有活力,一頭短髮氣質很迷人

45歲的李小冉真不顯老,穿牛仔裙優雅有活力,一頭短髮氣質很迷人
牛仔元素經典又時尚,而且百搭又好穿幾乎不會出錯.日常出門犯懶的時候,隨便穿條牛仔褲配T恤,清爽乾淨時尚感一點都不差. 很帥氣隨性的牛仔材質,運用在裙裝上,會呈現出別樣的美感.李小冉穿一條牛仔連衣裙,知 ...

葉倩文雖然白髮明顯,但穿白裙卻從容又優雅,這才是60歲真實模樣

葉倩文雖然白髮明顯,但穿白裙卻從容又優雅,這才是60歲真實模樣
年輕的女性,可以肆無忌憚地揮霍自己的青春,在當下去選擇任何時尚單品,來打造自己的風格.而對於衰老的女性來說,有很多著裝款式,以及色彩都不能輕易嘗試,由於年齡問題,也讓自己不得不承認,衰老確實會影響到整 ...

甘比看不出41歲了,穿條紋襯衫好年輕,配高腰褲有職場精英範兒

甘比看不出41歲了,穿條紋襯衫好年輕,配高腰褲有職場精英範兒
甘比最近亮相的穿搭,挺有職場精英範兒,雖然41歲了但她依舊活力滿滿,身上縈繞著一股少女氣息.最近參加活動時的打扮也格外優雅,一件條紋襯衫搭配高腰條紋西褲,同為條紋元素,卻一點都不顯得突兀,得益於色調和 ...

植物世界丨被名字耽擱的美麗花花,別再讓它們的美麗淹沒在俗名裡
人生一大幸:得一方淨土,耕耘樹藝,忘卻喧囂浮躁,話詩和遠方-- 我是三妹兒,點選右上方"關注",和你相遇皆是緣[心] 今天我們依然是聊花,今天出現在文章裡面的花花們依然美麗奪目,但 ...

66歲趙雅芝穿得跟個小姑娘似的,紅色毛衣配皮褲,就是鞋子也很潮

66歲趙雅芝穿得跟個小姑娘似的,紅色毛衣配皮褲,就是鞋子也很潮
進入九月之後北方的天氣明顯涼爽了不少,沒有了高溫悶熱的難受感,走在街上也是穿什麼的都有.當然很明顯的一點感覺就是,大家服飾的色彩又開始趨於平淡. 尤其是上了年紀的女性,黑色又成了主要的色彩了.在凍齡這 ...

宋祖英氣質真沒得說,穿“蚊帳裙”配小綠裙都好看,優雅又迷人

宋祖英氣質真沒得說,穿“蚊帳裙”配小綠裙都好看,優雅又迷人
很多成熟女性在穿搭的時候上都非常喜歡一些微微透視的面料,這種透視感可以呈現出一種若隱若現的搭配效果,將成熟女性身上的女人味呈現出來,但是用得不好的話就會起到適得其反的穿搭效果,宋祖英久違亮相,穿蚊帳裙 ...

一件時尚又個性的連衣裙,樸秀妍穿上很顯身材曲線,幹練利落大方

一件時尚又個性的連衣裙,樸秀妍穿上很顯身材曲線,幹練利落大方
一件時尚又個性的連衣裙,樸秀妍穿上很顯身材曲線,幹練利落大方!時髦設計細膩的質感和款式修身的版型設計很有潮流氣息,更顯浪漫優雅端莊浪漫穿起來非常顯瘦又很漂亮迷人,出街吸引眼球還很是增添魅力大方而又得體 ...

陶虹的生圖還是很美的,穿很普通的白色服裝,依舊看不出真實年紀

陶虹的生圖還是很美的,穿很普通的白色服裝,依舊看不出真實年紀
無論在什麼時候,無論流行的服裝顏色是什麼,白色的服裝都不曾落伍過,這是因為白色的服裝在時尚界的地位是很高的,無論是想讓自己看著更高階,還是更加的年輕,白色的服裝都是你的首選的. 就算是日常的服裝,選擇 ...

楊冪真是“帶貨女王”,土氣針織開衫配厚底短靴,穿出復古摩登範

楊冪真是“帶貨女王”,土氣針織開衫配厚底短靴,穿出復古摩登範
人靠衣裝馬靠鞍,時髦的穿搭總是會給一個人的氣質加分.但也有一種反常,就是仗著顏值高,身材好,土氣的服裝也能穿出高階範.比如說楊冪,她的每一組穿搭都被人爭相模仿,成為名副其實的"帶貨女王&qu ...

58歲的葉童真是不服老,淺藍色開衫配蕾絲內搭溫柔優雅,清爽減齡

58歲的葉童真是不服老,淺藍色開衫配蕾絲內搭溫柔優雅,清爽減齡
說到葉童,可能有很多人不認識,其實她是一個老戲骨,曾經也出演過不少的電視劇,如今的她早已步入中年,但氣質非常好,所以這次在參加活動時,穿上一件淺藍色的開衫搭配了蕾絲內搭,狀態真的超好,一點都看不出她的 ...

沃爾沃XC60拒絕低調 “輕改”之後更有範兒

沃爾沃XC60拒絕低調 “輕改”之後更有範兒
哈嘍,大家好,身為一名汽車編輯,在我以往的文章中很大一部分都是再和大家聊車型試駕以及購車等相關內容.但我相信很多愛車的朋友買完新車或是開了一段時間後必定會開始"鼓搗起來",&quo ...

66歲趙雅芝的髮型真好看!空氣劉海時尚減齡,配棕色髮色優雅大氣

66歲趙雅芝的髮型真好看!空氣劉海時尚減齡,配棕色髮色優雅大氣
女性的美是多樣性的,元氣活潑是美,優雅大氣是美,清麗可人也是美,而六十六歲的趙雅芝就美了一輩子,每次亮相必定會驚豔眾人.一款藍色印花連衣裙搭配空氣劉海,搭配棕色的髮色顯得既甜美又高階,用絕佳的狀態告訴 ...

如何買到價效比高的房子?這幾點很重要

如何買到價效比高的房子?這幾點很重要
我是星叔,你相見恨晚的買房軍師,目前已為8000人提供買房最佳解決方案.星叔不像其他自媒體,遮遮掩掩的讓你摸不清頭腦!星叔屬於實戰派只說對你最有用的操作和建議 提問:星叔,準備買房,本來信心十足.有備 ...

Christine McGuinness一襲銀色長裙優雅美麗,開心甜笑心情好

Christine McGuinness一襲銀色長裙優雅美麗,開心甜笑心情好
近日,克里斯汀·麥吉尼斯(Christine McGuinness)現身戶外拍片,她身穿一件銀色的長裙亮相,看起來很優雅美麗. 克里斯汀·麥吉尼斯(Christine McGuinness)是一位很有 ...