sponsored links

NeurIPS 2021 | 物體檢測與分割的零標籤視覺學習

編者按:隨著自監督學習的研究逐步深入,遷移學習的正規化已經廣泛應用於視覺學習的各個領域,大量的視覺任務都透過使用自監督預訓練和有監督微調的方式來部署任務。而微軟亞洲研究院的研究員們希望打破這一正規化,在 NeurIPS 2021 發表的論文中,研究員們提出了一個可以從無標籤影片中學習物體檢測和分割的模型,使得自監督預訓練模型可以直接服務於應用,而不需要任何有監督微調,實現了零標籤的學習。


對比學習是當前訓練視覺自監督模型中的主流方法。其核心思想是將訓練資料集中的每一個獨立樣本視為一個類別,設計預訓練的任務為獨立個體的識別。由於每個類別只有一個樣本,個體識別會非常簡單。研究者們通常會利用資料增強技術為每個樣本創造豐富的類內樣本。對於圖片來說,資料增強大致包括:圖片的平移、縮放、翻轉、顏色對比度和色澤的變化、模糊以及灰度變換等等。這些影象增強技術雖然改變了影象的細節,但是卻沒有改變圖片描述的語義內容。實際上,對比學習是在學習對於這些增強變換具有不變性的特徵表示。從實驗中可以觀察到,對比學習對資料增強的依賴是非常顯著的

NeurIPS 2021 | 物體檢測與分割的零標籤視覺學習


圖1:對比學習依賴於底層影象增強技術而學習不變性。常用影象增強技術:平移、縮放、顏色增強、區域性模糊等

作為一種預訓練的方法,對比學習只是學習到了一種特徵表示,但是這種特徵表示需要一些(少量的)有監督的下游資料做微調訓練之後,才可以應用於下游任務。預訓練的表徵雖然可以大幅度提升下游任務的微調效能,但依賴於微調的特性卻成為了自監督模型本身的缺陷和短板。

NeurIPS 2021 | 物體檢測與分割的零標籤視覺學習


圖2 遷移學習的框架:通用預訓練 + 特定任務的微調。自監督學習必須利用下游任務的少量監督資料才可服務應用。

NeurIPS 2021 | 物體檢測與分割的零標籤視覺學習

從影片中學習物體檢測和分割

基於針對對比學習缺陷的分析和理解,微軟亞洲研究院的研究員們希望設計一種不需要微調就可以直接應用到下游任務的自監督模型。為了達成這個目的,研究員們開始從影片中尋找有用的資訊。區別於計算機學習圖片識別任務,人類是從一個連續變換的時序訊號中實現學習的。一個時序的影片訊號包含了很多圖片中不可能存在的有用資訊。比如,影片可以描述一個物體的運動(motion)以及它的形態變化(deformation);然而,對於靜態圖片資料集,一個物體很難在資料集中被多次捕捉到。再如,通過幾何學的方法,研究員們可以從影片中重建一個物體的三維形態,但這也很難從靜態圖片中恢復。因此,研究員們希望可以從影片中分析物體的運動形態,藉助其運動形態幫助檢測物體的存在,並分割出物體的外形。

檢視合成任務(View Synthesis)

首先,研究員們需要從影片中尋找到合適的免費監督資訊來學習物體的檢測和分割。影片中常用到的一個學習目標就是檢視合成任務。具體來說,給定一個影片的兩幀圖片,一幀初始圖片,一幀目標圖片,檢視合成任務會嘗試學習一個扭曲函式(warping function),用來建模從初始幀到目標幀的畫素重建過程。這個看似簡單的任務有著豐富的應用場景。例如,若用畫素點對點的對應關係來表示這個扭曲函式,那麼視覺合成任務就可以實現自監督的光流(optical flow)學習。再如,若可以獲得相機的引數,視覺合成任務可用來實現自監督單通道深度(depth)的估計。實現不同自監督任務的關鍵是:找到一個合適的表示方法(representation),使其既能夠完成檢視合成任務,同時又能實現所關心的應用任務,比如光流和深度的估計。再舉一個例子,先前的工作為了完成雙目影象的立體增強(stereo magnification),設計了新的多平面圖(multi-plane images)表示方法。

NeurIPS 2021 | 物體檢測與分割的零標籤視覺學習

圖3:檢視合成任務可以驅使一種新的多平面圖表示,
這種新的表示可以幫助生成大 baseline 情況下的檢視。
圖片摘自論文“Stereo Magnification: Learning View Synthesis using Multiplane Images”。

研究員們寄希望於應用檢視合成任務來實現物體的檢測和分割,這與先前工作最大的不同是試圖提取和學習圖片中層甚至高層的表示,而並非僅停留在學習影象的一些低層表示。出於此目的,研究員們設計了一種新的表示和模型 AMD(Appearance-Motion Decomposition),用來實現零標籤的物體分割。

相關論文“The Emergence of Objectness: Learning Zero-Shot Segmentation from Videos”已被 NeurIPS 2021 接收。

論文連結:

https://papers.nips.cc/paper/2021/file/6d9cb7de5e8ac30bd5e8734bc96a35c1-Paper.pdf

分割流以及 AMD 模型

圖4展示了 AMD 模型的基本構架。模型主要由兩個構架網路組成:外形網路(appearance pathway)和運動網路(motion pathway)。給定一幀的輸入frame i,外形網路會將其分割成為若干個區域,在此例子中為3個。給定連續兩幀的輸入 frame i 和 frame j,運動網路則會首先抽取出描述空間對應關係的運動特徵,接著為外形網路預測的每個區域估計一個整體的光流(flow offset)。

NeurIPS 2021 | 物體檢測與分割的零標籤視覺學習

圖4:AMD 模型的基本構架。下分支為預測分割的外形網路,
上分支為預測分割流的運動網路。整個模型使用檢視合成任務做為訓練目標。

在這裡,研究員們應用 gestalt principle common fate 的假定,認為每個區域內部共享一個單獨的光流。這種假定對於一些剛性物體的運動是不錯的估計,但對於複雜形變的物體,這種假定是不成立的。根據預測的每個區域以及相應區域的光流值,研究員們重構了一個光流圖。因為這個光流受限於分割的結果,只有很低的自由度,因此稱之為分割流(segment flow)。得到這個分割流之後,就可以將 frame i warp 到 frame j 這一幀上。重建的 frame j 可以和實際觀測做對比,監督整個網路的學習。

AMD 模型將一個影片的外形(appearance)資訊和運動 (motion)資訊解耦開(decomposition),從而實現了對影象分割零標籤的應用。在實現上,外形網路應用傳統的 ResNet50 結構,運動網路應用常見的 PWC-Net, 兩個網路均從零訓練,未加入任何的預訓練初始化。預訓練完成後,外形分支可以直接應用在全新的圖片上實現影象分割,而不需要任何微調。值得注意的是,訓練 AMD 模型並不需要加入大量的影象增強技術。這在一定程度上緩解了對於對比學習的依賴

NeurIPS 2021 | 物體檢測與分割的零標籤視覺學習

圖5:光流和分割流的對比。光流以單個畫素為基本單元描述物體的運動,
分割流以區域性的區域為基本單元描述運動。可以看出,由於其精確的描述,
光流在時間上的變化很大,很難準確的分割物體。
研究員們的分割流盡管犧牲了運動的準確性,卻獲得了對於物體結構的認知。

NeurIPS 2021 | 物體檢測與分割的零標籤視覺學習

下游應用與實驗結果

無需任何微調,研究員們的 AMD 模型便可以應用在圖片分割和影片運動物體等分割任務上。對於影象分割,研究員們只需遷移圖形網路分支即可。在一個顯著性檢測(saliency detection)的資料集 DUTS 上測試時,圖6展示了分割效果。由此可見,研究員們的預訓練模型不僅可以檢測和分割“可移動的物體”,還可以泛化到分割一些靜態物體上,例如:雕塑、盤子、長椅、樹木等等。

NeurIPS 2021 | 物體檢測與分割的零標籤視覺學習


圖6:顯著性檢測在 DUTS 上的測試效果

對於分割影片中的運動物體,則需要遷移 AMD 模型的全部兩個分支。針對一個測試影片,為了利用運動資訊,研究員們使用了測試階段最佳化的技巧(test time adaptation)。具體而言,研究員們同樣使用檢視合成這個自監督任務對測試影片進行最佳化,並將 AMD 模型在三個資料測試集上進行了測試(模型從未見過這些資料集的訓練集)。研究結果顯示,AMD 模型在其中兩個資料集上都大幅度超過了已有的方法。圖7展示了具體的效能和視覺化的結果。

NeurIPS 2021 | 物體檢測與分割的零標籤視覺學習

NeurIPS 2021 | 物體檢測與分割的零標籤視覺學習


圖7:影片中的運動物體分割,上圖為視覺化的對比,下表為數值上的對比。

NeurIPS 2021 | 物體檢測與分割的零標籤視覺學習

總結

本篇論文的研究試圖提出和設計一種零標籤的自監督學習模型。該模型不需要任何微調就可以使用在一些應用場景中。這項研究工作解耦了影片中的外形和運動表徵,使其能夠分割和檢測物體。研究員們也希望這項研究工作可以啟發更多零標籤學習的相關任務。

參考文獻

1. Tinghui Zhou, Richard Tucker, John Flynn, Graham Fyffe, and Noah Snavely. Stereo magnifi- cation: Learning view synthesis using multiplane images. arXiv preprint arXiv:1805.09817, 2018.

2. Clément Godard, Oisin Mac Aodha, Michael Firman, and Gabriel J Brostow. Digging into self-supervised monocular depth estimation. In Proceedings of the IEEE/CVF International Conference on Computer Vision, pages 3828–3838, 2019.

3. Zhirong Wu, Yuanjun Xiong, Stella X Yu, and Dahua Lin. Unsupervised feature learning via non-parametric instance discrimination. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pages 3733–3742, 2018.

4. Deqing Sun, Xiaodong Yang, Ming-Yu Liu, and Jan Kautz. Pwc-net: Cnns for optical flow using pyramid, warping, and cost volume. In Proceedings of the IEEE conference on computer vision and pattern recognition, pages 8934–8943, 2018.


看完了今天的論文分享是不是還意猶未盡呢?想了解更多關於計算機前沿研究嗎?我們特別為大家準備了11月18日 NeurIPS 2021論文分享會的影片回放!點選下方連結,快來觀看吧!更多 NeurIPS 2021論文回放,請關注 B 站“微軟中國影片中心”賬號。

Tips:今天分享的論文在影片的00:00到17:10哦。

https://m.bilibili.com/video/BV1RZ4y1X7Cp

分類: 歷史
時間: 2021-12-01

相關文章

氣膜建築憑藉技術優勢應用於各領域,實現建築的提質增量

氣膜建築憑藉技術優勢應用於各領域,實現建築的提質增量
氣膜結構建築是一種新型的建築體系,具有跨度大.無樑無柱.安裝容易.施工週期短.抗震效能好.投資回收快.環境汙染少等優勢,因而被業內各方普遍看好.在國家倡導綠色建築.節能環保.資源迴圈利用等政策影響下, ...

環旭電子年投10億研發享技術優勢 營收年增長率淨利潤率均居行業前列
長江商報訊息●長江商報記者沈右榮 持續加碼研發,全球性公司環旭電子(601231.SH)形成了核心競爭力. 環旭電子是一家電子產品領域提供專業設計製造服務及解決方案的大型企業,集蘋果概念.無線耳機.M ...

解放軍殲20批次裝備,美國空軍技術優勢不再,F35A戰機規模要考慮

解放軍殲20批次裝備,美國空軍技術優勢不再,F35A戰機規模要考慮
空軍是捍衛一個國家領空,在戰時負責奪取制空權的作戰力量,在現代戰爭中是必不可少的軍種.談及當今世界各國空軍的實力,美國空軍是名副其實的霸主,曾經有一種說法,美國空軍是世界第一,退役的美國空軍是世界第二 ...

抗美援朝前期,為何美軍誤認為最高指揮員是林彪?

抗美援朝前期,為何美軍誤認為最高指揮員是林彪?
抗美援朝戰爭在我國曆史上始終具有重要的意義,不僅大大增強了我國人民的民族自信心,也打出了我國的國威,提高了我國的國際地位.在彭德懷元帥的領導下,志願軍成功以劣勝優,打出漂亮的勝仗.但是,在抗美援朝初期 ...

俄媒:中國的技術優勢:6G專利申請超過美國 中國提交了 40.3% 專利

俄媒:中國的技術優勢:6G專利申請超過美國 中國提交了 40.3% 專利
俄羅斯衛星通訊社網站 中國已經在開發 6G 下一代網路.商業部署預計將在本十年末開始.日經亞洲和網路創意研究院的研究顯示,中國公司在全球提交了 40.3% 的 6G 專利申請.其中大多數來自華為.美國 ...

什麼操作?美軍出動核潛艇試射兩枚戰略導彈,還強調“不是在展示權力”

什麼操作?美軍出動核潛艇試射兩枚戰略導彈,還強調“不是在展示權力”
來源:環球網 [環球網報道 記者 徐璐明]美國海軍稱,美軍近日出動一艘戰略導彈核潛艇進行了兩枚潛射彈道導彈的試射.美軍強調,導彈未安裝戰鬥部,試射不是對任何正在發生的事件的回應,也不是為了展示權力. ...

東芝釋出採用FC-MAMR技術的兩款18TB硬碟,分別面向桌上型電腦和NAS

東芝釋出採用FC-MAMR技術的兩款18TB硬碟,分別面向桌上型電腦和NAS
東芝釋出業界首款MAMR微波輔助磁記錄(FC-MAMR)技術的18TB硬碟,分別是面向桌上型電腦的X300系列,以及面向NAS的N300系列,這些都屬於消費級產品.東芝表示,新款18TB硬碟不僅提供了 ...

林彪提3條理由不出兵朝鮮,毛澤東仍拍板援朝,彭德懷:英明正確

林彪提3條理由不出兵朝鮮,毛澤東仍拍板援朝,彭德懷:英明正確
作者|寧鏡誠 1950年10月2日凌晨2時,一條緊急情報傳入中南海:美軍不顧中國的警告,已經悍然越過三八線. 彭德懷後來回憶說:"美軍一過三八線,我就知道不打不行了." 眾所周知, ...

大國地位要靠打,抗美援朝戰爭中國得到了什麼?收益超過了預料

大國地位要靠打,抗美援朝戰爭中國得到了什麼?收益超過了預料
沒有經歷戰火考驗的和平是不長久的. 經歷了14年的抗日戰爭,3年的解放戰爭,已經數十年的軍閥混戰,當1949年新中國成立的時候,中國人民太希望和平了.但是和平不會自己主動前來,需要自己用鮮血去爭取. ...

“絞殺戰”是這樣破產的——抗美援朝戰爭反“絞殺戰”的經驗與啟示
來源:解放軍報 作者:趙先剛 朱廣法 抗美援朝戰爭中,制約志願軍作戰的除了武器裝備落後外,後勤補給是另一個重要因素.開戰以後,以美國為首的所謂"聯合國軍"憑藉空中優勢,對志願軍運輸 ...

從《毛澤東年譜》看長津湖戰役(第二部分)

從《毛澤東年譜》看長津湖戰役(第二部分)
第二部分:9月15日美軍仁川登陸至11月27日長津湖戰役開始 9月15日,美軍仁川登陸. 美軍仁川登陸示意圖 美軍為什麼選擇仁川登陸? 此時朝鮮人民軍的主力正全力圍攻釜山包圍圈中的美軍和韓軍. 麥克阿 ...

上甘嶺戰役過後,美軍總指揮範弗裡特,為何被美國國會質詢?

上甘嶺戰役過後,美軍總指揮範弗裡特,為何被美國國會質詢?
上甘嶺戰役 上甘嶺戰役沒有發生在上甘嶺? 在抗美援朝戰爭中,上甘嶺戰役不是規模最大的,但卻是最出名的,因為這場戰鬥的慘烈程度.炮火密集程度在戰爭史上都非常罕見,此戰的勝利,打出了我軍軍威,展現了我國國 ...

長津湖之外的鏖戰:志願軍與美軍陸戰一師交鋒全景掃描(下)——朝鮮戰爭志願軍十餘次大戰“美利堅之劍”
朝鮮戰爭志願軍十餘次 大戰"美利堅之劍" 陳 輝 1950年12月16日,杜魯門總統宣佈全國進入緊急狀態,並徵召了國民警衛隊,組建了國防動員辦公室,高層人物還討論了使用原子彈對付中 ...

都是打“美械軍”,為什麼打正牌美軍,比打美械國軍難很多?

都是打“美械軍”,為什麼打正牌美軍,比打美械國軍難很多?
在抗美援朝戰爭初期的交手中,中美兩軍對於對手的認識都是很深刻的.簡而言之,我軍戰鬥力的強悍程度遠超美軍想象:但同時與美軍作戰的艱難程度,也是極為罕見的. 所以現在網上也有類似的段子,大意是將老蔣的軍隊 ...

彭德懷入朝前向毛澤東提出三個要求,為何主席沒有全部答應?

彭德懷入朝前向毛澤東提出三個要求,為何主席沒有全部答應?
1950年的朝鮮戰爭在美軍登陸仁川之後,金日成領導的朝鮮人民軍此前所取得的優勢發生了重大不利變化,十幾萬朝鮮人民軍被美軍攔腰切斷,損失慘重.急轉直下的形勢讓金日成將最後一線生機寄託在中國政府的身上. ...

志願軍如何打服美軍:衝鋒號有魔法、坑道戰無解?中國軍魂他不懂

志願軍如何打服美軍:衝鋒號有魔法、坑道戰無解?中國軍魂他不懂
志願軍跨過鴨綠江 為何越戰之中,中國警告美軍不要越過17°線,美國就能乖乖聽話? 為何有美國軍官曾說:"中國再也不是那個軟弱無能的國家,誰和他們做對,誰就是傻子!" 這都源於一場戰 ...

16歲志願軍戰士,沒費一槍一彈打下2架美軍戰機,如何做到的?

16歲志願軍戰士,沒費一槍一彈打下2架美軍戰機,如何做到的?
為了宣揚革命人物和精神,我國相繼出現了許多"抗日神劇",其中手槍打飛機.徒手撕鬼子等橋段,難免讓人感到懷疑,可在真實的戰場上,確實有一些戰士,足以讓敵人聞風喪膽. 例如人稱軍中呂布 ...

長津湖戰役,中美兩國都不願提及的血戰,被美軍認為毫無勝利希望

長津湖戰役,中美兩國都不願提及的血戰,被美軍認為毫無勝利希望
慘烈的長津湖戰役 在1950年,美軍從仁川登陸進入朝鮮半島,干預朝鮮半島的內戰.之後朝鮮一方節節敗退,退到了鴨綠江.而美軍也窮追不捨,一直到逼近鴨綠江.這對中國的主權安全造成了極大的威脅,於是我國發起 ...

9名戰士消滅400美軍!特等功臣蔡興海一戰成名,功成身退後他去哪了

9名戰士消滅400美軍!特等功臣蔡興海一戰成名,功成身退後他去哪了
自八一建軍伊始至今已有94個年頭了,這近百年的時間裡人民軍隊中浮現了無數的戰鬥英雄以及人民功臣,他們有的悍不畏死英勇殺敵憑血肉之軀打敗了數倍於己的強敵,有的開動腦筋創造性地發明了各種"土武器 ...

毛澤東的讀書學習生涯(下)
(一) 1949年中華人民共和國成立後,中國共產黨領導人民踏上了探索社會主義建設的新徵程.早在延安時,毛澤東就警示全黨要防範"本領恐慌",他說:"我們隊伍裡邊有一種恐慌, ...