sponsored links

RepNet:計算影片中的重複次數

重複過程從自然週期(例如月相或心跳和呼吸)到人工重複過程(例如在生產線或交通模式中發現的重複過程)在我們的日常生活中司空見慣。除了它們的普遍性之外,研究人員還對重複過程感興趣,因為人們可以從中梳理出各種見解。多次發生的事情背後可能有潛在的原因,或者場景中可能有可能有助於理解的逐漸變化。有時,重複過程為我們提供了明確的“動作單元”,即構成動作的語義上有意義的片段。例如,如果一個人正在切洋蔥,則動作單元是重複以產生額外切片的操作動作。這些單元可能表示更復雜的活動,並且可以讓我們在更精細的時間尺度上自動分析更多此類動作,而無需人工註釋這些單元。由於上述原因,旨在長時間觀察和理解我們的世界的感知系統將從理解一般重複的系統中受益。

在“ Counting Out Time: Class Agnostic Video Repetition Counting in the Wild ”中,我們展示了RepNet,這是一個單一模型,可以理解廣泛的重複過程,從人們鍛鍊或使用工具,到動物奔跑和鳥類扇動翅膀,鐘擺擺動,以及其他各種各樣的鐘擺。與我們之前的工作相比,我們之前的工作使用相同動作的不同影片的迴圈一致性約束來在細粒度級別理解它們,在這項工作中,我們提出了一個可以識別單個影片中重複的系統。除了這個模型,我們還發布了一個數據集來對影片中的類別無關計數進行基準測試,以及一個Colab 筆記本來執行 RepNet。

RepNet

RepNet 是一種模型,它將包含各種類(包括訓練期間未見過的)的週期性動作的影片作為輸入,並返回其中發現的重複週期。在過去透過直接比較幀中的畫素強度已經解決了重複計數的問題,但現實世界的影片具有相機運動、現場物體遮擋、嚴重的尺度差異和形式變化,這需要學習對此類噪聲不變的特徵。為此,我們以端到端的方式訓練機器學習模型,以直接估計重複的週期。該模型由三部分組成:幀編碼器、稱為時間自相似矩陣的中間表示(我們將在下面描述)和週期預測器。

首先,幀編碼器使用ResNet架構作為每幀模型來生成影片每一幀的嵌入 The ResNet選擇架構是因為它已成功用於許多影象和影片任務。透過基於 ResNet 的編碼器傳遞影片的每一幀會產生一系列嵌入。

在這一點上,我們透過將每個幀的嵌入與影片中的每個其他幀進行比較來計算時間自相似矩陣(TSM),返回一個矩陣,便於後續模組分析以計算重複次數。該過程在影片幀流中顯示了自相似性,從而實現了週期估計,如下面的影片所示。

RepNet:計算影片中的重複次數

對於每一幀,我們然後使用Transformers直接從 TSM 中的相似性序列預測重複週期和週期性(即,幀是否是週期性過程的一部分)。一旦我們有了週期,我們透過將週期段中捕獲的幀數除以週期長度來獲得每幀計數。我們總結一下以預測影片中的重複次數。

RepNet:計算影片中的重複次數

時間自相似矩陣

上面顯示的晝夜迴圈中的 TSM 示例源自具有固定週期重複的理想化場景。來自真實影片的 TSM 通常會揭示世界上迷人的結構,如下面的三個示例所示。Jumping jacks 接近於理想的固定週期的週期性動作,而相反,彈跳球的週期隨著球透過反覆彈跳而失去能量而下降。有人攪拌混凝土的影片展示了重複動作,前後一段沒有運動。這三種行為在學習到的 TSM 中是有明顯區別的,這就要求模型注意場景中的細微變化。

RepNet:計算影片中的重複次數

在 RepNet 中使用 TSM 作為中間層的一個優點是,transformer 的後續處理是在自相似空間而不是特徵空間中完成的。這鼓勵了對看不見的類的泛化。例如,由跳躍或游泳等不同動作產生的 TSM 是相似的,只要該動作以相似的速度重複。這使我們能夠在某些類上進行訓練,但期望泛化到看不見的類。

資料

訓練上述模型的一種方法是收集捕獲重複活動的大型影片資料集,並用重複次數標記它們。這方面的挑戰是雙重的。首先,它需要檢查大量影片以識別那些重複動作的影片。之後,每個影片都必須用重複動作的次數進行註釋。雖然對於某些任務,註釋者可以跳過幀(例如,將影片歸類為顯示跳躍的影片),但他們仍然需要檢視整個影片以計算執行了多少次跳躍。

我們透過引入合成數據生成過程來克服這一挑戰,該過程使用可能根本不包含重複動作的影片來生成重複影片。這是透過隨機選擇一段影片重複任意次數來實現的,由原始影片上下文預定。

RepNet:計算影片中的重複次數

雖然這個過程生成的影片類似於具有重複過程的自然影片,但對於深度學習方法來說仍然太簡單了,深度學習方法可以透過尋找偽像來學習作弊,而不是學習識別重複。為了解決這個問題,我們執行了極端的資料增強,我們稱之為相機運動增強。在這種方法中,我們修改影片以模擬攝像機,該攝像機在影片播放時使用 2D仿射運動平滑移動。

RepNet:計算影片中的重複次數

評估

儘管我們可以在合成重複影片上訓練模型,但生成的模型必須能夠推廣到重複過程的真實影片。為了評估經過訓練的模型在真實影片上的效能,我們從Kinetics 資料集收集了約 9000 個影片的資料集。由於 Youtube 上看到的資料的多樣性,這些影片跨越了許多動作類並捕捉了不同的場景。我們用影片中重複的動作計數來註釋這些影片。為了鼓勵該領域的進一步研究,我們釋出了這個資料集的計數註釋,我們稱之為Countix。

應用

與類別無關的計數模型有許多有用的應用。RepNet 作為一個單一模型,可以計算來自許多不同領域的重複:

RepNet:計算影片中的重複次數

RepNet 可用於估計來自超聲心動圖影片的心跳率,即使它在訓練中沒有看到此類影片:

RepNet:計算影片中的重複次數

RepNet 還可用於監控重複活動的速度變化。下面我們將展示如何將此類速度變化也用於其他質量或過程控制設定。

RepNet:計算影片中的重複次數

RepNet:計算影片中的重複次數

RepNet:計算影片中的重複次數

分類: 科學
時間: 2021-09-20

相關文章

田亮已秘密生三胎?影片中驚現戴肚兜小孩,顏值被指不及森碟

田亮已秘密生三胎?影片中驚現戴肚兜小孩,顏值被指不及森碟
提及冠軍田亮,相信大家都不陌生吧,作為昔日的跳水運動員,他自退役之後便轉戰娛樂圈,目前不僅事業發展順利,同時與妻子葉一茜還有兩個子女的生活,過得也相當幸福.日常生活中的他,其實也十分喜歡曬孩子的動態, ...

華映資本章高男:量子計算競爭中大國無法掉隊
10月13日,在介面新聞主辦的首屆REAL科技大會上,華映資本主管合夥人章高男在解釋量子疊加.量子糾纏.量子塌縮等概念時表示,量子計算不是國產替代,而是對未來的卡位,大國無法掉隊.

訓練量:次數和組數

訓練量:次數和組數
訓練量:次數和組數 在抗阻訓練中,訓練量有兩種不同的定義:一次訓練中的負荷總量(也就是總次數乘以負荷重量)或一次訓練中完成的總次數(也就是每組運動的次數乘以組數).儘管前面的部分提供了安排運動次數的指 ...

谷歌釋出Omnimattes分層神經網路生成遮罩的新方法,製作影片利器

谷歌釋出Omnimattes分層神經網路生成遮罩的新方法,製作影片利器
影象和影片編輯操作通常依賴於準確的遮罩--定義前景和背景之間分離的影象.雖然最近的計算機視覺技術可以為自然影象和影片生成高質量的遮罩,允許現實世界的應用程式,例如生成合成景深.編輯和合成影象或從影象中 ...

臀肌訓練中,如何避免疼痛和損傷?(上)
就臀肌而言,任何脊椎或下肢損傷都會導致一定程度的臀肌抑制(活性和收縮能力減弱),甚至會導致腳趾和踝關節扭傷.道理大家都明白,如果想讓臀肌獲得最大效率,最好在訓練時就避免疼痛和損傷. 總之,使用較標準的 ...

9位被中視協認可的“德藝雙馨”明星,個個都是演技派,最小37歲

9位被中視協認可的“德藝雙馨”明星,個個都是演技派,最小37歲
流量藝人的紛紛"塌房"讓明星們集體失去了公信力,現如今追星也成了一個值得思考的問題,而最近中視協演工委向廣大演員群體發出了倡議,影片中出鏡了9位成員,個個都是德藝雙馨的明星藝人,老 ...

短影片裡的古籍修復

短影片裡的古籍修復
#85後女孩修古籍走紅抖音# 必須一直有人在修復才能儲存這種獨門手藝,一旦斷掉手藝就會消失. 短影片中展示了古籍文獻修復細節.圖/受訪者提供 本刊實習記者/馬銘澤 古籍修復師廉成春的工作室坐落在京郊一 ...

洗衣機攪動虐狗影片瘋傳:畜生不如
01 前段時間,一段"柯基被丟進轉動洗衣機旋轉"的虐狗影片在全網瘋傳,引發了無數網友的關注和熱議. 從影片裡可以看到,狗狗一遍遍掙扎著想要逃出這個可怕的"牢籠" ...

“老幹部”廖京生的坎坷成名史,和他生命中深愛的一個女人

“老幹部”廖京生的坎坷成名史,和他生命中深愛的一個女人
娛樂圈演技好的演員不少,可塑性強的演員更多,但是要說到從業近四十年,一生只演一類角色且從無緋聞的,恐怕只有一人,他就是娛樂圈"老幹部"廖京生(這個靳東.霍建華.張藝興都得點頭稱是) ...

一週熱賣18.7w單,抖音影片櫥窗帶貨又出爆單新招?

一週熱賣18.7w單,抖音影片櫥窗帶貨又出爆單新招?
最近抖音上有哪些熱賣好貨?又有哪些爆品推廣的方式可以學習? 飛瓜資料統計了9月6日-9月12日的抖音商品榜:諾特蘭德多維維生素片 .美白淡斑多肽蛋白麵膜.FV遮瑕保溼隔離BB霜 登上榜單top3. 要 ...

抗美援朝中俘虜的美國最高將軍:中國惹不起,碰不得,了不起

抗美援朝中俘虜的美國最高將軍:中國惹不起,碰不得,了不起
威廉·迪安,美軍精銳部隊第24師少將師長,中國人聽說過這個人的名頭大部分應該是在抗美援朝的戰場上,但是實際上,在抗美援朝之前,迪安少將的名頭就已經被全世界的人民所熟知了. 威廉·迪安 因為抗美援朝發生 ...

哪款iPhone 13更適合你?蘋果釋出長影片進行詳細介紹

哪款iPhone 13更適合你?蘋果釋出長影片進行詳細介紹
蘋果釋出了一個時長 7 分半的介紹影片,能夠讓你知道四款 iPhone 13 手機哪款更適合你.在這段影片中,蘋果還介紹了手機的一些新影片和相機功能,如電影模式.攝影風格和微距攝影,並強調了手機的電池 ...

朱廣權錄影片笑場忘詞!靠康輝身上說對不起,遭撒貝南搞怪翻白眼

朱廣權錄影片笑場忘詞!靠康輝身上說對不起,遭撒貝南搞怪翻白眼
近日,有官方媒體釋出一段影片,影片裡央視boys再次合體亮相,為觀眾送上最真誠的中秋祝福,四個人笑料不斷引得網友捧腹大笑. 影片中,康輝.撒貝南.尼格買提和朱廣權統一留著利落清爽的短髮,穿著熨燙工整的 ...

中日釣魚島爆發對峙?日右翼登島被中方驅離,日方叫囂將以艦還艦

中日釣魚島爆發對峙?日右翼登島被中方驅離,日方叫囂將以艦還艦
#日本右翼議員衝擊釣魚島#據央視網9月16日訊息,日前數名日本右翼分子駕船企圖強登中國固有領土釣魚島,隨後中方海上執法力量將之在釣魚島領海外圍驅離,但不依不饒的日本保安廳出動至少12艘巡邏艦炮艇與中方 ...

戚薇曬高甜影片,跟李承鉉各種擁抱一改高冷形象,戚哥太會了

戚薇曬高甜影片,跟李承鉉各種擁抱一改高冷形象,戚哥太會了
戚薇曬高甜影片,跟李承鉉各種擁抱一改高冷形象,戚哥太會了! 說起戚薇和李承鉉相信大家都不陌生,戚薇近兩年在圈內的發展很不錯,有一小部分功勞也是李承鉉的,當時戚薇生完女兒之後,身體修養好就回歸工作,都是 ...

張檬金恩聖公開後人氣下降,拍非主流土味影片,直播帶貨一言難盡

張檬金恩聖公開後人氣下降,拍非主流土味影片,直播帶貨一言難盡
相信很多的網友對於曾經在內地娛樂圈爆火的男團至上勵合一定不陌生吧,這一個男團既有中國成員,又有韓國成員的配置,確實是非常的強大了,而這一個組合才出道之後憑藉著一雙<棉花糖>火遍全國上下.不 ...

計算卡路里如何成為一門科學

計算卡路里如何成為一門科學
熱量計定義了食物的營養價值和蒸汽發生器的輸出 新年的到來開啟了我的新嘗試,嘗試吃什麼才能使小蠻腰更加苗條,我的這一想法自然而然地轉向如何計算卡路里,於此同時迷戀上了威爾伯*阿特沃特. 正是阿特沃特向美 ...

1923年天空之牆分開海洋影片,真是人類乾的?不會是外星人吧?

1923年天空之牆分開海洋影片,真是人類乾的?不會是外星人吧?
本文完整影片:天空之牆,是真是假? 這是一段1923年拍攝的影片,你可能會覺得匪夷所思,這真的是人類乾的嗎?不會是外星人吧?這影片究竟是真的還是假的,1923年就能拍影片了?這還是在天上拍的,真叫人難 ...

中秋將至!LPL美女主持、解說曬照!誰是你心目中的女神?

中秋將至!LPL美女主持、解說曬照!誰是你心目中的女神?
中秋節,又稱祭月節.月亮節.團圓節等,與春節.端午節.清明節並稱為中國四大傳統節日.中秋節源自天象崇拜,由上古時代秋夕祭月演變而來.中秋節自古便有祭月.賞月.吃月餅.玩花燈.賞桂花.飲桂花酒等民俗,流 ...