sponsored links

谷歌釋出Omnimattes分層神經網路生成遮罩的新方法,製作影片利器

影象和影片編輯操作通常依賴於準確的遮罩——定義前景和背景之間分離的影象。雖然最近的計算機視覺技術可以為自然影象和影片生成高質量的遮罩,允許現實世界的應用程式,例如生成合成景深、編輯和合成影象或從影象中刪除背景,但缺少一個基本部分:主體可能產生的各種場景效果,如陰影、反射或煙霧,通常會被忽視。

谷歌釋出Omnimattes分層神經網路生成遮罩的新方法,製作影片利器

在CVPR 2021 上發表的“ Omnimatte:關聯物件及其在影片中的效果”中,Google描述了一種新的遮罩生成方法,該方法利用分層神經渲染將影片分成稱為Omnimatte的層,其中不僅包括主題,還包括所有在場景中與它們相關的效果。典型的最先進的分割模型為場景中的主體(例如人和狗)提取蒙版,而此處提出的方法可以隔離和提取與主體相關的其他細節,例如投射在地面。

谷歌釋出Omnimattes分層神經網路生成遮罩的新方法,製作影片利器

谷歌釋出Omnimattes分層神經網路生成遮罩的新方法,製作影片利器

最先進的分割網路(例如,MaskRCNN)採用輸入影片(左)併為人和動物(中)生成合理的面具,但錯過了它們的相關效果。Google的方法產生的遮罩不僅包括主體,還包括他們的陰影(右圖;人和狗的單獨通道被視覺化為藍色和綠色)。

同樣與分割蒙版不同的是,omnimattes 可以捕捉部分透明的柔和效果,例如反射、飛濺或輪胎煙霧。與傳統遮罩一樣,omnimattes 是RGBA 影象,可以使用廣泛可用的影象或影片編輯工具進行處理,並且可以在使用傳統遮罩的任何地方使用,例如,將文字插入煙跡下方的影片中。

影片的分層分解

為了生成全能圖,Google將輸入影片分成一組層:一個層用於每個移動的物件,一個附加層用於靜止的背景物件。在下面的示例中,人的一層,狗的一層,背景的一層。當使用傳統的alpha 混合合併在一起時,這些層會再現輸入影片。

除了再現影片外,分解還必須在每一層捕捉正確的效果。例如,如果人的影子出現在狗的圖層中,合併後的圖層仍然會重現輸入的影片,但是在人和狗之間插入額外的元素會產生明顯的錯誤。挑戰在於找到一個分解,其中每個主題的層僅捕獲該主題的效果,從而產生真正的全能。

谷歌釋出Omnimattes分層神經網路生成遮罩的新方法,製作影片利器

Google的解決方案是應用Google之前開發的分層神經渲染方法來訓練卷積神經網路(CNN) 以將主體的分割掩碼和背景噪聲影象對映到一個全圖。由於其結構,CNN 自然傾向於學習影象效果之間的相關性,並且效果之間的相關性越強,CNN 就越容易學習。例如,在上面的影片中,人與其影子以及狗與其影子之間的空間關係在他們從右向左行走時保持相似。在關係之間的變化更大(因此,相關性較弱)的人與狗的影子,或者狗和人的影子. CNN 首先學習更強的相關性,從而導致正確的分解。

下面詳細展示了omnimatte系統。在預處理中,使用者選擇主題併為每個主題指定一個層。使用現成的分割網路(例如MaskRCNN)提取每個物件的分割掩碼,並使用標準相機穩定工具找到相對於背景的相機變換。隨機噪聲影象在背景參考幀中定義,並使用相機變換進行取樣以生成每幀噪聲影象。噪聲影象提供隨機但隨時間持續跟蹤背景的影象特徵,為 CNN 學習重建背景顏色提供自然輸入。

谷歌釋出Omnimattes分層神經網路生成遮罩的新方法,製作影片利器

渲染 CNN 將分割掩碼和每幀噪聲影象作為輸入,並生成 RGB 彩色影象和 alpha 對映,它們捕獲每一層的透明度。這些輸出使用的是傳統的 alpha 混合來合併以生成輸出幀。CNN 從頭開始??訓練,透過查詢掩碼中未捕獲的效果(例如,陰影、反射或煙霧)並將其與給定的前景層相關聯來重建輸入幀,並確保主體的 alpha 大致包括分割掩碼。為了確保前景層只捕獲前景元素而沒有固定背景,還對前景 alpha 應用了稀疏損失。

為每個影片訓練一個新的渲染網路。由於網路只需要重建單個輸入影片,因此除了分離每個主題的效果外,它還能夠捕獲精細結構和快速運動,如下所示。在步行示例中,omnimatte 包括投在公園長椅板條上的陰影。在網球示例中,捕捉到了細小的陰影甚至網球。在足球示例中,球員和球的陰影被分解為適當的層(當球員的腳被球擋住時會出現輕微的錯誤)。

這個基本模型已經執行良好,但可以透過使用額外的緩衝區(如光流或紋理座標)增加 CNN 的輸入來改善結果。

谷歌釋出Omnimattes分層神經網路生成遮罩的新方法,製作影片利器

應用程式

一旦生成了omnimattes,如何使用它們?如上所示,Google可以刪除物件,只需從組合中刪除它們的圖層即可。Google還可以透過在合成中重複物件層來複制物件。在下面的例子中,影片被“展開”成全景圖,馬被多次複製以產生頻閃的照片效果。請注意,馬投在地面和障礙物上的陰影被正確捕獲。

一個更微妙但功能更強大的應用是重定時主題。時間的操縱在電影中被廣泛使用,但通常需要為每個主題和受控的拍攝環境單獨拍攝。分解為omnimattes 使日常影片的重新定時效果成為可能,只需使用後處理,只需獨立更改每一層的播放速率即可。由於Omnimattes 是標準的RGBA 影象,因此可以使用傳統的影片編輯軟體來完成這種重新定時編輯。

下面的影片被分解成三層,每個孩子一層。孩子們最初的、不同步的跳躍透過簡單地調整他們的圖層的播放速率來對齊,為水中的飛濺和反射產生逼真的重新定時。

谷歌釋出Omnimattes分層神經網路生成遮罩的新方法,製作影片利器

在原始影片(左)中,每個孩子在不同的時間跳躍。編輯完(右),大家一起跳。

重要的是要考慮到任何處理影象的新技術都應該負責任地開發和應用,因為它可能被濫用來產生虛假或誤導性資訊。Google的技術是根據Google的AI 原則開發的,只允許重新排列影片中已經存在的內容,但即使是簡單的重新排列也可以顯著改變影片的效果,如這些示例所示。研究人員應該意識到這些風險。

谷歌釋出Omnimattes分層神經網路生成遮罩的新方法,製作影片利器

谷歌釋出Omnimattes分層神經網路生成遮罩的新方法,製作影片利器

谷歌釋出Omnimattes分層神經網路生成遮罩的新方法,製作影片利器

有許多令人興奮的方向可以提高omnimattes 的質量。在實用層面上,該系統目前僅支援可以建模為全景圖的背景,其中相機的位置是固定的。當相機位置移動時,全景模型無法準確捕捉整個背景,一些背景元素可能會雜亂前景層(有時在上圖中可見)。處理完全通用的相機運動,例如穿過房間或走在街上,需要 3D 背景模型。在存在移動物體和效果的情況下重建 3D 場景仍然是一項艱鉅的研究挑戰,但最近取得了令人鼓舞的進展。

在理論層面上,CNNs 學習相關性的能力是強大的,但仍然有些神秘,並且並不總是導致預期的層分解。雖然Google的系統允許在自動結果不完美時進行手動編輯,但更好的解決方案是充分了解 CNN 學習影象相關性的能力和侷限性。這種理解可能會導致改進去噪、修復和除層分解之外的許多其他影片編輯應用程式。

谷歌釋出Omnimattes分層神經網路生成遮罩的新方法,製作影片利器

分類: 科技
時間: 2021-09-20

相關文章

科學家發明從幹細胞生成人類軟骨組織的新方法

科學家發明從幹細胞生成人類軟骨組織的新方法
據外媒報道,南安普頓大學的研究人員發明了一種從幹細胞生成人類軟骨組織的新方法.這項技術可以為開發一種亟需的新療法鋪平道路,以治療軟骨損傷. 軟骨在關節中起著減震器的作用,但它很容易因日常磨損或運動傷害 ...

神經網路學習預測蛋白「分子機器」的運動

神經網路學習預測蛋白「分子機器」的運動
編輯 | 橘子皮 來自美國莫格里奇研究所的 Timothy Grant 發表觀點文章,評論<Nature Methods>上的兩項蛋白質分子動力學方面的研究,並表示新的計算方法從冷凍電鏡影 ...

哪款iPhone 13更適合你?蘋果釋出長影片進行詳細介紹

哪款iPhone 13更適合你?蘋果釋出長影片進行詳細介紹
蘋果釋出了一個時長 7 分半的介紹影片,能夠讓你知道四款 iPhone 13 手機哪款更適合你.在這段影片中,蘋果還介紹了手機的一些新影片和相機功能,如電影模式.攝影風格和微距攝影,並強調了手機的電池 ...

新機接連發布,行業迎來攪局,這三款手機目前都很值得買

新機接連發布,行業迎來攪局,這三款手機目前都很值得買
手機行業的更新迭代向來快如閃電,剛剛購入的手機還沒捂熱乎,就有更新更好的替代品出現,同時老的機型也開始讓利降價開始清倉.就在近兩個月就上市了多款機型,隨著新機接連的釋出,手機行業也迎來了新的攪局,而這 ...

情報站 | 索尼A7IV可以拍攝4K/60P 70200GM二代後天釋出

情報站 | 索尼A7IV可以拍攝4K/60P 70200GM二代後天釋出
- 熱門器材資訊傳聞速報 - 索尼A7IV的4K/60P為s35模式 據最新訊息,索尼A7IV 可以錄製 4K/60P影片,s35mm剪裁模式 . 索尼 A7IV 傳聞規格: 10月21日釋出(如果晶 ...

別再匯入原聲給影片配音了!學會這兩招,一分鐘將文字生成語音

別再匯入原聲給影片配音了!學會這兩招,一分鐘將文字生成語音
作為自媒體人來講,每次在製作影片後都需要再錄音去匯入原聲,不得不說感覺非常的麻煩,不知道大家有沒有同樣的感覺! 今天就教大家兩個我常用的方法,擺脫匯入原聲的步驟,只需一分鐘就可以將文字生成語音,方法簡 ...

特斯拉釋出最新碰撞技術,0.01秒內做判斷,可定向開啟氣囊

特斯拉釋出最新碰撞技術,0.01秒內做判斷,可定向開啟氣囊
車東西(公眾號:chedongxi) 作者 |昊晗 編輯 | Juice 車東西10月13日訊息,特斯拉在其官方Youtube賬號上釋出了一段在其實驗室進行碰撞測試的影片,並在影片中介紹了特斯拉最新的 ...

致敬“四川百年百傑科學家”⑥ |“侯氏制鹼法”創始人侯德榜:他用堅持解開了純鹼的秘密

致敬“四川百年百傑科學家”⑥ |“侯氏制鹼法”創始人侯德榜:他用堅持解開了純鹼的秘密
來源:四川日報-川觀新聞 人物名片 侯德榜(1890-1974),男,福建閩侯人,中共黨員,著名化工專家,"侯氏制鹼法"創始人,中國近代化學工業的奠基人之一,1955年受聘為中國科 ...

我們最近在洪水預報方面的改進背後的技術

我們最近在洪水預報方面的改進背後的技術
洪水是地球上最常見的自然災害,影響著全球數億人的生活,每年造成約 100 億美元的損失.在我們往年工作的基礎上,本週早些時候,我們宣佈了我們最近為改進印度和孟加拉國洪水預報所做的一些努力,將覆蓋範圍擴 ...

「Science」癌細胞還有什麼狡猾的手段來逃脫免疫系統?科學家帶你一探究竟

「Science」癌細胞還有什麼狡猾的手段來逃脫免疫系統?科學家帶你一探究竟
本文為轉化醫學網原創,轉載請註明出處 作者:Tiffany 導讀:事實上,人的身體裡每天都有腫瘤細胞產生,可能有100萬個以上,但與生俱來的免疫系統會形成一種防禦和保護機制,這個系統就像體內的軍隊一樣 ...

算力大爆炸:萬億個!演算法複雜度已超越人腦神經元數量

算力大爆炸:萬億個!演算法複雜度已超越人腦神經元數量
圖攝:Pixabay 30秒快讀 1.即便不進行微縮,技術革新仍然能讓晶片的效能提升50到500倍,甚至1000倍. 2.超過萬億演算法引數的模型已經誕生,已經超過了曾被認為最複雜的人腦神經元結構. ...

日本還有六大領先的技術

日本還有六大領先的技術
一.光觸媒技術 光觸媒也叫光催化劑,起源及發展於日本.上世紀80年代起,光觸媒風風火火的應用在各個建築上,從醫院的瓷磚,地板構成無菌室,大廈的玻璃牆面外表潔淨,一直到植物棚的降溫,光觸媒作為" ...

中國AI荊棘之路,從荒蠻到繁榮

中國AI荊棘之路,從荒蠻到繁榮
歡迎星標關注,在這裡抽刀斷水,看清水面下的科技商業暗流. 科技之樹雖然碩果累累,但它的蘋果從來只會眷顧有足夠渴望與準備的人.--水哥 科技並不是勻速發展,而是在經歷緩慢得讓人窒息的.壓抑的黑鐵時代,不 ...

watchOS 8正式釋出:新的騎行與健康功能以及全新錶盤

watchOS 8正式釋出:新的騎行與健康功能以及全新錶盤
watchOS 8 今日正式釋出,Apple Watch 使用者迎來新的騎行與健康功能.全新錶盤.錢包 app 提供的更多訪問途徑和重新設計的家庭 app. 蘋果今日釋出 watchOS 8,推出強大 ...

誓要統一智慧家居“江湖”的Matter標準,為何遲遲沒有進展?

誓要統一智慧家居“江湖”的Matter標準,為何遲遲沒有進展?
物聯網智庫 原創 作者:Ada 轉載請註明來源和出處 導 讀 CHIP協議雖然在5月通過了首個正式版規範並更名為Matter,但並無過多的實質性進展,連線標準聯盟(CSA)更是於今年8月釋出公告稱,將 ...

Oculus Quest Pro控制器曝光:配備3個攝像頭,追蹤環被取消

Oculus Quest Pro控制器曝光:配備3個攝像頭,追蹤環被取消
在圖片分享網站imgur上釋出的兩張截圖顯示,新的Oculus控制器取消了追蹤環,配備了攝像頭. 從第一張圖片中的使用者介面可以看出,這些圖片似乎來自Facebook Workplace視訊會議,這也 ...

Android 12 正式版已推送,各大品牌首批適配升級機型公佈

Android 12 正式版已推送,各大品牌首批適配升級機型公佈
近日,谷歌釋出了最新的 Android 12 正式版系統,並宣佈正式將原始碼推送到 Android 開源專案 (AOSP).Android 12優化了觸發問題,雙擊背面手勢可以擷取螢幕截圖.召喚谷歌A ...

虛擬走進未來?丨人工智慧如何打造未來之城

虛擬走進未來?丨人工智慧如何打造未來之城
近日,著名科技公司 Space 株式會社最近發起了一次眾籌,旨在利用衛星資料和人工智慧自動生成虛擬空間.Space 計劃釋出由人工智慧自動生成的地球各區域的3D模型,並將在2022年7月將向公眾開放其 ...

Android 12目前存在諸多BUG 普通使用者謹慎更新

Android 12目前存在諸多BUG 普通使用者謹慎更新
中關村線上訊息:10月5日,谷歌釋出了Android 12手機作業系統,谷歌為其引入了全新的設計語言,系統觀感更為美觀,同時也讓使用者在設定方面更加自主.另外,Android 12優化了程式的啟動時間 ...