sponsored links

AI 演算法在影片可分級編碼中的應用

主要包括五部分內容:三種常用的可分級影片編碼的特點;WebRTC 採用的編碼器及其應用方式;可分級編碼在 WebRTC 中的應用現狀;基於可分級編碼的目標檢測和位元速率分配方式;AI 和可分級編碼結合的應用前景和研究方向。【融雲全球網際網路通訊雲

三種常用可分級影片編碼的特點

影片影象經過數字化之後資料量非常大,現有的網路和儲存裝置無法直接儲存原始的影片影象,必須對影片和影象進行壓縮,現有的主流壓縮影片演算法為 H.264,VP8,VP9,HEVC,VVC 等。一方面,從 H.264 到 VVC,編碼複雜度越來越高,壓縮效率也越來越高;另一方面,傳輸的網路頻寬大小不一,且隨時變化,單一的碼流無法適應多種不同接收端的網路和裝置環境。比如 4G 網路和 5G 網路傳輸頻寬不一樣,若在 4G 和 5G 網路中傳輸同一套碼流,有可能會導致 5G 網路頻寬沒有充分利用,最終影響影片的觀看效果。

現在影片應用的環境存在多個不同的接收端,解決這個問題可以採用以下兩種技術:聯播(Simulcast)和可分級影片編碼(SVC)。

如圖 1 所示,聯播 Simulcast 即同時傳輸多路碼流,不同的碼流具有不同的位元速率,用以傳輸在不同頻寬下的碼流。當終端裝置處於高頻寬的網路環境中,可以傳輸高位元速率的影片,以便獲得更好的影片觀看體驗;當終端裝置處於低頻寬的網路環境中,可以傳輸低位元速率的影片,以便減少影片播放卡頓的現象。但是 Simulcast 支援的位元速率種類是有限的,難以適應複雜的網路環境。針對這個問題,研究人員提出了可分級影片編碼 SVC,影片資料只壓縮一次,卻能以多個幀率、空間解析度或影片質量進行解碼。比如採用三層空域可分級和兩層時域可分級,可以組合的模式達到六種,和 Simulcast 方式相比,系統的適應性得到很大提升。

AI 演算法在影片可分級編碼中的應用

(圖1 聯播&可分級)

常用的可分級編碼有三種,分別是:空域可分級(Spatial Scalability)、質量可分級(Quality Scalability)和時域可分級(Temporal Scalability)。

AI 演算法在影片可分級編碼中的應用

(圖2 可分級編碼常用的三種方式)

空域可分級編碼(圖 3 ),即對影片中的每幀影象產生多個不同空間解析度的影象,解碼基本層碼流得到的低解析度影象,如果加入增強層碼流到解碼器,得到的是高解析度影象。

AI 演算法在影片可分級編碼中的應用

(圖3 空域可分級)

質量可分級(圖 4 ),一個可行的做法是,基本層碼流編碼這一路對原始影象 DCT 變換後進行一次粗糙量化,熵編碼後形成基本層碼流。粗糙量化後的資料經反量化後形成基本層係數,與原始影象 DCT 變換系數相減形成差值訊號,再對此差值訊號再進行一次細量化和熵編碼生成增強層碼流。

AI 演算法在影片可分級編碼中的應用

(圖4 質量可分級)

時域可分級(圖 5),即把影片序列不重疊地分割成多層,對基本層的幀進行普通的影片編碼,提供具有基本時間解析度的基本層碼流;對增強層則是利用基本層資料對增強層的幀間預測編碼,生成增強層資料。

AI 演算法在影片可分級編碼中的應用

(圖5 時域可分級)

WebRTC 採用的編碼器及其應用方式

WebRTC 支援的編碼器包括 VP8,VP9 和 H.264。在使用者感受層面, VP8 和 H.264 兩種編碼器的效果基本上是類似的。VP9 作為 VP8 的下一代編碼器,在高畫質影片壓縮方面,比 VP8 和 H.264 效果要好。

如圖 6,綜合編碼器效能和瀏覽器編碼器的支援情況,可以得出如下結論:VP8 和 H.264編碼效果基本一致,一般情況下兩者皆可;VP9 主要用在 Google 公司自己的各種影片產品中,其中需要特別指出的是,VP9 支援多種 SVC ;HEVC 目前只能在蘋果系統中使用,無法推廣,不建議使用;AV1 同樣太新了,僅僅在 Google 公司的產品中才能很好地支援,暫時不推薦。

AI 演算法在影片可分級編碼中的應用

(圖6 編碼器在瀏覽器中的支援情況)

可分級編碼在 WebRTC 中的應用現狀

在介紹可分級編碼在 WebRTC 中的應用情況之前,先簡要介紹下 WebRTC 的通訊和組網流程。

如圖 7,客戶端 A 和客戶端 B 通訊,可以採用直連的模式,也可以採用伺服器的模式,在大規模的網路中,都會採用基於伺服器的模式進行轉發、訊號處理等。

AI 演算法在影片可分級編碼中的應用

(圖7 WebRTC 簡單的流程)

針對多種應用場景具有多個接收端的特點,WebRTC 提供了三種解決方案:Mesh,MCU,SFU。

Mesh 方案(圖 8),即多個終端之間兩兩進行連線,形成一個網狀結構。比如 A、B、C 三個終端進行多對多通訊,當 A 想要共享媒體(如音訊、影片)時,它需要分別向 B 和 C 傳送資料。同樣的道理,B 想要共享媒體,就需要分別向 A、C 傳送資料,依此類推。這種方案對各終端的頻寬要求比較高。

AI 演算法在影片可分級編碼中的應用

(圖8 Mesh 方案)

MCU(Multipoint Conferencing Unit)方案(圖 9),該方案由一個伺服器和多個終端組成一個星形結構。各終端將自己要共享的音影片流傳送給伺服器,伺服器端會將在同一個房間中的所有終端的音影片流進行混合,最終生成一個混合後的音影片流再發給各個終端,這樣各終端就可以看到/聽到其他終端的音影片了。實際上伺服器端就是一個音影片混合器,這種方案伺服器的壓力會非常大。

AI 演算法在影片可分級編碼中的應用

(圖9 MCU 方案)

SFU(Selective Forwarding Unit)方案(圖 10),該方案也是由一個伺服器和多個終端組成,但與 MCU 不同的是,SFU 不對音影片進行混流,收到某個終端共享的音影片流後,就直接將該音影片流轉發給房間內的其他終端。

AI 演算法在影片可分級編碼中的應用

(圖10 SFU 方案)

三種網路不同的頻寬如圖 11 所示。可以看出,SFU 的頻寬最大達到了 25mbps,MCU 最小 10mbps。

AI 演算法在影片可分級編碼中的應用

(圖11 三種不同網路的頻寬)

在特點方面,Mesh 方案的靈活性比較差;MCU 方案需要對碼流進行類似轉碼、合流、分流等操作;SFU 方案伺服器的壓力小,靈活性更好,受到廣泛歡迎。

如圖 12 為 Simulcast 模式和 SVC 模式轉發方式示意圖。從上下兩個圖可以看出,採用基於 SVC 的碼流分配方式,對於 PC 端而言,具有更大的可修改性。無論採用哪種組網方式,採用 SVC 的方式,都會比採用 Simulcast 的方式具有更好的健壯性。

AI 演算法在影片可分級編碼中的應用

(圖12 Simulcast 和 SVC 模式轉發方式)

支援情況如圖 13 所示。從圖中可以看出,H.264 僅支援 Simulcast,VP8 支援時域可分級,VP9 則全方位支援 SVC 編碼。VP9 是 Google 公司在主推的編解碼器,但是在 H.264 編解碼器最佳化方面的推進力度不大,一定程度上限制了 WebRTC 的應用,比如蘋果公司最新出品的 iPhone13 手機自帶 H.264 的硬體加速功能,如果採用 AV1 編碼器,雖然可以獲得 SVC 的優點,但是無法進行硬體解碼。在 WebRTC 中,Simulcast 是預設透過多執行緒技術,同時啟動多個 OpenH264 編碼器, SVC 則是可以呼叫 OpenH264 進行時域和空域可分級編碼。

AI 演算法在影片可分級編碼中的應用

(圖13 可分級編碼在 WebRTC 的支援情況)

基於可分級編碼的目標檢測和位元速率分配方案

對於 N 路的 SFU 而言,SFU 必須考慮剩餘 N-1 個終端位元速率總和。對於大多數視訊會議而言,在給定的時域和空域層條件下的位元速率和總位元速率比例基本恆定。如圖 14 所示。

AI 演算法在影片可分級編碼中的應用

(圖14 不同層碼流分佈圖)

根據圖 14 的現象,將影片運動作為一個主要是衡量指標,對碼流進行分配。相關論文具體的方案框架如圖 15 所示。

AI 演算法在影片可分級編碼中的應用

(圖15 SVC 編碼器位元速率分配)

該方案存在兩個改進空間:第一個是運動量度的方法採用的當前幀和前一幀的差,難以準確地反映出影片運動變化的情況。第二個是增加除了運動特徵以外的其他特徵,以便更好地反映影象影片的變化。擬採用的解決方案如圖 16 所示。

AI 演算法在影片可分級編碼中的應用

(圖16 擬採用的解決方案)

在 WebRTC 中,H.264 的編碼器採用思科公司開源的 OpenH264 編碼器,OpenH264 可分級編碼配置檔案展示如下。這個配置檔案設定了時域分級層兩層。

AI 演算法在影片可分級編碼中的應用

(圖17 OpenH264 可分級編碼配置檔案)

SVC 碼流的特點是一套碼流具有多層結構,在實際使用中,需要對碼流進行提取操作。對於時域可分級而言,透過分析每個 NAL 中的 Temporal ID 對碼流進行提取;對於空域可分級而言,透過分析每個 NAL 中的 Spatial ID 對碼流進行提取;對於質量可分級而言,透過分析每個 NAL 中的 Quality ID 對碼流進行提取。

從圖 18 中可以看出,OpenH264 的基本層的碼流可以直接採用 AVC 解碼器解碼,基本層的 SVC_extension_flag 等於1。

AI 演算法在影片可分級編碼中的應用

(圖18 可分級編碼基本層解碼圖)

SVC 增強層碼流的 NAL 包含 SVC 的語法,需要對 SVC 的碼流進行轉碼,可分級編碼的參考軟體 JSVM 中有專門的轉碼模組,圖 19 為轉碼過程,可以發現多個 NAL 單元被重寫成 AVC 的格式。

AI 演算法在影片可分級編碼中的應用

(圖19 可分級編碼增強層 NAL 層轉碼)

圖 20 為用 JSVM 轉換之後的碼流解碼效果,可以用標準的 AVC 解碼器解碼。

AI 演算法在影片可分級編碼中的應用

(圖20 NAL 層轉碼後的解碼圖)

AI 和可分級編碼結合的應用前景和研究方向

可分級編碼中最頻繁使用的方法是空域可分級技術,但是不同解析度在轉換時,質量下降比較明顯。ICME2020 會議上,有學者提出了用於影片編碼的超分辨模型,該模型透過提取不同時刻的影象進行特徵融合來重建出高解析度影象。實驗結果表明,超分效果有提升。

AI 演算法在影片可分級編碼中的應用

(圖21 影片超解析度結構圖)

將該模型用於可分級編碼器中,可以有效地改善不同解析度碼流切換的時候,給人帶來的不適感。

MPEG5 提出了 Low Complexity Enhancement Video Coding(LCEVC),該編碼方式和 H.264 相比,在相同的 PSNR 下,壓縮效率更高。編碼器如圖 22 所示。其中基本的編碼器 Base Encoder 可以選用任意一種現成的編碼器,比如 H.264,VP8,VP9 等。

WebRTC 和 LCEVC 相互結合,是未來的一個發展方向。作為一個新的影片編碼標準,其具有幾個特徵:提升了基本層編碼的壓縮能力,具有低編碼和解碼複雜度,提供了一個額外的特徵增強平臺等。

從圖 22 可以看出,編碼複雜度主要在取決於 Base Encoder,在 WebRTC 中廣泛使用的 H.264 如果採用 LCEVC 的方式進行增強,在複雜度增加的情況下,編碼效果會有明顯地提升。一般而言採用 H.264 編碼的 1080P 高幀率的實時體育影片流需要 8Mbps 的最高位元速率,而採用 LCEVC 僅僅需要 4.8Mbps。

AI 演算法在影片可分級編碼中的應用

(圖22 LCEVC 編碼器)

鑑於 LCEVC 編碼的效果,可以判斷,LCEVC 和 WebRTC 結合,將是一個重要的研究和應用方向。

分類: 國際
時間: 2021-10-31

相關文章

泰王為愛妃放狗咬親妹?約旦上演宮斗大戲,迪拜酋長綁架自己女兒

泰王為愛妃放狗咬親妹?約旦上演宮斗大戲,迪拜酋長綁架自己女兒
說到宮鬥戲或許很多人都覺得這都是上世紀或者19世紀的事情了,但是那些不肯放權的王室依舊掌握著軍政大權,他們依舊有著"權力之爭",而宮鬥戲也成為他們日常生活中的場家常便飯. &quo ...

上海解放後槍決的第一個犯人:殺妻殺子,手段殘忍,令人觸目驚心

上海解放後槍決的第一個犯人:殺妻殺子,手段殘忍,令人觸目驚心
提籃橋監獄是位於上海的一座著名監獄,這座監獄始建於1903年,因其規模宏大,歷史悠久,而被稱為"遠東第一監獄". 2013年,提籃橋監獄在其建成110年後被正式關閉. 在這一百多年 ...

“迪拜最美公主”薩拉瑪:6歲靠顏值火遍全網,卻被迫嫁給大叔

“迪拜最美公主”薩拉瑪:6歲靠顏值火遍全網,卻被迫嫁給大叔
她6歲時就憑藉著一張照片火遍全網,被網友們譽為"中東第一美女",讓全世界人民都為她的顏值所折服. 她出生於富得流油的迪拜王室,從小就享有用之不盡的財富,過著錦衣玉食的奢靡生活. 但 ...

海水稻有多神奇?袁隆平鹽鹼地種水稻,迪拜沙漠變良田

海水稻有多神奇?袁隆平鹽鹼地種水稻,迪拜沙漠變良田
說到水稻,很多人第一時間就會想起袁隆平院士研發的雜交水稻.不得不說,袁老的雜交水稻讓我國徹底擺脫了飢餓的困擾,也造福了全世界人民.其實,除了雜交水稻,我國還有一種水稻品種非常珍貴,它就是海水稻.在迪拜 ...

迪拜大王妃:20箱珠寶娶進門,生12子42年不露面,哈雅都沒她受寵

迪拜大王妃:20箱珠寶娶進門,生12子42年不露面,哈雅都沒她受寵
網路上總有這樣一句話:"頭頂一塊布,誰都沒我富".說的便是迪拜,這是一座遍地都是黃金的國家,有豐富的石油儲量,正是因為這一點,這裡幾乎沒有窮人.當然在這裡王公貴族是最尋常的,也許每 ...

全球九大觀光塔!上海地標東方明珠竟然與第一相差近170米

全球九大觀光塔!上海地標東方明珠竟然與第一相差近170米
前言 觀光塔:現代工程技術的成品,與古代的塔有別,直到19世紀末期才有足夠的技術興建.代表性的作品有:巴黎去埃菲爾鐵塔.澳門旅遊塔.上海東方明珠塔等等. 正文 觀光塔因其設計簡單.高度超高已經成為城市 ...

華人在迪拜生活,體會什麼是種族優越感,最爽的莫過印度人

華人在迪拜生活,體會什麼是種族優越感,最爽的莫過印度人
今天,我在迪拜住了6個月零3天. 飛機將於今晚回家.剛看到這個問題,就準備回答,開始打包. - 概況 時間:比北京時間晚4小時. 貨幣:迪拉姆,目前與人民幣的匯率為1.88,即1迪拉姆=1.88人民幣 ...

迪拜4個月小王子小公主露面,被71歲爺爺抱懷中,母親卻不能上鏡

迪拜4個月小王子小公主露面,被71歲爺爺抱懷中,母親卻不能上鏡
全球王室王子也有排名,此前哈里是最帥黃金單身漢,然而娶了梅根之後被哈曼丹所取代,而在去年他也順利迎娶了自己的表妹,脫離了單身行列,並且在今年五月份有了一對可愛的龍鳳胎. 哈曼丹接受的是精英式教學,在父 ...

54歲英拉穿粉衣扮嫩,同框比美贏小24歲不丹王后,哥哥始終守護她

54歲英拉穿粉衣扮嫩,同框比美贏小24歲不丹王后,哥哥始終守護她
1967年6月21日出生的英拉·西那瓦作為泰國"最美"前總理,雖然她在5年前就走上"逃亡"之路,但是仍然有不少民眾在默默地關注著她的動向. 這不,前段時間54歲 ...

巴基斯坦總統阿里夫·阿爾維訪問阿聯酋
來源:央視新聞客戶端 原標題:巴基斯坦總統阿里夫·阿爾維訪問阿聯酋 總檯記者 孫建 當地時間10月9日,巴基斯坦總統阿里夫·阿爾維抵達阿聯酋進行為期兩天的訪問,其間與阿聯酋副總統兼總理.迪拜酋長謝赫· ...

逆天奇案故事:荒山拋屍、證據全無,最後憑一個“千斤頂”破案

逆天奇案故事:荒山拋屍、證據全無,最後憑一個“千斤頂”破案
大家好,我是馬港真,一個懸疑小說愛好者. 今天說一個小說裡的逆天奇案. 這事發生在十四年前的一個小山村,有的男人死了,是被狗咬死的,死的時候手中緊緊抱著一隻雞. 警察到現場後和那農戶主人瞭解了情況. ...

非洲第一個華人酋長鬍介國:有私人武裝,曾捨命救下中國外交官

非洲第一個華人酋長鬍介國:有私人武裝,曾捨命救下中國外交官
2018年12月23日,90後河南小夥李滿虎成為奈及利亞酋長,並且在次年的3月31日,榮獲喀麥隆酋長. 人們都很驚訝,中國人為何能夠成為非洲酋長.印象中,非洲酋長都是身上塗滿了油畫,身上掛滿琳琅滿目的 ...

跨境週報 | 2M聯盟公佈黃金週停航計劃!迪拜世博會即將開幕

跨境週報 | 2M聯盟公佈黃金週停航計劃!迪拜世博會即將開幕
頭條新聞 1.2020年迪拜世博會即將開幕,中國館精彩亮相! 9月16日,中國貿促會在北京舉辦中國參展2020年阿聯酋迪拜世博會新聞釋出會.會上介紹,2020年迪拜世博會中國參展的籌備工作已準備就緒, ...

全球最奢華的酋長皇宮酒店,品嚐金子咖啡。黃金連廁所也不放過

全球最奢華的酋長皇宮酒店,品嚐金子咖啡。黃金連廁所也不放過
提起阿聯酋迪拜,我們就會想到一個詞"豪"! 去了阿聯酋首都阿布扎比,才知道富得流油的阿拉伯國家不僅僅是豪,簡直是壕無人性!不僅喝的咖啡中帶黃金,連廁所也處處鑲滿黃金.說的就是位於阿 ...

迪拜世博會中國館10月1日開館 中國古典傢俱亮相

迪拜世博會中國館10月1日開館 中國古典傢俱亮相
9月16日,2020迪拜世博會中國國家館合作伙伴授牌儀式在京舉行,四君子古典傢俱被授予迪拜世博會中國國家館指定供應商,這是中國古典傢俱品牌在世界博覽會國家館歷史上首次獲此殊榮,迪拜世博會中國政府總代表 ...

迪拜哈雅王妃:帶2.7億逃離國王的黃金囚籠,孃家兄弟出面支援她

迪拜哈雅王妃:帶2.7億逃離國王的黃金囚籠,孃家兄弟出面支援她
迪拜是很多人都向往的"黃金之地",但是有些人卻把它當做了一座黃金囚籠,拼上性命也要逃離.比如說逃跑王妃哈雅,她帶著2.7億人民幣和一兒一女跑到了英國.要不是她的孃家勢力強大,自家兄 ...

迪拜富二代有多豪?在家開動物園,豪車能開車展

迪拜富二代有多豪?在家開動物園,豪車能開車展
當你身價數十億時,擁有一輛法拉利只是標配,它不足以成為財富金字塔的頂端標誌,但是如果在那輛法拉利的每一個方塊邊緣都打上路易威登綠寶石,那絕對會讓人稱奇,這正是我們的今天要說的,關於迪拜億萬富翁的孩子的 ...

中東為什麼這麼亂?兩大文明的發源地,同一祖先卻水火不容

中東為什麼這麼亂?兩大文明的發源地,同一祖先卻水火不容
中東為什麼這麼亂?這個問題很多史學家都給不出具體結論,以色列著名歷史學家蓋·貝納說過:我討厭這個問題,因為完整答案從頭說到尾要幾周時間. 確實,中東地區的歷史程序十分繁雜,想要一一梳理並非易事,但把它 ...

戰爭害人!300元就能在中東黑市買走女性,沒被買走結局更慘

戰爭害人!300元就能在中東黑市買走女性,沒被買走結局更慘
常年的戰爭給敘利亞帶來的傷害是無法衡量的.不少家庭飽受戰爭摧殘.人權無法被保障.財產損失無法估算.但是在這樣難以容忍的生存環境下,仍然有一個群體遭受著難以容忍的身心傷害,那便是敘利亞女性. 據悉,30 ...

中東小國擁核50年不承認,拒絕國際調查,核武器或比中國還多?

中東小國擁核50年不承認,拒絕國際調查,核武器或比中國還多?
1951年,一位名叫約里奧·居里的法國核物理科學家,託人給中國帶話,要反對原子彈,就必須要擁有原子彈. 不久之後中國啟動了自己的原子彈研究計劃,在歷經艱難之後終獲成功,中國的大國地位從此也愈發穩當. ...