sponsored links

連續直播70天,竟無人察覺這是個虛擬人

機器之心原創

撰文:吳昕

小冰全新數字孿生虛擬人的最大技術亮點在於其虛實難分的視覺效果,背後離不開小冰深度神經網路渲染技術。而且,這樣一個真正端到端實時線上系統,也是業內還從來沒出現過的。其產業意義在於,虛擬人自此不再停留在簡單的宣傳層面,而是落地成為一種工業化、商業化輸出,切實改變某個產業及其部署的具體場景。

「節目 24 小時都在做,半夜也直播,你們得給主播多少加班費?」每日經濟新聞一億多的財經使用者中,終於有人按捺不住疑問,「到底哪些地方是 AI 做的?」

此時,距離兩位每經知名財經主播數字孿生虛擬人 N 小黑、N 小白上線直播已經過去 70 多天。上次,全民被「蒙」還是英偉達釋出會上閃現幾秒的虛擬「黃仁勳」。

事實上,螢幕上所有內容都是出自 AI 之手。除了 7×24 連續播報的主播,背景播放的影片,包括金融資訊,都是 AI 做的。

「這套東西在業內還從來沒出現過。」小冰公司營運長、人工智慧創造力實驗室負責人徐元春說。

一、何以虛實難辨?

N 小黑雙手自然擺放身前,播報內容不同,他的眼睛、嘴唇和口型也會隨之變化,眉毛甚至臉部肌肉也會微妙運動。

虛實難分的視覺效果,離不開小冰深度神經網路渲染技術(Xiaoice Neural Rendering, XNR)。與傳統計算機圖形技術不同,這種渲染技術透過資料驅動而非物理定律獲得渲染函式,其函式一般用深度神經網路透過學習構建。

它使得數字人的面容、表情、肢體動作等在內的整體自然度大幅度提升。尤其是整個嘴型的驅動,以及嘴部動作和整個眼部臉部肌肉的協同。

具體來說,小冰團隊首先需要訓練兩個專家模型。一個是在大資料上訓練語音專家模型,它能理解人類語音。

另一個是在目標主播資料上訓練嘴形專家模型,學習目標主播嘴形與表情以及語音之間的關係。

比如,主播說「我」、「我愛祖國」,與眼睛會有怎麼樣的聯動關係、與臉部肌肉有什麼聯動的關係。團隊會做一個模型去來學習訓練這個過程。

接下來,團隊還要訓練人臉渲染模型,輸入是語音,渲染出正確的人臉。該訓練過程受到之前兩個專家模型的監督,以保證渲染質量。

最後是驅動過程,輸入語音,形成完整的主播影片。

連續直播70天,竟無人察覺這是個虛擬人

小冰數字孿生主播 N 小黑。

其實,「虛擬人」表現性一直是個很大的技術挑戰。人眼對錶情的識別能力強, 「虛擬人」一旦動起來就很容易被識破。

一些常見的市面技術打造出來的虛擬主播,形象通常比較呆板,肌肉、眼睛也不動,只適合播報一些快訊、天氣預報。

我們希望使用者使用這項技術時,不排斥,也不覺得不自然。「這在數字虛擬技術上是一個非常大的挑戰。」徐元春說。

當一些人士開始疑問哪些部分源自 AI 時,已經說明人們在過去一段時間已經不知不覺地接受了新技術。「這是一個非常好的 measurement,」在徐元春看來,也正是這個專案的標杆意義所在。

值得注意的是,小冰團隊採用的神經網路渲染技術,與今天風靡的 3D 建模技術路徑不同。

後者需要在每次製作內容的時候,在綠幕前進行動作捕捉,再進行模型繫結,然後形成生成影片,進行後期渲染。

這種生產模式其實和好萊塢電影的生產方式其實是一樣的,只不過標準可能會低一些、內容時長會短一些。

這種技術邏輯優勢在於只要願意砸錢,可以打造非常多樣的場景,但問題在於,生產成本會非常的高、製作週期也會比較長。而且,無法做到實時大量生產內容。這些因素也嚴重阻礙了該技術邏輯廣泛賦能 2B 行業。

相比之下,小冰全新數字孿生虛擬人技術的打造成本和週期都大為降低

據徐元春介紹,專案的訓練資料來自 N 小黑(@N 小黑財經)和 N 小白(@每經小白基金),採集完一個人影片資料、處理好後,用小冰團隊的模型,大概一週時間就能訓練出一個比較高質量的虛擬數字人形象,然後驅動「他」完成播報,製作內容。

如果採用 3D 建模技術,僅建模就一個多月。這還不算後續流程所需時間。整個專案運作下來,幾個月的週期都還算快的。

二、首次實現採編播全流程自動化

市面上做很多虛擬人的技術,往往都停留在了一個離線的狀態或者叫半離線的狀態。

比如,在網上他有他的圖片,有他的海報,但其實你並不會看到他,那可能你會看到他的一段廣告的影片,但也就僅此而已。

某公司做了一個虛擬人,播報了一段東西,然後上線,賺取了一些流量。這種技術更像是一種宣傳,並沒有真正改變某個產業及其部署的場景。

而 7×24 小時持續播報,內容都是實時生成的 N 小黑們,正在改變今天內容生產和分發的方式:

只要輸入播報內容,系統會自動將文字資訊轉化為聲音,經過預訓練的模型,驅動虛擬人形象、表情,最終生成完整的直播影片推流,全過程不再需要人工參與。

N 小黑們不會因為主持人的生病或者其他原因缺席工作,導致內容生產斷掉。人類生產內容都會有瑕疵或都會有錯誤,AI 會完全按照原來既定文字內容去生產。

這樣一個真正端到端實時線上系統,也是業內還從來沒出現過的。徐元春說,他們不再是一個簡單的宣傳,而是一種工業化、商業化輸出

事實上,透過小冰框架實現影片採編播全流程的無人化操作,也是源自幾年前的「腦洞」—— 有沒有可能以 AI 的方式,幫每日經濟新聞做成一個類似彭博資訊那樣的 24 小時財經電視節目?

當時,每日經濟新聞金融資訊均由小冰人工智慧技術自動生成,在中英文雙語資訊同步生成的同時,已實現秒級速度的自動化全平臺推送。每日經濟新聞也因此可以面向全球客戶和使用者提供金融資訊服務。

但小冰團隊希望可以走得更遠,做一些更具開創性技術,賦能這個行業,也因此一路披荊斬棘。

小冰已經可以實現各種上市企業公告秒級的形成摘要。為了實現虛擬播報,還需要其他資料。比如,怎麼將每日經濟新聞提供的資料埠和摘要技術結合到一起,然後,再和數字人的形象結合到一起?

螢幕上,數字主播不只是在播新聞,旁邊還有一個背景影片也在播出新聞,這也需要影片混合生成技術的支援。

你要讓這個節目可看,就不能只有兩個人,還得需要有別的影片出現,徐元春舉例說,這些影片也要被用 AI 生產出來。當然,難度沒有數字主播這麼高,但也是一項技術挑戰。

最後把所有技術再捆綁和包裝起來實時推送到直播平臺,也是一個巨大的工程挑戰。

對於小冰數字孿生虛擬人技術的先進性和競爭力,團隊很有自信。

數字虛擬人市場上,有的人會做形象,有的人可能自己會做 NLP,提供一些創作的工具,但是,因為其只是整個鏈條中一個環節,其實很難產生實際的效果。

人工智慧的內容生成最大的特點是穩定輸出高併發,整個內容生成流水線一旦啟動,如果任何一個環節掉鏈子,整個內容生成就都卡在那個環節上了。

從技術的完備性角度來講,我們是最完整的,從自然語言處理、計算機語音到計算機視覺再到人工智慧內容生成,有一個完整的技術棧,徐元春說。

而且,積累的大量端到端 know how 經驗,更有利於將虛擬人帶到現實世界,而不僅僅停留在宣傳層面。

真要做這件事情的時候,就會發現,端到端地實際上解決很多問題。換句話說,已經發現的問題遠遠少於那些你都不知道的問題,徐元春說。

事實上,每日經濟新聞這個專案做的時間是比較長的,主要時間不是花在技術,而是場景打造、探索 know-how 上,最終的打造和磨合也花了不少時間。

比如,大多數虛擬主播,播報了一段新聞或者播報了幾十秒的資訊。如果是這樣做的話,就失去了虛擬人的最大價值。

三、釋放產業價值

現在,小冰團隊正透過模型迭代,將訓練時間壓縮到更短。

另外,據徐元春透露,這一次只發布了我們和每日經濟新聞的專案,後面還將陸陸續釋出一些技術。大家能看到實測,比如虛擬主播不僅可以說中文,也可以說其他不同語種。

得益於全新數字孿生虛擬人技術中語音專家模型,虛擬人能夠去理解人類語音,不只是中文,要理解不同語言。這個模型訓練好後,虛擬主播不僅可以說中文,也可以說其他不同的語種,不用再為單獨語種做訓練。

比如,做完數字孿生建模之後,透過最後渲染,虛擬主播可以說中文,也可以說英語,即使原型從來沒有學過英語。

新增一種能力,就像插卡一樣方便。從這個角度來講,小冰的數字孿生虛擬人技術不僅僅是一個把原來的人復刻了,在這種復刻基礎上,它將來會擁有更大的可能性,包括能力

在數字孿生領域,小冰已經走完第一階段,完成端到端所有的技術和產品化開發,行業使用者可以非常方便的去使用這個平臺,創造自己的虛擬人。

接下來,小冰希望賦能更多行業。在每日經濟新聞,小冰賦予虛擬人撰寫金融資訊的能力,對於其他的虛擬人,小冰可能會賦予其他不同的專業能力,最後放在一個具體場景裡,透過端到端的方式實現出來。

不過,每個行業場景存在區別,要做針對性開發,因此也需要對技術做更多拓展。這個時候,所謂技術佈局,也意味著和很多生態合作伙伴合作賦能。

比如,有些客戶仍然喜歡 3D 建模超寫實技術,但同時也希望這個虛擬人擁有互動能力、聲音的能力,小冰框架仍然可以賦予虛擬人這些能力。

在徐元春看來,這種方式會讓整個虛擬人生態呈現出一個比較完備,不至於完全封閉型的邏輯。

被新冠疫情割裂的 2021 年成為很多人眼中所謂的數字虛擬人元年。

遠端辦公、線上娛樂等線上生活場景使用者暴增,啟用市場對虛擬現實的進一步想象。

在強大的雲計算技術支撐下,內容製作突破限制,人工智慧演算法輔助內容生成,似乎讓虛擬人的想象力可以無限拓展。

與那些希望藉此蹭一把熱度的企業來不同,過去七年,小冰團隊一直堅持在做這種虛擬人,一直在完善各種各樣的技術棧。

並不是因為大家覺得虛擬人市場火了才做。徐元春說,我們一直在這個領域在做自己認為正確的事情。

從產業鏈角度來看,大家也正在慢慢看到,數字虛擬人的格局其實遠遠超過虛擬偶像的範疇。

比如,今年北京冬奧會,測試賽的自由式滑雪空中技巧專案,沒有用人來裁判,而是採用了小冰框架競技體育國際賽事評分系統。

未來,小冰仍然會遵照這樣的佈局和節奏,加速數字虛擬人戰略佈局和研發。

「我覺得,這是一個不變的東西。」徐元春說。

分類: 旅遊
時間: 2021-12-22

相關文章

成都飛北京上海機票白菜價 比高鐵票便宜一半

成都飛北京上海機票白菜價 比高鐵票便宜一半
過完國慶黃金週假期,國內機票價格呈現大面積"跳水"現象,部分航線的最低機票價格僅為同一目的地高鐵票價的一半,比如,本週末成都飛北京的機票價格在600左右.成都飛上海的價格低至430 ...

北京的碼農買房,三百五十萬有哪些選擇

北京的碼農買房,三百五十萬有哪些選擇
全網搜搜"橙子看房",會有驚喜哦. 座標北京,首付可以110w 碼農,在哪買房好呢?座標北京,碼農,在哪買房好呢,想兼顧西二旗和望京的距離,這兩個地方網際網路公司多.考慮兩個地段 ...

網紅早餐鮮肉餅,8塊錢1個不便宜,自己做吧,一次吃個夠

網紅早餐鮮肉餅,8塊錢1個不便宜,自己做吧,一次吃個夠
校門口的早餐品種,真的是豐富多彩,隔幾天就能見到新的品種,為了能吸引小朋友,小攤販們可真是費盡了心思呀! 不過這麼些年了,有家鮮肉餅卻一直沒見換過,自打兒子進小學開始,整整十一年了,生意還是一如既往地 ...

北京和臺灣,兩所清華大學,能否合併?趕超麻省理工學院?

北京和臺灣,兩所清華大學,能否合併?趕超麻省理工學院?
在2019年,臺灣省相關教育部門就釋出<2019學年各級學校名錄及異動一覽表>,表示省內共有170所高等院校,其中,公立高校(包括"國立"."市立" ...

眼紅!北京環球度假區催生北三縣“園區房”

眼紅!北京環球度假區催生北三縣“園區房”
從流量到留量,北京副中心.北三縣的產業經濟鉅變已經開啟. 9月20日上午,北京環球度假區正式開園,包含環球影城主題公園.環球城市大道,以及環球影城大酒店.諾金度假酒店,全部向遊客開放. 樓市資本論瞭解 ...

老犀角一克5塊錢?北京古玩街商販可真敢賣?

老犀角一克5塊錢?北京古玩街商販可真敢賣?
一次出差去北京順便在潘家園古玩市場看到非常多的商販在推薦自己的"犀角雕品",仔細一看全部是樹脂壓鑄的,也有的是水牛角的. 價格也不高,開價1500元到6000元不等,一克幾塊錢.在 ...

0.7折?長假中間時段機票價格“跳水”,百元機票又現身
今年國慶假期遊客可以"說走就走",節中買機票價格降幅明顯.網路銷售平臺10月2日提供的資料顯示,10月2日至5日的熱門目的地機票價格較1日均有較大幅度降價,上海-深圳出現百元&qu ...

北京·東灣開盤兩年網籤率53% 是想賺時間紅利還是產品確實不吃香?

北京·東灣開盤兩年網籤率53% 是想賺時間紅利還是產品確實不吃香?
9月13日,幸福裡從北京住建委獲悉,北京·東灣共取證3次,取證房源949套,截至9日,網籤503套,去化率約為53%. 其最早取證時間為2019年7月7日,即開盤至今已有2年時間.從這個時間週期來看, ...

實拍廣西三江“程陽八寨”,位於三省交界處,被譽為中國最美侗寨

實拍廣西三江“程陽八寨”,位於三省交界處,被譽為中國最美侗寨
這裡是劉小順的旅行和生活研究所. 廣西壯族自治區位於我國的華南地區,因豐富的旅遊資源而聞名於世,吸引了大量遊客前來廣西旅遊. 說到廣西,除了這裡壯美的自然風光之外,濃郁的少數民族風情也是被很多遊客所津 ...

北京樓市:房山的房產,虧錢也要賣掉
大家好,我是京爺,是少有的能夠切入北京房產全流程交易與大資料分析的諮詢師! 以下內容為[京爺說房]公眾號| 粉絲問答 關注"京爺說房"[微信公眾號],加入[知識星球]"京 ...

三百多年前,他“發現”了北京中軸線
北京作為"東方文明的交匯點",其所展現的宏大與輝煌,對歐洲充滿著巨大誘惑.而南達永定門,北到鐘鼓樓的中軸線,以其跌宕起伏的建築形象和縱橫捭闔的空間氣度掌控了整個城市,給海外使者留下 ...

北京天壇公園,明清兩代帝王祭天、祈五穀豐登的場所,值得一去

北京天壇公園,明清兩代帝王祭天、祈五穀豐登的場所,值得一去
若是到北京旅遊,那好玩的地方就非常多了,尤其是對於歷史文化愛好者來說.北京不僅是我國的首都,更是一座有著3000多年悠久歷史的古都城市,在這座厚重的城市中,歷史古蹟遍佈,其中不乏聞名國內外的旅遊景區, ...

全運會第四比賽日 北京代表團再下兩金

全運會第四比賽日 北京代表團再下兩金
昨天,在第十四屆全國運動會空手道女子61公斤以上級比賽中,東京奧運會該級別銅牌得主.北京隊選手龔莉(右)以3比0戰勝山東隊選手焦溫璐奪冠. 北京日報記者 劉平攝 昨天,第十四屆全國運動會(以下簡稱十四 ...

比市場價便宜5萬,這輛別克GL8只要10萬塊!這樣的車值得買嗎?
哈嘍,大家好~我是檢車家最具喜劇精神的二手車檢測師,大家可以叫我影帝,我不僅僅是一個修過車的二手車檢測師,更是行走的表情包!歡迎大家收看本期二手車檢測趣事.今天給大家帶來的車型是一輛營轉非的別克GL8 ...

北京樓市8月第三週成交排名

北京樓市8月第三週成交排名
2021年8月16日-8月22日,北京市商品房成交2434套,環比上漲39%:成交面積26.42萬㎡,環比上漲29%:成交均價40850元/㎡,環比下降11%:成交金額107.93億元,環比上漲15% ...

全運會乒乓球男團8強!廣東北京全勝出線,奧運三虎全部過關

全運會乒乓球男團8強!廣東北京全勝出線,奧運三虎全部過關
第十四屆全運會今天進入到乒乓球團體賽最後一個比賽日的爭奪,8強隊伍也產生.奧運會男團成員馬龍.樊振東和許昕所在的團隊都是輕鬆晉級8強. A組比賽廣東隊一枝獨秀,由樊振東.林高遠和周啟豪三名國手組成的廣 ...

究竟是誰“害”霍尊退出了演藝圈?

究竟是誰“害”霍尊退出了演藝圈?
今年內娛男明星負面新聞頻出,從華晨宇到吳亦凡,現在又輪到霍尊.(吳亦凡坐牢會遇見什麼:明星監獄往事>) 霍尊年幼時父母離異,他是母親仲小萍帶大的.母親為了更好地撫養他,放棄了自己的歌唱事業. 2 ...

為何最好在寶寶出生的28天內,辦理新生兒醫保?能報銷不少錢

為何最好在寶寶出生的28天內,辦理新生兒醫保?能報銷不少錢
很多媽媽在準備生寶寶的時候要注意了.首先,在準備生寶寶前,要先繳納好社保.因為社保裡有一項生育保險,如果你太長時間斷繳,那麼如果趕上在斷繳的時期內生育小孩兒,那麼你的生育補貼也會受到影響,正常情況下大 ...

毛主席去世前寫信給政府:請幫我照顧九弟一點,我實在是年老了

毛主席去世前寫信給政府:請幫我照顧九弟一點,我實在是年老了
新中國成立後,毛主席遠在韶山的一些本家親人不時去北京看望,毛主席每次都熱情招待.表弟李祝華曾向他提出幫九弟安排工作的要求. 毛主席心懷愧疚地拒絕了:"我現在是國家的主席,不是咱們一家人的主席 ...

姐姐的存摺

姐姐的存摺
1 第一次見到她時,她翹著二郎腿坐在一張椅子上,牛仔衣緊緊地裹住她早熟的身體,黃色的劉海遮住了眼睛,她正專心致志地染指甲,指甲油是豔豔的粉色. 那一年,我十五歲,跟著改嫁的母親來到她的家裡. 母親第一 ...