sponsored links

吳恩達的2021回顧,這些大事件影響了AI這一年

吳恩達的2021回顧,這些大事件影響了AI這一年

來源:AI前線本文共5000字,建議閱讀10+分鐘本文中吳恩達回顧了 2021 年全球人工智慧在多模態、大模型、智慧語音生成、Transformer 架構、各國 AI 法律舉措等方面的主要進展。

吳恩達的2021回顧,這些大事件影響了AI這一年

近期,機器學習大牛吳恩達(Andrew Ng)在其主編的人工智慧周訊《The Batch》上發表了最新文章。文章中,吳恩達回顧了 2021 年全球人工智慧在多模態、大模型、智慧語音生成、Transformer 架構、各國 AI 法律舉措等方面的主要進展。

日前,吳恩達發表了以“贈人玫瑰、手有餘香”為主題的聖誕寄語。

隨著 2021 年底的臨近,你可能正在減少工作為寒假做準備。我很期待能暫時放下工作休息一下,希望你也一樣。

十二月有時被稱為給予的季節。如果你有空閒時間,想知道如何利用它,我認為我們每個人能做的最好的事情之一,就是思考如何能夠幫助別人。

歷史學家、哲學家威爾·杜蘭特曾說過:“重複的行為造就了我們。”如果你不斷地尋求提升他人,這不僅會幫助他們,或許同樣重要的是,它也會讓你成為一個更好的人。正是你的重複行為定義了你的為人。還有一個經典的研究表明,把錢花在別人身上可能比花在自己身上更讓你快樂。

所以,在這個假期,我希望你能休息一段時間。休息、放鬆、充電!與那些你愛的、但在過去的一年裡沒有足夠的時間聯絡的人聯絡。如果時間允許,做一些有意義的事情來幫助別人。可以是在部落格文章中留下鼓勵的評論、與朋友分享建議或鼓勵、在線上論壇上回答一個人工智慧問題、或為一個有價值的事業捐款。在與教育和(或)科技相關的慈善機構中,我最喜歡的有維基媒體基金會、可汗學院、電子前沿基金會和 Mozilla 基金會。

吳恩達還談到了 AI 社群的發展。他表示:AI 社群在規模很小的時候就有很強的合作精神。這感覺就像一群無畏的先鋒們在向全世界進軍。人們渴望幫助別人,提供建議,彼此鼓勵,相互介紹。那些從中獲益的人往往無以為報,所以我們透過幫助後繼者作為回報。隨著人工智慧社群的發展,我希望保持這種精神。我承諾將繼續努力建設人工智慧社群。希望你也可以!

我也希望你們能考慮各種方式,無論大小,向人工智慧社群以外的人伸出援手。世界上還有很多地方沒有先進的技術。我們的決定影響著數十億美元和數十億人的生命。這給了我們一個在世界上行善的特殊機會。

吳恩達回顧了 2021 年全球人工智慧的進展並展望了 2022 年以及之後 AI 技術的發展前景。

回顧 2021 年

過去一年以來,整個世界都在跟極端天氣、經濟通脹、供應鏈中斷以及 COVID-19 病毒作鬥爭。

在科技領域,遠端辦公與線上會議貫穿了這整整一年。AI 社群則繼續努力彌合整個世界,推進機器學習發展,同時加強其造福各行各業的能力。

這一次,我們希望重點展望 2022 年及之後 AI 技術的發展前景。

多模態 AI 的起飛

雖然 GPT-3 和 EfficientNet 等單獨針對文字及影象等任務的深度學習模型備受矚目,但這一年中最令人印象深刻的還是,AI 模型在發現許可證與影象間關係中取得了進步。

背景資訊

OpenAI 透過 CLIP(實現影象與文字匹配)與 Dall·E(根據輸入文字生成對應影象)開啟了多模式學習的開端;DeepMind 的 Perceiver IO 則著手對文字、影象、影片及點雲進行分類;斯坦福大學的 ConVIRT 嘗試為醫學 X 射線影像新增文字標籤。

重要標杆

雖然這些新的多模式系統大多處於實驗階段,但也已經在實際應用中取得突破。

  • 開源社群將 CLIP 與生成對抗網路(GAN)相結合,開發出引人注目的數字藝術作品。藝術家 Martin O’Leary 使用 Samuel Coleridge 的史詩作品《忽必烈大汗》為輸入,生成了充滿迷幻色彩的“Sinuous Rills”。
  • Facebook 表示其多模式仇恨言論檢測器能夠標記並刪除掉社交網路上 97% 的辱罵及有害內容。該系統能夠根據文字、影象及影片等 10 種資料型別將模因與其他影象 - 文字對準確劃分為“良性”或“有害”。
  • 谷歌表示已經在搜尋引擎中添加了多模式(及多語言)功能。其多工統一模型能夠返回文字、音訊、影象及影片連結,用以響應由 75 種語言提交的各類查詢。

新聞背後

今年的多模態發展態勢源自幾十年來堅實的研究基礎。

早在 1989 年,約翰霍普金斯大學和加州大學聖迭戈分校的研究人員就開發出一種基於母音的分類系統,用以識別人類語音中的音訊與視覺資料。

接下來的二十年間,更多研究小組先後嘗試過數字影片庫索引及基於證據 / 視覺資料的人類情緒分類等多模式應用方案。

發展現狀

影象與文字如此複雜,因此研究人員在很長一段時間內只能專注於其中一種。在此期間,他們開發出多種不同技術成果。

但過去十年中,計算機視覺與自然語言處理已經在神經網路中得到有效融合,也讓二者的最終合璧成為可能 —— 甚至音訊整合也獲得了參與的空間。

萬億級引數

過去一年,模型經歷了從大到更大的發展歷程。

背景資訊

谷歌用 Switch Transformer 拉開了 2021 年的序幕,這是人類歷史上首個擁有萬億級引數的模型,總量達 1.6 萬億。

北京人工智慧研究院則回敬以包含 1.75 萬億引數的悟道 2.0。

重要標杆

單純拉高模型引數並沒什麼特別。但隨著處理能力和資料來源的增長,深度學習開始真正確立起“越大越好”的發展原則。

財力雄厚的 AI 廠商正以狂熱的速度堆積引數,既要提高效能、又要展示“肌肉”。特別是在語言模型方面,網際網路廠商為無監督和半監督預訓練提供了大量未經標記的資料。

2018 年以來,這場引數層面的軍備競賽已經從 BERT(1.1 億)、GPT-2(15 億)、MegatronLM(83 億)、Turing-NLG(170 億)、GPT-3(1750 億)一路走來,如今終於邁過了萬億級大關。

挺好,但是……

模型的膨脹路線也帶來了新的挑戰。愈發龐大的模型令開發者們面臨四大嚴酷障礙。

  • 資料:大型模型需要吸納大量資料,但網路和數字圖書館等傳統資料來源往往提供不了這麼多高質量素材。例如,研究人員常用的 BookCorpus 是一套包含 11000 本電子書的資料集,之前已被用於訓練 30 多種大型語言模型;但其中包含某些宗教偏見,因為內容主要討論基督教和伊斯蘭教義,對其他宗教幾無涉及。

AI 社群意識到資料質量將直接決定模型質量,但卻一直未能就大規模、高質量資料集的有效編譯方法達成共識。

  • 速度:如今的硬體仍難以處理大體量模型,當資料反覆出入記憶體時,模型的訓練和推理速度都會受到嚴重影響。

為了降低延遲,Switch Transformer 背後的谷歌團隊開發出一種方法,能夠讓各個 token 只處理模型各層中的一個子集。他們的最佳模型預測速度甚至比引數量只有其三十分之一的傳統模型還快 66%。

另外,微軟開發的 DeepSpeed 庫則選擇了並行處理資料、各層及層組的路線,並透過在 CPU 和 GPU 間劃分任務以減少處理冗餘。

  • 能耗:訓練如此龐大的網路會消耗大量電能。2019 年的一項研究發現,在 8 個英偉達 P100 GPU 上訓練一個包含 2 億引數的 transformer 模型所造成的碳排放(以化石燃料發電計算),相當於一輛普通汽車五年的行駛總排放量。

當然,Cerebras 的 WSE-2 及谷歌最新 TPU 等新一代 AI 加速型晶片有望降低排放,而風能、太陽能及其他清潔能源的供應也在同步增加。相信 AI 研究對環境的破壞將愈發輕微。

  • 模型交付:這些龐大的模型很難在消費級或邊緣裝置上執行,所以真正的規模部署只能透過網際網路訪問或精簡版本實現——不過二者目前各有問題。

發展現狀

自然語言建模排行榜中的主力仍然是千億級模型,畢竟萬億級引數的處理難度實在太高。

但可以肯定,未來幾年會有更多萬億級俱樂部成員加入進來,而且這種趨勢仍將持續。有傳聞稱,OpenAI 規劃中的 GPT-3 繼任者將包含更加恐怖的百萬億級引數。

AI 生成音訊內容漸成“主流化”

音樂家和電影製作人們,已經習慣於使用 AI 支援型音訊製作工具。

背景資訊

專業媒體制作人們會使用神經網路生成新的聲音並修改舊有聲音。配音演員們自然對此大為不滿。

重要標杆

生成模型能夠從現有錄音中學習特徵,進而創造出令人信服的複製品。也有些製作人直接使用這項技術原創聲音或模仿現有聲音。

  • 美國初創公司 Modulate 使用生成對抗網路為使用者實時合成新的語音,使得遊戲玩家和語聊使用者能夠建立起自己的虛擬角色;也有跨性別者用它調整自己的聲音,藉此獲得與性別身份相一致的音色。
  • Sonantic 是一家專門從事聲音合成的初創公司。演員 Val Kilmer 於 2015 年因咽喉手術而喪失了大部分發聲能力,該公司則利用原有素材為他專門創造了一種音色。
  • 電影製作人 Morgan Neville 聘用一家軟體公司,在自己的紀錄片《流浪者: 一部關於安東尼·波登的電影》中重現了已故旅遊節目主持人波登的聲音。但此舉引起了波登遺孀的憤怒,她表示自己並未許可這種行為。

挺好,但是……

爭議不止這一例。

配音演員們也擔心這項技術會威脅到自己的生計。2015 年年度遊戲《巫師 3:狂獵》的粉絲們甚至在同人 Mod 版本中用這項技術重現了原配音演員們的聲音。

新聞背後

最近出現的音訊生成主流化傾向,完全是早期研究成果的自然延續。

  • OpenAI 的 Jukebox 就使用 120 萬首歌曲進行訓練,可利用自動編碼器、轉換器及解碼器管道進行全實時錄音生成,風格涵蓋從貓王到艾米納姆等多位歌手。
  • 2019 年,某匿名 AI 開發者設計出一種技術,允許使用者在短短 15 秒內利用文字行重現動畫及影片遊戲角色的聲音。

發展現狀

生成音訊及生成影片不僅讓媒體制作人多了一種修復並增強歸檔素材的能力,同時也讓他們能夠從零開始創造新的、真假難辨的素材。

但由此引發的道德與法律問題也在增加。如果配音演員被 AI 徹底取代,他們的損失該由誰承擔?將已故者的聲音在商業化作品中重現涉及哪些所有權糾紛?能不能利用 AI 為已故歌手推出新專輯?這麼做對嗎?

一種架構,駕馭一切

Transformer 架構正在快速拓展自己的影響範圍。

背景資訊

Transformers 架構最初專為自然語言處理所開發,但目前已經成為深度學習領域的“萬金油”。2021 年,人們已經在用它發現藥物、識別語音和影象等。

重要標杆

Transformers 已經用實際行動證明自己在視覺任務、地震預測、蛋白質分類與合成等領域的優異表現。

過去一年以來,研究人員開始將其推向更廣闊的新領域。

  • TransGAN 是一套生成對抗網路,結合 transformers 以確保所生成的各個畫素都與之前已生成的畫素一致。這項成果能夠有效衡量所生成影象與原始訓練資料之間的相似度。
  • Facebook 的 TImeSformer 使用該架構識別影片片段中的動作元素。它的任務不再是從文字中識別單詞序列,而是嘗試解釋影片幀中的序列關係。其效能優於卷積神經網路,能夠在更短時間內分析更長的影片片段,因此能耗也控制在更低水平。
  • Facebook、谷歌及加州大學伯克利分校的研究人員在文字上訓練出 GPT-2,之後凍結了其 self-attention 與 feed-forward 層。在此基礎上,他們可以針對不同用例進行模型微調,包括數學、邏輯問題及計算機視覺等。
  • DeepMind 釋出了 AlphaFold 2 的開源版本,其使用 transformers 根據氨基酸序列預測蛋白質的 3D 結構。該模型在醫學界內掀起軒然大波,人們普遍認為其具備推動藥物發現和揭示生物學原理的巨大潛力。

新聞背後

Transformer 於 2017 年首次亮相,之後迅速改變了語言處理模型的設計思路。其 self-attention 機制能夠跟蹤序列中各元素與其他元素間的關係,不僅可用於分析單詞序列,還適合分析畫素、影片幀、氨基酸、地震波等序列。

基於 transformer 的大型語言模型已經建立起新的客觀標準,包括在大型未標記語料庫上進行模型預訓練,利用有限數量的標記示例針對特定任務進行微調等。

Transformer 架構良好的普適性,可能預示著未來我們將創造出能解決多領域多問題的 AI 模型。

發展現狀

在深度學習的發展過程中,有幾個概念曾經迅速普及:ReLU 啟用函式、Adam 最佳化器、attention 注意力機制,再加上現在的 transformer。

過去一年的發展證明,這種架構確實具有旺盛的生命力。

各國政府出臺人工智慧相關法律

各國政府紛紛制定新的法律和提案,希望控制 AI 自動化對現代社會的影響。

背景資訊

隨著 AI 對隱私、公平性、安全性及國際競爭關係帶來的潛在影響,各國政府也開始加大對 AI 的監管力度。

重要標杆

AI 相關法律往往反映出各國在政治秩序中的價值判斷,包括如何在社會公平與個人自由之間求取平衡。

  • 歐盟起草了基於風險類別的機器學習應用禁止或限制條例。實時人臉識別與社會信用系統被明令禁止;對於重要基礎設施的控制、執法協助及生物識別技術等應用方向則需要提交詳細的說明檔案,證明 AI 方案安全可靠並持續接受人工監督。

這項規則草案於今年 4 月釋出,目前仍在立法流程之內,預計未來 12 個月內仍無法落地。

  • 從明年開始,中國網際網路監管機構將強制對可能破壞社會公序良俗的 AI 系統與推薦演算法執行監督。打擊的目標包括傳播虛假資訊、引導成癮行為及危害國家安全的各類系統。企業在部署任何可能左右公眾情緒的演算法之前必須獲得批准,違規演算法一律不得上線。
  • 美國政府提出一項 AI 權利法案,用以保護公民免受可能侵犯隱私及公民權利的系統的影響。政府將在明年 1 月 15 日前持續為提案收集公眾意見。在聯邦以下,多個州及市一級政府開始限制人臉識別系統。紐約市透過一項法律,要求對招聘演算法進行偏見審計。
  • 聯合國民權高階專員呼籲各成員國暫停 AI 的某些用途,包括可能侵犯人權、限制民眾獲取基本服務、以及濫用私人資料的情形。

新聞背後

AI 社群正在逐步走向監管層面的共識。

最近對 534 位機器學習研究人員進行的一項調查發現,68% 的受訪者認為模型部署確實應該重視可信度與可靠性。受訪者們對於歐盟及聯合國等國際機構的信任度,也普遍高於對各國政府的信任度。

發展現狀

在中國以外,大部分 AI 相關法規仍處於審查階段。但從目前的提案來看,AI 從業者必須為政府全面介入的必然前景做好準備。

原文連結:

https://read.deeplearning.ai/the-batch/issue-123/

分類: 親子
時間: 2022-02-11

相關文章

書評 |《3-6歲科學啟蒙小百科》:仰望星空,上天入地,世界真奇妙

書評 |《3-6歲科學啟蒙小百科》:仰望星空,上天入地,世界真奇妙
"為什麼要讓孩子讀科普書?孩子還小,科普書他能看懂嗎?有好的適合孩子看的科普書推薦嗎?"說到兒童科普,這是我被問到的最常見的三個問題.大概因為自己是工科碩士的教育背景,所以有意無意 ...

仰望星空,他們不約而同提出了星雲說
自牛頓經典力學大旗樹起後,科學界"各門各派"試圖用經典力學思維解釋這個世界,但紛紛碰壁. 關於宇宙是如何形成的,那時的牛頓力學所得出的"合理"解釋是:形成靜態宇 ...

在雪域之巔仰望星空

在雪域之巔仰望星空
來源:人民網-人民日報海外版 讀陳人傑的詩,需在夜闌人靜時細細咀嚼.認真品讀,那帶著溫度的文字彷彿有千鈞之力,重重舉起.輕輕放下,觸及著最柔軟的心靈.從西湖到西藏,從錢塘江畔到群山之巔,他用自己的腳步 ...

仰望星空時,我身上的每一顆原子,都在思念故鄉

仰望星空時,我身上的每一顆原子,都在思念故鄉
原創 星玫 MorningRocks 熱愛未知,比如宇宙和清晨 仰望星空時 我身上每一顆原子都在思念故鄉 MorningRocks 之前,以色列公司 Spacell 往月球發射了無人登陸器「創世紀」, ...

不放棄遠方,也執著於當下的星座,懂得腳踏實地,最終會仰望星空

不放棄遠方,也執著於當下的星座,懂得腳踏實地,最終會仰望星空
每個人都會有夢想,但是在實現的過程當中,難免會遇到阻力和坎坷.而在面對這些困難和阻礙的時候,有的人選擇了放棄,有的人選擇了繼續.我們不能批判任何一種選擇,畢竟我們不是當事人.但是對於那種執著追夢,並且 ...

仰望星空的好地方!中國西部的世界頂級天文臺址

仰望星空的好地方!中國西部的世界頂級天文臺址
[仰望星空的好地方!中國西部的世界頂級天文臺址]在青海冷湖地區,海拔4200-4500米的賽什騰山山頂,擁有逼近理論極限的天光黑暗程度.世界頂級臺址的視寧度和水汽含量,以及高達70%的優良晴夜率.這裡 ...

打工日記|宇宙的盡頭是編制
九點多,我值完班,走回員工宿舍. 快到宿舍樓時,身後過來一輛電動車,是行政部門的同事. "咦,你怎麼才下班?"他停下車,問道. "我們部門這周開始值班."我向他 ...

屬於銀河系的星光尖晶石,深藏仰望星空的夢想

屬於銀河系的星光尖晶石,深藏仰望星空的夢想
寶石界的星光寶石並不少見,它指的是寶石在光線的照射下會呈現四角星.六角星等星光圖案,很是特別. 大家聽得最多的是星光藍寶石,本身藍色作為底色,倒映出來的星光圖案就更加明顯,就像夜空中閃爍著星星,流淌著 ...

英媒:人類為什麼想不起自己嬰兒時做過什麼 專家想探索背後秘密

英媒:人類為什麼想不起自己嬰兒時做過什麼 專家想探索背後秘密
中國小康網10月11日訊 老馬 從生命中最戲劇性的一刻,你出生那天,到蹣跚學步,呀呀學語,吃第一口飯,第一次上幼兒園,這些人生初期的經歷我們大多數人已經完全想不起了.即便在我們已經有了記憶之後,我們仍 ...

萬物生,宇宙的盡頭《六》
"你就暫時理解為:絕對零度以上的能吧!因為空間中沒有絕對零度的空間,那個資訊暫時參照於絕對零度吧!而在空間中只能是無限接近於絕對零度,不會等於絕對零度,如果某個空間等於絕對零度,你知道那意味 ...

萬物生,宇宙的盡頭《五》
"先生,還是有問題,你之前說宇宙的生和死可以各表示為一位元資訊,這樣說來,這兩位元資訊似乎是一樣量,並沒有說前面一位元極小,後面一位元極大,也就是說,這中間沒有差值,還有-" &q ...

《朗讀者》經典卷首語,積累下來寫作必備
<朗讀者>第一期:遇見 古往今來,有太多太多的文字,在描寫著各種各樣的遇見. "蒹葭蒼蒼,白露為霜,所謂伊人,在水一方."這是撩動心絃的遇見:"這位妹妹,我曾 ...

葉培建:探索星空奧秘的腳步永不停歇

葉培建:探索星空奧秘的腳步永不停歇
來源:人民網-中國共產黨新聞網 原創稿 [編者按]習近平指出,"新時代是需要英雄並一定能夠產生英雄的時代."一代代中華兒女為偉大祖國的繁榮昌盛接續奮鬥,各行各業湧現出一大批矢志報國 ...

宇宙作為家園:30年,三個看星星的人

宇宙作為家園:30年,三個看星星的人
李思涵 "在陶淵明身後1500年,梭羅在夏夜所看到的升起的銀河,正如當年陶淵明見到的那樣--同樣模糊的恆星,同樣的星座特徵.中國南方荒村的詩人和美國康科德市的自然主義者,在他們共同擁有的銀河 ...

升達地板炫彩星空系列:讓你的家美到閃光
人類探索星空的腳步從未停歇,好奇心驅使著人類一次次仰望星空,一步步接近宇宙和科學的奧義. 自上世紀60年代開始,未來主題.星空元素的時尚概念越來越成為設計師們的靈感來源,在時髦前衛的設計師們的手下,誕 ...

夢的具象,後人類的永生世界——《元宇宙》

夢的具象,後人類的永生世界——《元宇宙》
元宇宙,這個誕生至今約三十年的概念,最近橫掃了各大社交媒體,關於其的定義和討論也是五花八門,每個論調似乎都是在盲人摸象,作為人類脫碳入矽的堅定擁躉,我第一時間妄圖自己總結.組織和提煉關於這個概念的一些 ...

第一隻進入太空的狗,在宇宙飄了63年,人類為何要毒死它

第一隻進入太空的狗,在宇宙飄了63年,人類為何要毒死它
第一個進入太空的宇航員是加加林,他成功乘坐宇宙飛船進入太空,並繞地球一週後成功返回地球.其實在人類進入太空之前,因為沒有十足的把握,第一個進入太空的生物是一隻叫萊卡的狗,第一隻進入太空的狗,在宇宙飄了 ...

宇宙還存在一個除光速以外的速度限制,這才是人類真正的障礙?

宇宙還存在一個除光速以外的速度限制,這才是人類真正的障礙?
許多科學家認為,這個宇宙應該是一個生機勃勃的宇宙,生命在宜居行星上自然出現的機率接近100%,雖然現實上我們從來沒有找到任何地外生命的蹤跡.科學家們認為,宇宙的範圍太過廣泛,人類其實就像地球上的一窩螞 ...

逆天奇案故事:作案之後,兇手想了3個方法,確保自己不會被抓

逆天奇案故事:作案之後,兇手想了3個方法,確保自己不會被抓
大家好,我是馬港真,一個懸疑小說愛好者. 今天說一個小說裡的逆天奇案. 這事發生在1999年的香港. 一名戴著10克拉鑽戒的女子按了鐵門的門鈴. 門開了,屋裡站著一個男人,名叫陸條三,是一名高階督察. ...

這些心裡話,我想對您說……

這些心裡話,我想對您說……
一支粉筆 三尺講臺 一生光陰 育人育心 教師節來臨 我們有些心裡話 想對您說 影片載入中... 您指引我們仰望星空 追隨真理與夢想 您叮囑我們腳踏實地 付出努力向前闖 立德樹人 促進學生德智體美勞全面 ...