sponsored links

微軟英偉達釋出5300億NLP模型“威震天-圖靈”,花了4480塊A100

5300億引數!全球最大規模NLP模型誕生。

微軟聯手英偉達推出,名叫威震天-圖靈自然語言生成模型(Megatron Turing-NLG)。

微軟英偉達釋出5300億NLP模型“威震天-圖靈”,花了4480塊A100

據他們介紹,這樣的量級不僅讓它成為全球規模最大,同時也是效能最強的NLP模型。

訓練過程一共使用了4480塊英偉達A100 GPU,最終使該模型在一系列自然語言任務中——包括文字預測、閱讀理解、常識推理、自然語言推理、詞義消歧——都獲得了前所未有的準確率。

三倍規模於GPT-3

此模型簡稱MT-NLG,是微軟Turing NLG和英偉達Megatron-LM兩者的“繼任者”。

Turing NLG由微軟於2020年2月推出,引數為170億;Megatron-LM來自英偉達,2019年8月推出,引數83億。

它倆在當時分別是第一、二大規模的Transfomer架構模型。

我們都知道大引數規模的語言模型效果會更好,但訓練起來也很有挑戰性,比如:

  • 即使是最大容量的GPU,也存不下如此規模的引數;
  • 如果不特別注意最佳化演算法、軟體和硬體堆疊,那麼所需的大量計算操作可能會導致訓練時間過長。

那這個引數已是GPT-3三倍的MT-NLG又是如何解決的呢?

答案就是汲取“兩家”所長,融合英偉達最先進的GPU加速訓練裝置,以及微軟最先進的分散式學習系統,來提高訓練速度。

微軟英偉達釋出5300億NLP模型“威震天-圖靈”,花了4480塊A100

並用上千億個token構建語料庫,共同開發訓練方法來最佳化效率和穩定性。

具體來說,透過借鑑英偉達Megatron-LM模型的GPU並行處理,以及微軟開源的分散式訓練框架DeepSpeed,建立3D並行系統。

對於本文中這個5300億個引數的模型,每個模型副本跨越280個NVIDIA A100 GPU,節點內採用Megatron-LM的8路張量切片(tensor-slicing),節點間採用35路管道並行(pipeline parallelism)。

然後再使用DeepSpeed的資料並行性進一步擴充套件到數千個GPU。

最終在基於NVIDIA DGX SuperPOD的Selene超級計算機上完成混合精度訓練。

(該超級計算機由560個DGX A100伺服器提供支援,每個DGX A100有8個 NVIDIA A100 80GB Tensor Core GPU,透過NVLink 和 NVSwitch相互完全連線)。

該模型使用了Transformer解碼器的架構,層數、hidden dimension和attention head分別為 105、20480和128。

訓練所用資料集包括近20萬本書的純文字資料集Books3、問答網站Stack Exchange、維基百科、學術資源網站PubMed Abstracts、ArXiv、維基百科、GitHub等等,這些都是從他們先前搭建的Pile資料集中挑出的質量較高的子集。

最終一共提取了2700億個token。

微軟英偉達釋出5300億NLP模型“威震天-圖靈”,花了4480塊A100

五大任務上的準確度測試

開發者在以下5大任務上對MT-NLG進行了準確度測試。

  • 在文字預測任務LAMBADA中,該模型需預測給定段落的最後一個詞。
  • 在閱讀理解任務RACE-h和BoolQ中,模型需根據給定的段落生成問題的答案。
  • 在常識推理任務PiQA、HellaSwag和Winogrande中,每個任務都需要該模型具有一定程度的常識瞭解。
  • 對於自然語言推理,兩個硬基準,ANLI-R2和HANS考驗先前模型的典型失敗案例。
  • 詞義消歧任務WiC需該模型從上下文對多義詞進行理解。

結果該模型在PiQA開發集和LAMBADA測試集上的零樣本、單樣本和少樣本三種設定中都獲得了最高的成績。

在其他各項任務上也獲得了最佳。

微軟英偉達釋出5300億NLP模型“威震天-圖靈”,花了4480塊A100

除了報告基準任務的彙總指標外,他們還對模型輸出進行了定性分析,並觀察到,即使符號被嚴重混淆,該模型也可以從上下文中推斷出基本的數學運算。

微軟英偉達釋出5300億NLP模型“威震天-圖靈”,花了4480塊A100

當然,該模型也從資料中也提取出了刻板印象和偏見。微軟和英偉達表示也在解決這個問題。

另外,他們表示在生產場景中使用MT-NLG都必須遵守微軟的“負責任的AI原則”來減少輸出內容的負面影響,但目前該模型還未公開。

參考連結:

https://www.microsoft.com/en-us/research/blog/using-deepspeed-and-megatron-to-train-megatron-turing-nlg-530b-the-worlds-largest-and-most-powerful-generative-language-model/

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們,第一時間獲知前沿科技動態

分類: 科技
時間: 2021-10-11

相關文章

英偉達全新驅動:針對遠哭6等作最佳化、首支援Win11

英偉達全新驅動:針對遠哭6等作最佳化、首支援Win11
近日,英偉達釋出了一個全新的驅動程式:NVIDIA GeForce 472.12 WHQL,該驅動程式將針對<孤島驚魂6>.<暗黑破壞神2重製版>.<心靈殺手:復刻版&g ...

英偉達全面進軍座艙的第一個作品:現代Genesis GV60車機拆解

英偉達全面進軍座艙的第一個作品:現代Genesis GV60車機拆解
周彥武 圖片來源:網際網路 英偉達除了針對自動駕駛的DRIVE AV全套協議棧還有針對座艙的DRIVE IX全套協議棧,以前英偉達只是單純地販賣晶片,並且DRIVE IX是從針對自動駕駛的Orin晶片 ...

騰訊、阿里總市值均跌出全球前十 英偉達實現反超

騰訊、阿里總市值均跌出全球前十 英偉達實現反超
[CNMO新聞]截至北京時間9月17日2時,在調查分析網站QUICK FactSet統計的總市值排名中,美國人工智慧計算公司英偉達超過騰訊,排到第9名.不過由於該排名中並未包含總市值高達1.8萬億美元 ...

昨夜今晨:英偉達收購ARM或成泡影 小米82英寸電視四折甩賣令人咋舌

昨夜今晨:英偉達收購ARM或成泡影 小米82英寸電視四折甩賣令人咋舌
2021年10月13日 驅動中國昨夜今晨 英偉達收購ARM交易或遭多國監管機構否決 新浪網報道,兩位知情人士透露,英偉達(Nvidia)收購ARM交易最終或以失敗告終, 因為該交易獲得監管部門批准的可 ...

5440億美元!美銀料今年全球晶片銷售額飆升24% 將英偉達等列入首選股票清單
FX168財經報社(香港)訊 據知名財經網站Business Inisider報道,美國銀行(Bank of America)調高了半導體行業的銷售前景,因其看到電腦和汽車用晶片的需求不斷增長,並將英 ...

英偉達Ada Lovelace AD102 GPU或有2.2GHz頻率與384-bit視訊記憶體位寬

英偉達Ada Lovelace AD102 GPU或有2.2GHz頻率與384-bit視訊記憶體位寬
@Greymon55 最新爆料稱:英偉達下一代 Ada Lovelace AD102 GPU 的時鐘速率有望達到 2.2 GHz.搭配 384-bit 位寬的 GDDR6X 視訊記憶體,採用臺積電 5 ...

構成壟斷?馬斯克對英偉達收購晶片設計企業表示擔憂
據英國電訊報報道,對Nvidia(英偉達公司)計劃收購英國晶片設計商Arm(安謀科技公司)一事,特斯拉創始人兼CEO馬斯克表達了競爭方面的擔憂. 該報稱,電商巨頭亞馬遜和智慧手機制造商三星電子也向美國 ...

英偉達已向歐盟做出初步讓步,以確保540億美元收購Arm交易獲批
據外媒報道,歐盟委員會於當地時間週三公佈的檔案顯示,為確保歐盟反壟斷部門批准其以540億美元價格收購英國晶片設計公司Arm的交易,英偉達已做出初步讓步.歐盟委員會將做出決定的最後期限延長至10月27日 ...

截至今年6月 中國網上外賣使用者規模已達4.69億
來源:人民日報海外版 從一日三餐到蔬菜生鮮,從日用百貨到藥品雜物,如今外賣服務覆蓋了人們生活的多個方面.中國網際網路絡資訊中心近日釋出的第48次<中國網際網路絡發展狀況統計報告>顯示,截至 ...

全國發電裝機容量達22.8億千瓦
來源:人民網-人民日報 本報北京9月20日電(記者丁怡婷)記者從國家能源局獲悉:截至8月底,全國發電裝機容量達22.8億千瓦,同比增長9.5%.其中,風電裝機容量約3億千瓦,同比增長33.8%:太陽能 ...

“中國鴨王”身價歸零,信用卡套現達2.1億,被捕後公司破產

“中國鴨王”身價歸零,信用卡套現達2.1億,被捕後公司破產
信用卡雖然在我國十分普遍,但套現屬於違反法律的行為,在現實生活中,還有很多人透過辦理信用卡套現來進行消費或者投資等,這種情況在人們的生活中屢見不鮮,但卻有這樣一個曾資產高達百億的企業家,最後因為非法套 ...

沈騰換成黃渤,《你好!李煥英》票房破54億,賈玲又帶來一部新片

沈騰換成黃渤,《你好!李煥英》票房破54億,賈玲又帶來一部新片
今年暑期檔和中秋檔都創下了近年來的票房新低,這種情況往年不受重視的賀歲檔變得熱鬧起來 自從春節檔脫離賀歲檔變成全年最黃金的檔期,賀歲檔變得越來越雞肋,真正的大片要麼春節檔,要麼上暑期檔,賀歲檔這個跟暑 ...

工信部:我國5G手機使用者達4.19億戶
工信部最新資料顯示,國內5G手機終端連線數已達4.19億戶.在今年8月份,當月消費者戶均移動網際網路接入流量已高達13.73GB,同比增長了22%.

中國聯通8月淨增5G套餐使用者799萬戶 累計達1.29億戶

中國聯通8月淨增5G套餐使用者799萬戶 累計達1.29億戶
(致新/文)9月24日訊息,中國聯通公佈其2021年8月份運營資料,當月中國聯通淨增移動出賬使用者134.2萬戶,累計達3.12953億戶.其中,5G使用者當月淨增798.9萬戶,累計達1.29061 ...

微軟SurfaceDuo2雙屏手機發布,配驍龍888及後置1200萬畫素三攝

微軟SurfaceDuo2雙屏手機發布,配驍龍888及後置1200萬畫素三攝
9月22日無疑是除了9月15日之外,9月份的手機市場最熱鬧的一天,因為不僅魅族.榮耀.真我等都舉辦了釋出會,而且微軟也在這天釋出新一代雙屏手機SurfaceDuo2,並宣佈其將於10月5日開售. Su ...

當英睿達P5遇到擁有專利的安鈦克DF700 FLUX機箱,新的篇章開始了

當英睿達P5遇到擁有專利的安鈦克DF700 FLUX機箱,新的篇章開始了
PCIE 4.0時代來臨了,已經逐漸替代3.0標準的M.2固態硬碟,不過就目前來說,3.0的NVMe M.2固態硬碟還是主力軍,畢竟價格便宜,速度也不慢,而且一般的使用者根本體驗不到4.0到底快了多少 ...

資料圖解丨資料看十一 國內出遊人次達5.15億
光明網訊今年的"十一"黃金週,"補償式出遊"需求強勁,5.15億人次出遊,實現國內旅遊收入3890.61億元.紅色旅遊持續升溫,親子游和研學遊成市場熱門.與此同 ...

截至10月7日17時 2021年我國國慶檔票房達42.46億元
國家電影局初步統計資料顯示,截至10月7日17時,2021年我國國慶檔票房達42.46億元.其中,<長津湖>以30.9億元票房領跑,打破國慶檔影片票房紀錄,<我和我的父輩>以9 ...

升級正當時:英睿達P5 Plus 1TB版PCIe 4.0固態硬碟上手體驗

升級正當時:英睿達P5 Plus 1TB版PCIe 4.0固態硬碟上手體驗
在一年前體驗了讀速 3400 MB/s 的英睿達 P5 系列 PCIe 3.0 SSD 之後,編輯部近日又收到了最新迭代的 P5 Plus 系列 PCIe 4.0 SSD .隨著支援 PCIe 4.0 ...