sponsored links

堆疊 AMD MI200 與 NVIDIA A100 計算引擎

堆疊 AMD MI200 與 NVIDIA A100 計算引擎

現代 GPU 計算引擎是整個高效能計算資料中心的縮影。在 HPC 的每個級別——跨資料中心的系統、在不同伺服器節點的叢集內、在具有不同和不同計算引擎的叢集節點內,以及在每種型別的計算引擎本身內——在數量和型別上都有混合正在進行的計算。

因此,購買超級計算機意味著嘗試預測您在未來三到四年(可能更長)內需要的新舊工作負載的組合,並確保您可以執行舊的東西並仍然接受新的東西。考慮到計算引擎的多樣性以及 CPU、GPU、FPGA 和定製 ASIC 的可能組合,在給定級別或整數或浮點精度下可能的效能組合數量是驚人的。

我們會開玩笑說,您需要一個注入了 AI 的 HPC 模型,可能嵌入水晶球中,以嘗試弄清楚要購買什麼——以及購買什麼容量——但這可能不是開玩笑。這是一個非常困難的提議,沒有什麼比試圖弄清楚 AMD上個月宣佈的新的“Aldebaran”Instinct MI200 系列 GPU 是如何更明顯的了,與 Nvidia 的“Ampere”A100 系列 GPU 相抗衡。但正如我們之前指出的,無論是在餐巾紙的背面還是在複雜的電子表格中,構建 HPC 和 AI 系統的客戶都必須嘗試弄清楚這些裝置在街上的成本以及它們的關鍵效能指標估計使用它們構建的美元系統將帶來的價值。然後他們必須考慮成熟軟體堆疊的價值才能使用這些裝置,這是非常難以量化的。

早在 2020 年 5 月,針對大型計算作業的資料中心並基於 GA100 GPU 的 Nvidia Ampere GPU 加速器就已釋出,而高階 A100 裝置則於 2020 年 11 月透過更大的 80 GB HBM2e 記憶體進行了增強。從那時起,英偉達又增加了一堆基於 Ampere 架構的加速器,包括2020 年 10 月的 Ampere A40 和 A6000 加速器,基於 GA104 GPU,2021 年 4 月的 Ampere A10 和 A30,基於 GA102 和 GA100 GPU分別是 2021 年 11 月的 Ampere A2,基於 GA107 GPU。

雖然總是有可能對 Ampere GPU 和不同的卡進行更多調整,但我們懷疑 Nvidia 將保持公開乾燥,直到明年 A100 首次亮相的“Ampere Next”踢球者準時為他們的兩個很可能在 2022 年 3 月 GTC 2022 在聖何塞舉辦時。大家認為Ampere Next GPU的代號也是“Hopper”,只是為了避免混淆。我們不確切知道將進行哪些架構更改,但我們非常確定 Nvidia 將在臺積電將工藝縮小到 5 奈米技術(N5 和 N4 是可能的,但 N4P 工藝,進一步的 5 奈米改進,贏得了直到 2023 年才可用)。英偉達可能不會透過 Hopper GPU 一直推到 3 奈米技術 (N3),並且那是因為那個 N3 過程顯然有一些問題。

無論如何,英偉達將透過 Hopper GPU 增加電晶體數量並新增許多功能。我們強烈懷疑 Nvidia 將轉向核心 GPU 計算引擎的小晶片架構,並最終轉向 3D 封裝技術。

關鍵在於:AMD 的 Aldebaran GPU 在許多指標上比當前的 Ampere GA100 GPU 提供了顯著的效能改進,但基於 Aldebaran GPU 的 Instinct MI210、MI250 和 MI250X 加速器尚未批量出貨給任何人除了美國能源部用於橡樹嶺國家實驗室的 1.5 exaflops “Frontier”超級計算機。到 AMD 將 Instinct MI200 投入生產領域時,無論 Nvidia 決定如何稱呼它,Hopper 都將是指日可待。

但就目前而言,Aldebaran GPU 的饋送和速度使其成為 Nvidia A100 的引人注目的替代品——當然,只要您可以讓您的程式碼在它們上執行。

在一個月前 Aldebaran 釋出前的簡報中,Brad McCredie 在兩年多前轉為 AMD 成為 GPU 平臺的企業副總裁之前曾負責 IBM 的 Power 處理器開發多年,他整理了這張圖表,比較了具有 64 位浮點效能的 Nvidia GPU 加速卡的峰值雙精度效能——“Maxwell”GPU 沒有太多 FP64,這就是為什麼“Kepler”和“Pascal”和“Volta”和“安培”代僅顯示在此圖表上 - 隨著時間的推移。

堆疊 AMD MI200 與 NVIDIA A100 計算引擎

值得注意的是,基於 AMD 的“Vega10”和“Vego20”以及“Arcturus”GPU 的前幾代 Instinct MI50、MI60 和 MI100 GPU 加速器未顯示在上圖中。但是我們瀏覽了這裡的所有提要和速度如果你想把它們記下來。 Vega10 和 Vega20 GPU 不支援矩陣數學單元,不支援低於 FP16 的混合精度數學,也不支援常用於機器學習推理的整數運算。MI60 幾年前應該是高階 GPU,但從未真正以任何重要的方式推向市場,AMD 也沒有過多談論它。藉助 Arcturus 晶片,AMD 轉向只專注於資料中心計算的 CDNA 架構,並沒有給出關於圖形效能的卡片,並在該領域放置了一個可靠的引擎,該引擎在 FP64 和 FP32 方面做得很好,並增加了對矩陣數學的支援FP64、FP32、FP16 和 Bfloat16 格式。

藉助 Aldebaran GPU,AMD 建立了一個 GPU tile,它支援所有必要的向量和矩陣單元,並具有所有適當的精度和格式,然後將其中兩個 tile 放在 Instinct MI200 系列卡上,以雙重打擊Infinity Fabric 連結和 HBM2e 記憶體。以下是 McCredie 如何將 AMD 的 Aldebaran 與 Nvidia 的 A100 相提並論:

堆疊 AMD MI200 與 NVIDIA A100 計算引擎

對於 Aldebaran 設計,顯而易見的是 AMD 全力以赴進行 FP64 向量處理,用於天氣建模和其他型別的物理模擬以及機器學習訓練,以及用於 FP32 向量處理,用於用於訊號處理和遺傳學模擬等。我們認為英偉達本可以放棄符合這些規格的 Hopper GPU,但可能不會以美國政府願意支付的價格。IBM 和 Nvidia 已經向能源部出售了兩臺前 exascale 超級計算機,“Summit”在橡樹嶺,“Sierra”在勞倫斯利弗莫爾國家實驗室,而且似乎並不熱衷於以低價重複這個過程,這是我們的猜測. 他們沒有什麼可以證明的,但 AMD 做到了。因此,惠普企業和 Cray 與 AMD 合作,

A100 和 MI200 不僅是兩個正面競爭的不同加速器,而且是兩個具有不同饋送、速度、插槽、功率和價格的裝置系列。所以這是一個更完整的表格,展示了 Aldebaran GPU 加速器如何疊加到 Ampere GPU 加速器:

堆疊 AMD MI200 與 NVIDIA A100 計算引擎

AMD 並未過多提及基於 Aldebaran GPU 的 Instinct 卡的 PCI-Express 變體,即 Instinct MI210,因此我們嘗試了一下它可能是什麼樣子。我們假設時鐘速度降低並且所有計算單元都處於活動狀態,但承認它可能有更多的計算單元因晶片上的缺陷而閒置(以提高來自臺積電的晶片的整體有效良率)和更高的時鐘速度。它可以具有更低的時鐘速度和更少的計算單元以及更少的 HBM2e 記憶體。你明白了。

如果 Nvidia 願意,Hopper 可以只用兩個 A100 在小晶片架構中拍打,但這不足以匹配 Aldebaran 擁有的 4.9X FP64 向量和矩陣效能優勢,而且,是的,Nvidia 在以下情況下具有很大優勢它涉及混合精度和數字格式,特別是如果應用程式適合稀疏矩陣計算(AMD 尚不支援)。但是對於核心 HPC 客戶,他們需要做一些推理甚至大量推理,但他們不必在推理領域與 FPGA 或 Nvidia 等定製 ASIC 競爭,這與通用安培背後的整個想法有關用於資料中心的 GA100 GPU。

看看英偉達究竟做了什麼會很有趣,而且肯定會期待 AMD 用其 Instinct GPU 加速器贏得美國三大百億億級合同中的兩個。

當然,重要的是 MI200 與 A100 在 HPC 基準測試和實際 HPC 應用程式上的效能。McCredie 提供了這張圖表作為思考的食物:

堆疊 AMD MI200 與 NVIDIA A100 計算引擎

如您所見,效能資料絕對有利於 Aldebaran GPU,在常見的 HPC 基準測試中,每一半的效能都比整個 A100 多一點,但比右側所示的 HPC 應用程式的效能要低一點這張桌子的。差距並不像原始資料和速度所顯示的那麼大,我們認為這與 AMD 用於自己 GPU 的 ROCm 堆疊中的編譯器和數學庫的成熟度有關,而 Nvidia 用於其自己的 GPU 的 CUDA 堆疊。僅在 Frontier 系統中就有 1 億美元的非經常性工程資金試圖縮小 ROCm-CUDA 的部分差距。

真正重要的是裝置的價效比,因此我們採用了 Nvidia A100 的街頭價格,以黑色顯示,然後以紅色顯示估算。AMD MI200 系列 GPU 加速器的定價估計是我們認為的平衡價格,在 HPC 中常見的 FP64 和 FP32 工作負載上提供了非常好的競爭優勢,然後在混合精度的東西上獲得了可觀的收益。

為了檢查我們的預感,我們做了這個小小的思想實驗。假設 Frontier 中定製的 64 核“羅馬”處理器的流行價格標籤約為 5,000 美元,並假設整個機器 5 億美元的成本中有 20% 用於 Slingshot 網路、磁碟儲存和 Shasta 機箱,以及 15 % 是主存,那麼 CPU 和 GPU 的成本應該是機器總成本的三分之二左右嗎?Instinct MI250X 的答案是 8,000 美元。如果你逆向做一些粗略的計算,Summit 超級計算機中使用的 V100 GPU 加速器在系統中的售價約為 7,500 美元,售價約為 4,000 美元。假設英偉達可能在 GPU 上提供的折扣水平相同,那麼 MI250X 的定價應為 14,500 美元左右。

如果您做出所有這些假設,那麼以下是這兩個 GPU 系列在峰值理論效能指標上的疊加效果:

堆疊 AMD MI200 與 NVIDIA A100 計算引擎

真正、真正重要的是美元在現實世界工作負載上的價值,但我們必須等到有實際價格和實際基準才能進入。足夠危險地推斷當天。我只想說,如果實際基準測試和實際工作負載的效能差距沒有那麼大,那麼價格/效能差距也不會那麼大。但很大程度上取決於定價,在明年 AMD 批量出貨 MI200 之前,這些可以隨心所欲地改變。

來源:內容編譯自thenextplatform,侵刪!

分類: 星座
時間: 2022-01-05

相關文章

工程人的福利:超全工程施工全過程詳解教程,唯獨一份一週後刪除

工程人的福利:超全工程施工全過程詳解教程,唯獨一份一週後刪除
工程人的福利來了!超全的工程施工全過程詳解發布,唯獨一份一週後刪除,還不快來領取! 作為一個工程人,咱們首先要做的就是詳細瞭解工程施工的全過程,但是會有很多工程人和小白們對工程施工全過程都是一知半解的 ...

本以為是感冒,卻診斷為腦出血,一週後去世!腦出血發生有何症狀

本以為是感冒,卻診斷為腦出血,一週後去世!腦出血發生有何症狀
患者男,62歲,來醫院的時候只是說感冒了,發燒好幾天不見好,吃藥也不管用.其實,他在他們那兒的診所已經輸了幾天的液了,但就是不見好.女兒不放心,所以陪父親來檢查一下.可是,患者本人很不情願,一直在唸叨 ...

寶寶剛入園時很開心,一週後哭鬧不願意去幼兒園,給家長出妙招

寶寶剛入園時很開心,一週後哭鬧不願意去幼兒園,給家長出妙招
#頭條開學季# 文:夢雨創作,歡迎閱讀,轉發分享.點選右上角加關注,分享育兒乾貨文. 3歲的小核桃,新學期剛入園,奶奶說,小核桃很喜歡去幼兒園,每天早早起來,送幼兒園時沒哭過,每天高高興興去上幼兒園. ...

拳王富里正式抵達美國,3周後大戰維爾德!專家:小心為妙

拳王富里正式抵達美國,3周後大戰維爾德!專家:小心為妙
日前,WBC重量級拳王泰森-富里,已經正式抵達美國,為下月9日在拉斯維加斯與德昂泰-維爾德三番戰做準備.富里所在的頂級推廣公司,釋出了一條官方推特,曬出了一張富里走下飛機的照片.照片中,富里精神狀態看 ...

早上起床以後,堅持用細鹽洗臉,一週後,4個變化很明顯

早上起床以後,堅持用細鹽洗臉,一週後,4個變化很明顯
在平時做菜的時候,一定要放一種調味品就是鹽,很多食物如果不放鹽,會很難以下嚥,大家都知道,吃鹽太多會影響人的身體健康,對腎臟造成負擔,如果長期不吃鹽,對身體也是不利的,鹽不僅僅可以用來吃,還可以用來洗 ...

1周後,貴人相助,好運不絕,事業騰飛,步步高昇,終於苦盡甘來

1周後,貴人相助,好運不絕,事業騰飛,步步高昇,終於苦盡甘來
射手 射手常常假裝對周圍的事物漠不關心,他們模稜兩可的個性使人困惑,射手只想追求自己的目標,他們不會輕易放棄,射手會把一切想象得非常美好,他們總是相信自己一定可以獲得成功,在工作中,射手會直接表達自己 ...

小黑貓被火燒傷,救出8周後,它實現了蛻變

小黑貓被火燒傷,救出8周後,它實現了蛻變
文/王大野的貓 不久前,一隻6周大的小黑貓被送到了佛羅里達州海牛縣動物收容所,它的身體和腳趾被嚴重燒傷,急需救助. 得知這個訊息後,創始人薩曼莎·福克斯( Samantha Fox)立刻趕到現場.她很 ...

帶狗狗坐飛機,意外失蹤卻無人告知,一週後在機場郊外找到

帶狗狗坐飛機,意外失蹤卻無人告知,一週後在機場郊外找到
身邊飼養著愛寵,又經常外出的人,不放心將愛寵留在家中的飼主,大部分人都選擇了"寵物空運",讓愛寵時刻陪伴在自己的身邊. 俄羅斯的女子"多莫"與家人商量要一起出行 ...

孕37周後胎兒足月,想更好“卸貨”?關鍵知識點孕媽知道還要做到

孕37周後胎兒足月,想更好“卸貨”?關鍵知識點孕媽知道還要做到
文|菁媽 懷孕就像是萬里長征,越到後面人越疲憊,越巴不得趕緊卸貨. 很多孕晚期的媽媽朋友圈發"催生符":晚上又睡不著了,趕緊卸貨吧!走路都覺得自己臃腫得像只企鵝,祈禱快點卸貨!#孕 ...

《名偵探柯南》休刊9周後復刊,首個案件就和警校五人組有關

《名偵探柯南》休刊9周後復刊,首個案件就和警校五人組有關
在經過長達9周的休刊後,<名偵探柯南>的漫畫終於又繼續復刊了.或許是在替即將到來的新劇場版預熱,復刊之後的第一案件就出現了多名劇場版的主角,其中包括高木.佐藤這對情侶,以及警校五人組中的安 ...

十二星座一週運勢,星座天氣預報2021.10.11- 10.17

十二星座一週運勢,星座天氣預報2021.10.11- 10.17
來自:@食阿 白羊座周運 白羊座在本週的感情進展不是特別順利,尤其在週三到週日之間,如有見家長的計劃最好暫時擱置,這段時間自身的戀情發展容易得到家人的反對. 單身的白羊座本週很難有脫單的機率,而且有表 ...

人前強大,人後脆弱的星座

人前強大,人後脆弱的星座
人前強大,是因為不願意表現出自己的脆弱,在事業上才會要求得特別地高,人前強大,是因為不願意服輸,更要強,脆弱是什麼?脆弱是不願意表現出來,跟著星座洞君一起來看看都有哪些星座吧 射手座 射手座人前看起來 ...

上線一週後,哈利波特持續霸榜,流水已破3億卻非網易唯一殺招

上線一週後,哈利波特持續霸榜,流水已破3億卻非網易唯一殺招
最近,要說卡牌界有什麼"地震",那網易新上線的哈利波特手遊一定是"震源"了,自從哈利波特手游上線之後,便是橫掃各大熱門遊戲榜單,熱度甚至一度超過了王者.和平精英 ...

越南買20枚導彈,使用一週後要求退貨,俄:他們的武器你還敢買

越南買20枚導彈,使用一週後要求退貨,俄:他們的武器你還敢買
印度總是在國際上稱自己為世界第三大國,並且認為自己國家是南亞霸主,是東南亞地區軍事裝備軍事力量最強大的國家.但實際上,儘管印度擁有許多高精尖的武器裝備,但大多數都是進口於發達國家,國內很少有自身研發製 ...

美國部隊如何在 9/11 事件發生僅幾周後完成對塔利班的創紀錄打擊

美國部隊如何在 9/11 事件發生僅幾周後完成對塔利班的創紀錄打擊
9月11日 襲擊事件發生數小時後,美國軍方已經在計劃對基地組織的主謀及其東道主阿富汗塔利班做出回應. 政策制定者和軍事規劃者討論了若干行動方案.中央情報局和陸軍特種部隊小組將從北部和南部滲透,並與當地 ...

孕婦邁入21周後
自從進入21周多,孕婦和非孕婦的區別就出來了,最深切的感受就是尿意頻頻,明明上一秒剛從洗手間出來,還沒坐下感覺又想去洗手間了,但是當你再次去洗手間又什麼都上不出來!尿意頻頻,但是實際上又沒什麼尿,寶寶 ...

iPhone13系列首發使用一週後體驗——小碎念,獻給強迫症的你

iPhone13系列首發使用一週後體驗——小碎念,獻給強迫症的你
交代背景: 附上首發訂單 1.螢幕玄學 今年螢幕序列號是隨機的,不存在去年誰好誰壞的說法,需要自行判斷. 判斷方法: 開啟深色模式.關閉原彩顯示.關閉夜覽模式.關閉自動亮度調節.關閉降低白點值,亮度最 ...

AC米蘭官方:邁尼昂手術成功,預計10周後重返球場

AC米蘭官方:邁尼昂手術成功,預計10周後重返球場
AC米蘭官方宣佈門將邁尼昂左手腕關節鏡手術成功,並且公佈了具體的恢復時間,法國人將在10周之後重返球場. AC米蘭官方公告如下: 今天門將麥克-邁尼昂接受了關節鏡檢查,發現左手腕韌帶受傷,目前已經修復 ...

懷孕24周後,竟然發現胎兒心臟嚴重畸形,欲引產竟拖到28周
韓月想要入院做引產手術,但已經拖了一個月還沒有做手術,隨後在抽血的時候發生了矛盾.她的母親便開始在醫院大吵大鬧,還說有關係的給優先待遇,這究竟是怎麼一回事呢? 在醫院裡面大吵大鬧,韓月的母親便說道,有 ...

1.9T柴油動力配非承載車身+後差鎖,全新D-MAX獠牙前臉更兇悍

1.9T柴油動力配非承載車身+後差鎖,全新D-MAX獠牙前臉更兇悍
今年前5個月,國內皮卡銷量累計達到22.7萬臺,其中長城獨佔43%的份額,中高階皮卡中長城炮更是一家獨大,除此之外,江鈴汽車和鄭州日產的份額都還不錯,至於老皮卡生產廠商,江西五十鈴則排名第四,主要銷量 ...