sponsored links

AMD祭出殺手鐧,首個百億億級GPU

電子發燒友網報道(文/周凱揚)在不久前結束的 “加速資料中心”釋出會上,AMD正式公開了下一代伺服器CPU Milan-X和GPU加速卡Instinct MI200。這兩大產品系列不僅面向資料中心,也將面向一系列HPC和超算應用,把通用計算和AI效能推向極致。Instinct MI200作為GPU加速卡,更是成為超級計算機百億億級(Exascale)的算力的基本構成單元。

在市場合作上,AMD更是開始了新一輪的攻城略地,前不久剛和騰訊聯合釋出了星星海伺服器產品後,如今Azure等一眾公有云廠商也開始部署基於Milan-X的伺服器,甚至將剛改名為Meta的Facebook也被拉攏至AMD陣營,宣佈將在其資料中心部署AMD的伺服器產品。

Milan-X:6nm的大快取怪獸

繼上一代Milan處理器推出後不到一年,AMD就釋出了該晶片的6nm改進版Milan-X。今年上半年透過融合Chiplet和Die堆疊兩大技術,在Ryzen桌面處理器上做了3D Chiplet架構的演示。如今第三代Epyc處理器Milan-X,將成為首個使用該技術的伺服器產品。透過在Chiplet上堆疊快取,Milan-X的L3快取是Milan的三倍,達到了可怕的768MB。

AMD祭出殺手鐧,首個百億億級GPU

MilanX / AMD

與英特爾一樣,AMD在正式發售前並沒有公佈Milan-X的具體效能細節,而是透過合作伙伴的測試來展示了Milan-X在EDA和公有云應用中表現。在新思的VCS功能驗證中,Milan-X在1小時內完成了40.6項任務,而同樣核心數的Milan僅完成了24.4項。微軟在基於Milan-X的Azure伺服器中進行了早期測試,無論是在航天模擬,還是在汽車碰撞測試建模中,Milan-X都做到了50%以上的效能提升。

AMD祭出殺手鐧,首個百億億級GPU

Milan與MilanX在新思VCS上的對比 / AMD

除此之外,AMD CEO蘇資豐博士還透露了下一代5nm Epyc處理器Genoa的情報。基於Zen 4架構的Genoa將具備2倍的電晶體密度和2倍的能效,效能可以達到上一代的1.25倍以上。Genoa最高支援96個Zen 4核心,同時也將加入一系列新標準的支援,比如DDR5、PCIe 5.0和CXL。AMD還將推出基於5nm的Zen 4C核心的處理器Bergamo,專門針對要求多核多執行緒的雲原生計算,最高核心數將達到128核,晚於Genoa釋出。

Genoa計劃在2022年量產和釋出,屆時很可能就是英特爾的Sapphire Rapids和AMD的Genoa在通用計算領域爭雄了。

Instinct MI200:GPU終於迎來MCM時代了?

除了Milan-X之外,釋出會的最大亮點其實是全球首個MCM GPU,Instinct MI200。同樣基於臺積電的6nm工藝,Instinct MI200系列單晶片的電晶體數目達到580億,最高集成了220個計算單元。作為首個採用AMD CDNA2架構的伺服器GPU,Instinct MI200的目標很明確,那就是將計算能力推向ExaScale級。

AMD祭出殺手鐧,首個百億億級GPU

Instinct MI200 GPU / AMD

在CDN2架構和第二代HPC&AI專用矩陣核心的支援下,Instinct MI200實現了遠超競品的效能表現。資料對比環節,AMD選擇拿Nvidia目前最強的A100加速卡開刀。MI250X的FP64向量計算能力達到47.9TF,FP64矩陣計算能力達到95.7TF,均為A100的4.9倍。而在AI領域常用的FP16和BF16矩陣計算中,MI250X的算力也達到了383TF,是A100的1.2倍。即便兩者都用上了HBM2E,MI200的記憶體頻寬也達到了3.2TB/s,遠超A100的2TB/s。不過MI250X的功耗確實要高出不少,峰值狀態下的功耗可以達到560W,而A100的峰值功耗為300W。

AMD祭出殺手鐧,首個百億億級GPU

EFB示意圖 / AMD

與英特爾這種IDM廠商不同,AMD在封裝上基本吃透了與臺積電合作帶來的技術紅利,尤其是臺積電的3D Fabric封裝技術集合,而Instinct MI200則是這些技術的集大成之作。作為首個採用多Die設計的GPU,Instinct MI200選用了兩個SoC+8個HBM2E的方案,AMD在釋出會上宣稱這一設計的實現要歸功於2.5D的Elevated Fanout Bridge(EFB)架構。

AMD祭出殺手鐧,首個百億億級GPU

InFO-L/LSI技術 / 臺積電

從圖解上來看,AMD的EFB與臺積電的InFO-L 2.5D封裝技術可以說是從一個模子裡刻出來的。在專門用於HBM整合的方案,目前可以做到這種規模的異構似乎也只有臺積電的InFO-L和CoWoS-L,利用LSI(本地矽互聯)晶片,為SoC到SoC與SoC到HBM提供高佈線密度的互聯。

其實英特爾也有類似的2.5D封裝方案EMIB,只不過該方案是在基板內放入一個矽橋die。而反觀AMD的EFB和臺積電的LSI方案則是將其置於基板的模具中,模具內分佈著一系列銅柱。相較之下,EMIB雖然可以做到更低的寄生電感,卻也對於基板的加工提出了很高的要求,這也是為何只有英特爾這個基板大廠才使用EMIB的原因之一。不過隨著IDM 2..0模式的展開,英特爾也將公開提供自己的製程、IP和封裝技術,未來也許會有其他廠商的晶片開始用上EMIB。但目前來看,雖然增加了高度控制的挑戰,但為了使用標準的基板降低成本,EFB和LSI明顯是最優解。

在外觀尺寸上,AMD選擇了OAM和PCIe兩種形式。OAM為開放計算專案(OCP)定下的通用加速器模組標準,對於想要規模化部署GPU或其他加速器來說,OAM可以提供更大的頻寬。作為Facebook和微軟共同推行的公開標準,OAM已經在伺服器領域有了不小的規模,不僅是英特爾、AMD和英偉達這些半導體廠商,浪潮、聯想、百度和阿里巴巴等其他伺服器與公有云廠商也開始支援這一標準。

目前OAM的MI250和MI250X已經進入可交付階段,從今年第三季度起,AMD就已經在為美國能源部的橡樹嶺國家實驗室持續交付MI250X GPU了,用於組成美國首個ExaScale級別的超級計算機Frontier。除了OAM模組外,AMD也將在不久提供PCIe版本的MI210,用於非密集運算的場景。

結語

隨著英特爾、三星和臺積電在2.5D/3D封裝技術上的逐漸成熟,伺服器晶片將成為受益最大的產品,未來2+8甚至3+8的MCM GPU可能更加常見。英偉達、AMD與英特爾三家在伺服器/資料中心市場上的動向,也側面體現了IDM與Fabless廠商之間在技術選擇上的差異。英特爾如果不能儘快在製程和封裝上超越臺積電這樣的晶圓代工廠,在伺服器市場的優勢可能會越來越小。

分類: 寵物
時間: 2021-11-10

相關文章

華為:即將全新發布作業系統openEuler尤拉
IT之家 9 月 23 日閃訊速報,華為:即將全新發布作業系統openEuler尤拉. IT之家正在為您整理更細節的內容,本文將在幾分鐘內得到更新,請您在App或瀏覽器中重新整理本文即可. IT之家閃 ...

華為將全新發布作業系統openEuler尤拉
澎湃財訊 華為計算官微公告:9月25日,華為將全新發布作業系統openEuler尤拉. 責任編輯:周玲

多家公司將參與見證尤拉全新發布
華為官微訊息,9月25日,華為將全新發布作業系統openEuler尤拉,主題為"匯聚作業系統創新力量,閃耀數字時代星辰大海".多家公司在官方渠道表示將參與尤拉全新發布:普元資訊表示 ...

A15處理器全新發布:效能領先競品50%

A15處理器全新發布:效能領先競品50%
iPhone 13系列如期而至,新一代A15處理器也如期而至,意外的是第六代iPad mini用的也直接就是A15,要是到上一代還是A12. A15處理器整合多達150億個電晶體,對比上代115億個增 ...

華為宣佈將釋出全新作業系統;Win11 新預覽版改善體驗修復 Bug

華為宣佈將釋出全新作業系統;Win11 新預覽版改善體驗修復 Bug
0.Win11 新預覽版 22463 推送:改善體驗.修復BUG 今晨,微軟面向Dev通道的Insider會員推送了新預覽版,作業系統版本號Build 22463. 此次更新的主要內容在於UI小幅改進 ...

智算中心高效排程“舵手”面世 浪潮釋出新版AIStation推理服務

智算中心高效排程“舵手”面世 浪潮釋出新版AIStation推理服務
當前,我國正加速打造新一代人工智慧算力基礎設施,智算中心作為普惠型人工智慧新型基礎設施在政策扶持.多地發展需求推動下,目前已在各地掀起落地潮.近期,南京已率先落地了計算能力達每秒80億億次的南京智慧計 ...

全新的阿里媽媽來了

全新的阿里媽媽來了
作為全球最大消費市場,中國正迎來跨時代的消費鉅變--觸點豐富多元卻更割裂.行為路徑多樣卻更復雜.需求從被動轉為主動卻更跳躍.因此,"透視消費者全鏈路行為,洞察消費者深層次需求和提升經營策略的 ...

路虎衛士全新升級!90混動車型科技與豪華並存,最大功率400馬力

路虎衛士全新升級!90混動車型科技與豪華並存,最大功率400馬力
路虎衛士從1948年面世以來,一直都是無數越野愛好者心裡殿堂級的存在.最開始的路虎衛士經過加裝配件就是非洲草原上拍攝野生動物的標配工作車,越野性毋庸置疑.到了如今,隨著當今時代新車的科技化進步,硬派越 ...

鴻蒙之後,華為將釋出新作業系統openEuler尤拉

鴻蒙之後,華為將釋出新作業系統openEuler尤拉
據@華為計算 官微訊息,9月25日,華為將全新發布作業系統openEuler尤拉. 尤拉的定位是瞄準國家數字基礎設施的作業系統和生態底座,承擔著支撐構建領先.可靠.安全的數字基礎的歷史使命,既要面向伺 ...

海信璀璨C1 Pro釋出:極簡互動,才是真正的套系智慧家電

海信璀璨C1 Pro釋出:極簡互動,才是真正的套系智慧家電
智慧套系家電越來越火,但互動體驗與使用者期待相差甚遠,很多功能徒增繁瑣的人工操控,不僅沒有給生活帶來方便,反倒更加束縛人.9月23日,海信正式釋出新一代高階智慧套系家電璀璨C1Pro,全面擴容套系產品 ...

海信釋出璀璨C1 Pro套系 一站式解決全屋家電問題

海信釋出璀璨C1 Pro套系 一站式解決全屋家電問題
"產品調性不一樣,放在房間裡也太醜了""買到成套智慧家電,結果一到關鍵時刻,全從智慧變智障.."顯然,以往割裂式的家電產品已經無法滿足高階使用者對產品美學調性的 ...

搶先體驗宇通新款房車,12V和48V兩種電路任選,適合兩大兩小玩

搶先體驗宇通新款房車,12V和48V兩種電路任選,適合兩大兩小玩
Hello,大家好! 今天我們坐了將近3個小時的高鐵來到了位於鄭州的宇通房車工廠內,目的有兩個:第一,就是來體驗宇通的幾款全新車型:第二呢,就是來參加第四屆宇通嗨購節,悄悄地告訴大家,現場新車超多,還 ...

雙層地板的房車?國產房車大升級!羅曼特斯C100橫床版房車

雙層地板的房車?國產房車大升級!羅曼特斯C100橫床版房車
這是一款羅曼特斯全新發布的車型羅曼一號,共有兩款,C100是橫床版本,C200是縱床版本,這臺車的體貼之處體現在各個方面,小到金屬件,大到水電配置無一不體現出它的體貼.今天我們就來看看C100橫床版 ...

蘋果挑戰安卓之光能贏?iPhone13ProMax和小米11Ultra拍照對比

蘋果挑戰安卓之光能贏?iPhone13ProMax和小米11Ultra拍照對比
iPhone13ProMax作為蘋果全新發布的頂級旗艦機型,雖然還是搭載的1200萬畫素鏡頭,但是在拍照方面有了不少升級.而小米11Ultra在釋出之初被稱為是安卓之光,拍照效果是非常強悍的.那麼iP ...

不負熱愛,奔赴山海,“919 Leader之夜”盛況來襲

不負熱愛,奔赴山海,“919 Leader之夜”盛況來襲
黃埔江岸,霓虹閃爍:江水之上,精緻的和盈號遊輪迎著波濤,踏浪而來. 9月19日,"919Leader之夜"在黃浦江遊輪上璀璨開啟.上海交電家電行業協會秘書長韓建華.海爾智家中國區L ...

淶源:《石之戀》原創國風音樂劇上演 講述太行故事

淶源:《石之戀》原創國風音樂劇上演 講述太行故事
來源:人民網 人民網保定9月20日電 (張繼航)" 一段跨越千年的愛情傳奇在巍巍太行北端.淙淙拒馬河畔上演,采薇與上林在雨中相遇,因石結緣,因愛相思......"中秋佳節之際,&l ...

鴻蒙概念股大幅走強 誠邁科技領漲
e公司訊,9月23日早盤,鴻蒙概念股大幅走強,截至發稿,誠邁科技大漲20%,潤和軟體.九聯科技.芯海科技.科藍軟體等漲幅居前.訊息面上,華為將全新發布作業系統openEuler尤拉.

「早知道」美股三大指數收盤均漲超1%;HarmonyOS 2升級使用者破1.2億

「早知道」美股三大指數收盤均漲超1%;HarmonyOS 2升級使用者破1.2億
摘要:今日可申購麗臣實業.春雪食品.HarmonyOS 2升級使用者破1.2億,每天超100萬用戶升級鴻蒙.央行推動常備借貸便利操作方式改革和落實3000億元支小再貸款政策.上交所三季報預約披露時間表 ...

8點1氪:順豐將下架“簽收確認”收費1元服務;蘋果累計售出20億部iPhone;鴻蒙OS 2使用者突破1.2億
上市進行時 東莞農村商業銀行 東莞農村商業銀行將在香港IPO中籌資12億美元,定價為每股7.92港元.(彭博) 福佑卡車 據一位接近福佑卡車的知情人士表示,福佑卡車正在評估轉港上市的可行性,內部已就轉 ...

下一代釘子戶穩了!iPhone 13 Pro應該問題不大,下面這四點太強了

下一代釘子戶穩了!iPhone 13 Pro應該問題不大,下面這四點太強了
"釘子戶"這個詞,最近幾年在智慧手機行業頗為流行,而最具代表性的機型莫過於小米6和iPhone 6這兩款神機了,不過再怎麼釘子戶這兩款手機也已經很多年了,著實無法滿足當下的需求了, ...