好菜依序上桌,AMD 遲來 15 年的大反攻即將到來?

作者 | 發布日期 2021 年 11 月 23 日 8:15 | 分類 GPU , 記憶體 , 零組件 Telegram share ! follow us in feedly


被敵人包圍不見得是壞事,尤其當你的實力強過任何對手。

領導普魯士打贏日爾曼統一戰爭(1864年丹麥戰爭、1866年普奧戰爭、1870~1871年普法戰爭)的毛奇,每戰必勝,從未敗北,為其他名將所不及,不僅位極人臣,更克享大年,富貴壽考兼而有之,公認是西方歷史最成功的職業軍人。

他說過一句名言:「我們位於歐洲大國中央,東西鄰國都只有一面受敵,而我們處於腹背受敵。」毛奇最感憂慮的情況即為「斯拉夫的東方與羅馬的西方締結同盟,把日爾曼夾殺在中央」,這也成為日後德國戰爭計畫的核心觀念。

1914年8月4日,也就是英國向德國宣戰、全面引爆第一次世界大戰的日子,假使有旁觀者繞著戰爭賭桌轉一圈,把每個賭客手上牌都看一遍,應該會認為德國贏得賭局的機會是十之八九。戰爭形勢看似對德國頗不利,不過德國卻可集中大部分兵力對付某個敵人。

這也是2006年7月24日以54億美元併購ATi的AMD,外界看好的戰略態勢,同時握有x86 CPU和GPU,藉由融合兩者,可集中全力打擊沒有像樣GPU的英特爾或缺乏x86 CPU的Nvidia。

後來發展起源於Fusion大戰略失策,讓AMD從享有中間位置的地利之便變成兩頭皆空,無論CPU還是GPU,AMD就被英特爾和Nvidia一路輪流圍毆到2018年,像德國在歐陸享有「中央位置」地利之便的AMD,反而弄巧成拙慘遭兩面夾殺。

但AMD今年深秋發動大攻勢,終於充分展現累積多年的成果,更象徵AMD具備針對客戶需求,同步開發多種處理器微架構的研發能量──雖然遲來了整整15年。

由近到遠,一個個仔細看AMD這波攻勢端出的菜色吧。

多512MB第三階快取記憶體的Zen 3世代EPYC衍生款「Milan-X」

蘋果M1 Max上演獨有的「暴力美學」,AMD也有自己的玩法。

自從英特爾1999年3月17日發表內建2MB第二階快取記憶體的Pentium III世代Xeon處理器,業界就一直不缺「英特爾最重要業務不是CPU核心,而是生產快取記憶體」之類的冷笑話。隨著大型化快取記憶體成為處理器晶粒「空照圖」的日常風景,這檔好事也不再只是英特爾的專利。

AMD(或說台積電)積極耕耘多晶片封裝技術早不是新聞,今年5月底就公開展示透過X3D封裝的Ryzen 5000處理器,兩顆8核心CCD(Core Complex Die)各自堆疊一塊64MB第三階快取記憶體(尺寸6×6mm,面積36mm²),讓第三階快取記憶體的總容量從64MB激增到192MB,並帶來高達2TB/s的理論傳輸頻寬,AMD也就理所當然優先導入高利潤伺服器產品線,且隱約飄來一陣「因應特定超大型客戶需求」的味道。

多八塊64MB第三階快取記憶體後的EPYC「Milan-X」,不僅第三階快取記憶體達到驚世駭俗的768MB容量(加上第一階和第二階是804MB),更減少42%~51%記憶體存取延遲,正面回擊英特爾對EPYC「因多晶片架構導致較長延遲」指控。

基本上英特爾第三世代Xeon SP「Ice Lake-SP」就註定被AMD第三代EPYC核心數量和快取容量整個輾過去,據已知資訊,這狀況幾乎確定會延續到下世代競爭(Sapphire Rapids對決Zen 4,後面會提到),也許英特爾資料中心事業群的獲利率,還要好一陣時間才能回到超過個人電腦水準,甚至有可能像變心的愛人,永遠不會回來。

計算機工業史上首款雙晶片封裝GPU:Instinct MI200加速器

但這還不打緊,對AMD來說,2020年財務分析師大會揭露的「雙軌化GPU」發展路線,運算需求最佳化的CDNA體系總算開花結果,讓AMD擁有帳面上硬體規格壓倒Nvidia的高階GPU。

第二代CDNA的Instinct MI200由兩顆「繪圖計算晶粒」(GCD,Graphics Compute Die)和八顆16GB HBM2e記憶體組成,AMD做成OAM(OCP Accelerator Module)強烈暗示鎖定的「那個客戶」,聽說好像是有臉又有書又改名啥元宇宙(筆者實在很不喜歡這個翻譯)的那間公司。

MI200與第三代EPYC處理器的組合,也成為AMD反攻高效能運算和深度學習的主力兵器,「統一AMD所有IP功能區塊控制方式」的Infinity Fabrics也將發揮真正價值。

值得一提的是,AMD近期在超級電腦指標Top500大有斬獲,11月榜單占據多達73台,但極度類似電競筆電「AMD CPU搭Nvidia GPU」風潮,Top500的AMD超級電腦,EPYC旁邊總是多了Nvidia A100。AMD要如何說服客戶用MI200換掉Nvidia方案,也將是值得長期觀察的好題材,特別軟體層面要突破「CUDA生態系統封鎖網」,絕對是天大挑戰。

以下表格同場加映英特爾Xe-HPC,讓大家瞧瞧這三家廠商的旗艦GPU加速卡究竟有何不同。

2021年底的重頭戲:同樣雙軌化的Zen 4

就筆者印象所及,AMD前一次有辦法同步開發兩種x86處理器微架構,扣除1995年併購NexGen後同時操刀K6和K7,就是併購ATi的隔年,宣布大核「推土機」(Bulldozer)和小核「山貓」(Bobcat),且大多數時間都只存在於簡報,兩者都無法準時問世,過程多災多難,直接導致AMD伺服器市場戰線崩潰。

AMD預定採用台積電5奈米製程打造Zen 4並不是新聞,但同時冒出「兩種核心」就讓人極度震撼了,除了最多96核心的Zen 4 EPYC「Geona」,還有128個「雲端運算最佳化」Zen 4c(cloud optimized)核心的Bergamo,說這背後沒有「保證有大客戶下單」絕對是騙人的,也充分印證筆者多年前觀點:AMD擺明全力鎖定資料中心業務,不再追求面面俱到。

更可怕的是,這兩者會同時登場,都支援AVX-512指令集(範圍不明)和BF16浮點數格式,也都是英特爾第四世代56核心4晶片封裝Xeon-SP「Sapphire Rapids」即將面對的對手,屆時英特爾將失去大多數指令集保護傘(AMX會是僅存的明顯強項),這場「核戰」勢必會更精彩,也讓人好奇明年英特爾又會端出怎樣的簡報數落AMD產品的弱點。

AMD目前未透露Zen 4c的規格差異性,有可能是Zen 4縮減快取記憶體容量版,或根本就是全新微架構(例如預先準備Zen 5世代小核),但光是「無法一槍斃命,乾脆就開兩槍」壯舉,就堪稱AMD x86處理器發展史上重大的一步。

驀然回首,AMD距離K8全盛時期還很遙遠

15年來很多事情都變了,英特爾失去製程技術和產能霸權,Nvidia成為高效能運算與人工智慧難以撼動的強權,AMD則穩扎穩打,一步一步爬出泥沼,直到市值爬到英特爾七成,看似「重返農藥」(編按:重返榮耀的網路鄉民用語),但對經歷過AMD全盛時期的讀者來說,應該還是感受到現在的AMD,距離昔日榮光似乎還有一大段距離。

論資料中心和個人電腦市場,英特爾生態系統的完整度,AMD依舊難以望其項背,就高效能運算和人工智慧,Nvidia讓AMD完全看不到車尾燈。英特爾從AMD挖角Raja Koduri砍掉重練GPU產品線,Nvidia更經由併購Arm和Mellanox建立完整CPU與SmartNIC技術能量。換句話說,失去「居中央地利之便」的AMD,優勢並沒有表面巨大,也和過去一樣,從來沒有犯錯的本錢,這些壓力和辛勞,都充分反應於Lisa Su越來越多的白髮。

但總而言之,三年來AMD的確成功擺脫最糟糕的處境,開始有能力正面對戰英特爾和Nvidia。別忘了,AMD手上還有世界第一大FPGA廠商賽靈思,筆者很期待AMD會怎麼善用這張王牌,也持續醞釀蓄勢待發的終極APU「EHP」。有充分理由相信,未來幾年市場競爭只會越來越歡樂,讓不學無術的筆者永遠不缺借題發揮的素材。

(首圖來源:AMD

延伸閱讀:

關鍵字: , ,