Hot Chips 2023》一窺 AMD Ryzen 7040 Phoenix 技術細節

作者 | 發布日期 2023 年 09 月 26 日 8:10 | 分類 IC 設計 , 半導體 , 技術分析 line share follow us in feedly line share
Hot Chips 2023》一窺 AMD Ryzen 7040 Phoenix 技術細節


雖然 AMD 早在 2006 年 7 月就以 54 億美元併購 Nvidia 最大對手 ATi,成為兼具 CPU 和 GPU 的強權,也將融合兩者的「Fusion」與 APU(Accelerated Processing Unit)視為戰略核心(EHP 首發 MI300 堪稱累積超過十年努力的集大成),但 AMD 在筆電市場卻走得相當艱辛,即便 21 世紀前幾年,靠 K8 庇蔭,讓「64 位元行動平台處理器」Turion 64 在筆電市場取得些微成就,但隨即消逝無蹤。

▲ AMD 2022 年重整行動處理器的命名原則,但混亂產品線還是讓人一頭霧水,筆者也有點懶得做新舊名稱對照表了。

2010 年初,英特爾 Westmere 世代取得能效和內顯巨大進步,但反觀手握 ATi 的 AMD,APU 往往使用非常過時的繪圖架構。「為運算而生,不太像為了遊戲」初代 GCN(Graphic Core Next)獨顯,早在 2012 年 1 月隨著 Radeon HD7000 問世,但很長一段時間 APU 還停在 Terascale 3。AMD 2021 年第一季推出配備 Vega 繪圖核心(第五代 GCN)Ryzen 7 5800H(Cezanne-H),但獨顯升級成「真正為了遊戲考量」的 RDNA 2。

▲ AMD 最終還是不得不將 GPU 架構「遊戲」和「運算」分而治之,但筆者會繼續關心 Fluid Motion 這看影片的補幀好工具何時復活。

所幸 AMD 近期產品已扭轉尷尬局面,2021年 Van Gogh(Steam Deck 可攜式遊戲機專用)2022 年 Rembrandt 最終導入 RDNA 2 內顯,而「好像能效可看到蘋果車尾燈」Ryzen 7040「Phoenix」更結合最新 Zen 4 CPU 和 RDNA 3 GPU。

AMD 在 Hot Chips 2023(第 35 屆)特地安排講解技術細節議程,各位也可看到之前可能無從得知的精采資訊,值得一看。

▲ 這頁呈現 CPU、GPU 和各種專用加速器(如 XDNA 的 AI Engine)泛用性與能耗比的差別,XDNA 加速器有助機器學習推理,音效控制器可減輕 CPU 訊號處理負擔,Phoenix 還有強大視訊處理引擎。綜觀整份議程簡報,AMD 都在每頁右上方標示「這功能屬於哪個範圍」。

但談到人工智慧,雖然 AMD 宣稱這是「第一個整合至 x86 處理器的人工智慧引擎」,但其實英特爾從 2017 年 11 月 11 日的 Gemini Lake 和 2018 年 5 月「10  奈米製程黑歷史」Cannon Lake(Core i3-8121U)就搭載第一代 GNA(Gaussian & Neural Accelerator,高斯和類神經加速器)並持續進化到第三代,預定今年 12 月 18 日上市的 Meteor Lake 更將追加來自 Movidius 的 VPU(NPU),AMD 還有迎頭趕上的努力空間。

▲ 系統單晶片(SoC,System-on-Chip)的 Phoenix 整合大量功能,不限 CPU、GPU 和一般熟知功能,也看到多媒體引擎(Multimedia Engines)和連接第三方感測器的 Sensor Fusion Hub(SFH),類似英特爾 Intel Sensor Hub(ISH),兼具 Windows 和 Linux 驅動程式。

但 AMD 沒提到的是:Phoenix 支援最高 256GB 記憶體容量,足以塞進大型語言模型,如果作業系統不是 Windows(Windows 限制繪圖記憶體只能吃到主記憶體一半,Linux 是 80%)。

Phoenix 採台積電 4 奈米製程(N4),晶片面積 178 平方公釐,254 億個電晶體。相較台積電 6 奈米的前代 Rembrandt,擁有近兩倍電晶體量和小 15% 晶粒,同樣適用 25×35×1.38mm 的 BGA 封裝。

▲ 熟悉的 Zen 4 微架構,當然 Phoenix 也支援「英特爾自廢武功」AVX-512 指令集和人工智慧常用的 BF16(Bfloat16)浮點數格式。但 L3 快取總量只有 16MB,平均每個 CPU 核心只能分配到 2MB,是正規 Zen 4 的一半,與 Zen 4c 相同,筆者很好奇這該稱 Zen 4 還是 Zen 4c。

▲ 這張簡報更明確描述 Phoenix 如何透過 Infinity Fabric 連接主要功能單元,清楚看到 AMD 優先將頻寬配給 GPU 思維,且 Phoenix 可動態調節 Inifinity Fabric 運行時脈,以提高能源效率。

▲ 為了進一步降低功耗,AMD 新定義「Z8 睡眠狀態」,允許更敏捷 Power Gating 和更難被使用者察覺的喚醒時間,並大部分時間處於 Z8 狀態時可播放影片,表明 Phoenix 多媒體引擎有夠大緩衝區和快取記憶體。AMD 也最佳化各種實體 I/O 界面(DDR / USB),可根據必須提供的資料流量,動態改變時脈和電壓。

▲ 基於 RDNA 3 世代的 Phoenix 內顯,有正式 Radeon 700M 型號,兩個 Shader Array 有六個 WGP(Working Group Processor),每個 WGP 含兩個 CU(Computing Unit),總計 12 個 CU 有 768 個 SIMD 執行單元,每個時脈週期能執行 1,536 個 FP32 運算。

單一 Shader Array 有 256kB L1 快取。共用 2MB 快取對無法與 CPU 共用 L3 快取的 AMD APU 非常重要,容量和 AMD RX7600 獨顯和 Nvidia RTX 3050 相同,可見快取有多大。和 Van Gogh 相比,Phoenix 有兩倍 L2 快取容量、略多記憶體頻寬,和多 50% 的運算單元規模。

▲ AMD 一如既往把英特爾拖出來當沙包打,但沒有透露幀率(FPS)數據,反選擇展示效能優勢。考量到 Steam Deck 的實際性能表現,或許 Phoenix 能關閉某些遊戲設定下,達成 720P 或 1080P 的「可玩性」。

▲ RDNA 3 也配置支援 AV1 格式編碼解碼的視訊引擎(VP9 仍只有解碼),性能較前代倍增,有足夠吞吐量同時處理多個視訊串流,這對視訊會議應用非常重要。

▲ 「內建人工智慧推論引擎」是 Phoenix 重頭戲,也象徵 AMD 開始引進併購賽靈思的技術成果。AMD 在 Phoenix 實作 16 個 AIE-ML 區塊,可功能分割,讓多個應用程式共用人工智慧引擎。AMD 絲毫未提如何對付微軟 DirectML 有點可惜。英特爾 Intel Innovation 的 Meteor Lake 發表會就講了不少,包括允許應用程式透過 DirectML 在英特爾 GPU 或 NPU 執行 AI 推理的 OpenVINO-EP(Execution Provider)。

AMD 未詳細介紹 AIE 架構細節,但從賽靈思以前公開文件可知,AIE 是包裹六個指令的超長指令集架構(6-way VLIW),單一指令含兩個純量(Scalar)運算、一個向量乘法(Vector Multiplication)、兩個記憶體載入(Load)和一個記憶體回存(Store)。AIE 有兩個向量暫存器檔案,一組 6kB 提供浮點乘法器輸入,另一組 8kB 保存累加值。此外,AIE 有 16kB 指令記憶體和 64kB 資料記憶體,16 個 AIE 共用 2MB L2 快取。值得一提的是,和 Nvidia A100 / H100 一樣,AIE 支援 50% 稀疏率(Sparsity),特定場合可提高一倍理論效能。

這應是較少人注意到的細項:減輕音效處理負擔的音效輔助處理器(ACP,Audio Co-Processor,基本上是一顆數位訊號處理器),支援 AI 降噪,並以非常低時脈常態運作,目標不外乎想節省大量電力。

▲ ACP 這低功耗且隨時保持開啟的數位訊號處理器(DSP),AMD 提到很酷的應用:ACP 結合第三方軟硬體服務與微軟可信任執行環境(Tee,Trusted execution environment),可使用超音波聲納檢測人體(HPD,Human Presence Detection),如區分移動人體和靜態物體,滿好奇 AMD 何時會公開展示或公布合作夥伴。

▲ 總之,Ryzen 7040 系列 Phoenix 宛如浴火重生的鳳凰,讓長期找不到準確市場定位的 AMD APU 總算展現該有的樣貌。

Phoenix 是 AMD APU 最新成員,自從結合  Zen和 Vega 的 Picasso 以來,AMD APU 歷經頻繁更新,Zen 2 和 Zen 3 世代 APU 已是非常優秀的產品,而 Phoenix 大躍進更使其成為對英特爾而言非常危險的對手──若不考慮商業因素。

從前面可知,AMD 極度注重降低晶片各區域功耗,不僅 Zen 4 核心有大家都認同的出色表現,RDNA 3 的 Radeon 700M 提供強大繪圖效能,大量專用加速器有助提高人工智慧推論和音效處理能源效率,改良後 Infinity Fabric 更具較低功耗和更靈活時脈調整,最終成就了 Phoenix,也讓 AMD 願意 Hot Chips 這場處理器業界的年度盛會,鉅細靡遺精彩陳述自豪的成果。

英特爾 Meteor Lake 即將登場,Intel 20A 製程的 Aarow Lake 和 Intel 18A 製程 Lunar Lake 也蓄勢待發,AMD 後繼 Ryzen 8000 / 9000 家族與之較量,也很值得投以注目的眼神:醞釀「第二次帝國大反擊」的英特爾和「擺脫十年黑暗期」的 AMD,對決結果究竟如何?實在令人期待。但論能效,x86 雙雄能不能追上蘋果,還是不期不待,沒有傷害。

(首圖來源:Image By Freepik

延伸閱讀: