Hot Chips 2023》一窺 AMD Ryzen 7040 Phoenix 技術細節

雖然 AMD 早在 2006 年 7 月就以 54 億美元併購 Nvidia 最大對手 ATi，成為兼具 CPU 和 GPU 的強權，也將融合兩者的「Fusion」與 APU（Accelerated Processing Unit）視為戰略核心（EHP 首發 MI300 堪稱累積超過十年努力的集大成），但 AMD 在筆電市場卻走得相當艱辛，即便 21 世紀前幾年，靠 K8 庇蔭，讓「64 位元行動平台處理器」Turion 64 在筆電市場取得些微成就，但隨即消逝無蹤。

▲ AMD 2022 年重整行動處理器的命名原則，但混亂產品線還是讓人一頭霧水，筆者也有點懶得做新舊名稱對照表了。

2010 年初，英特爾 Westmere 世代取得能效和內顯巨大進步，但反觀手握 ATi 的 AMD，APU 往往使用非常過時的繪圖架構。「為運算而生，不太像為了遊戲」初代 GCN（Graphic Core Next）獨顯，早在 2012 年 1 月隨著 Radeon HD7000 問世，但很長一段時間 APU 還停在 Terascale 3。AMD 2021 年第一季推出配備 Vega 繪圖核心（第五代 GCN）Ryzen 7 5800H（Cezanne-H），但獨顯升級成「真正為了遊戲考量」的 RDNA 2。

▲ AMD 最終還是不得不將 GPU 架構「遊戲」和「運算」分而治之，但筆者會繼續關心 Fluid Motion 這看影片的補幀好工具何時復活。

所幸 AMD 近期產品已扭轉尷尬局面，2021年 Van Gogh（Steam Deck 可攜式遊戲機專用）2022 年 Rembrandt 最終導入 RDNA 2 內顯，而「好像能效可看到蘋果車尾燈」Ryzen 7040「Phoenix」更結合最新 Zen 4 CPU 和 RDNA 3 GPU。

AMD 在 Hot Chips 2023（第 35 屆）特地安排講解技術細節議程，各位也可看到之前可能無從得知的精采資訊，值得一看。

▲ 這頁呈現 CPU、GPU 和各種專用加速器（如 XDNA 的 AI Engine）泛用性與能耗比的差別，XDNA 加速器有助機器學習推理，音效控制器可減輕 CPU 訊號處理負擔，Phoenix 還有強大視訊處理引擎。綜觀整份議程簡報，AMD 都在每頁右上方標示「這功能屬於哪個範圍」。

但談到人工智慧，雖然 AMD 宣稱這是「第一個整合至 x86 處理器的人工智慧引擎」，但其實英特爾從 2017 年 11 月 11 日的 Gemini Lake 和 2018 年 5 月「10 奈米製程黑歷史」Cannon Lake（Core i3-8121U）就搭載第一代 GNA（Gaussian & Neural Accelerator，高斯和類神經加速器）並持續進化到第三代，預定今年 12 月 18 日上市的 Meteor Lake 更將追加來自 Movidius 的 VPU（NPU），AMD 還有迎頭趕上的努力空間。

▲ 系統單晶片（SoC，System-on-Chip）的 Phoenix 整合大量功能，不限 CPU、GPU 和一般熟知功能，也看到多媒體引擎（Multimedia Engines）和連接第三方感測器的 Sensor Fusion Hub（SFH），類似英特爾 Intel Sensor Hub（ISH），兼具 Windows 和 Linux 驅動程式。

但 AMD 沒提到的是：Phoenix 支援最高 256GB 記憶體容量，足以塞進大型語言模型，如果作業系統不是 Windows（Windows 限制繪圖記憶體只能吃到主記憶體一半，Linux 是 80%）。

▲ Phoenix 採台積電 4 奈米製程（N4），晶片面積 178 平方公釐，254 億個電晶體。相較台積電 6 奈米的前代 Rembrandt，擁有近兩倍電晶體量和小 15% 晶粒，同樣適用 25×35×1.38mm 的 BGA 封裝。

▲ 熟悉的 Zen 4 微架構，當然 Phoenix 也支援「英特爾自廢武功」AVX-512 指令集和人工智慧常用的 BF16（Bfloat16）浮點數格式。但 L3 快取總量只有 16MB，平均每個 CPU 核心只能分配到 2MB，是正規 Zen 4 的一半，與 Zen 4c 相同，筆者很好奇這該稱 Zen 4 還是 Zen 4c。

▲ 這張簡報更明確描述 Phoenix 如何透過 Infinity Fabric 連接主要功能單元，清楚看到 AMD 優先將頻寬配給 GPU 思維，且 Phoenix 可動態調節 Inifinity Fabric 運行時脈，以提高能源效率。

▲ 為了進一步降低功耗，AMD 新定義「Z8 睡眠狀態」，允許更敏捷 Power Gating 和更難被使用者察覺的喚醒時間，並大部分時間處於 Z8 狀態時可播放影片，表明 Phoenix 多媒體引擎有夠大緩衝區和快取記憶體。AMD 也最佳化各種實體 I/O 界面（DDR / USB），可根據必須提供的資料流量，動態改變時脈和電壓。

▲ 基於 RDNA 3 世代的 Phoenix 內顯，有正式 Radeon 700M 型號，兩個 Shader Array 有六個 WGP（Working Group Processor），每個 WGP 含兩個 CU（Computing Unit），總計 12 個 CU 有 768 個 SIMD 執行單元，每個時脈週期能執行 1,536 個 FP32 運算。

單一 Shader Array 有 256kB L1 快取。共用 2MB 快取對無法與 CPU 共用 L3 快取的 AMD APU 非常重要，容量和 AMD RX7600 獨顯和 Nvidia RTX 3050 相同，可見快取有多大。和 Van Gogh 相比，Phoenix 有兩倍 L2 快取容量、略多記憶體頻寬，和多 50% 的運算單元規模。

▲ AMD 一如既往把英特爾拖出來當沙包打，但沒有透露幀率（FPS）數據，反選擇展示效能優勢。考量到 Steam Deck 的實際性能表現，或許 Phoenix 能關閉某些遊戲設定下，達成 720P 或 1080P 的「可玩性」。

▲ RDNA 3 也配置支援 AV1 格式編碼解碼的視訊引擎（VP9 仍只有解碼），性能較前代倍增，有足夠吞吐量同時處理多個視訊串流，這對視訊會議應用非常重要。

▲ 「內建人工智慧推論引擎」是 Phoenix 重頭戲，也象徵 AMD 開始引進併購賽靈思的技術成果。AMD 在 Phoenix 實作 16 個 AIE-ML 區塊，可功能分割，讓多個應用程式共用人工智慧引擎。AMD 絲毫未提如何對付微軟 DirectML 有點可惜。英特爾 Intel Innovation 的 Meteor Lake 發表會就講了不少，包括允許應用程式透過 DirectML 在英特爾 GPU 或 NPU 執行 AI 推理的 OpenVINO-EP（Execution Provider）。

AMD 未詳細介紹 AIE 架構細節，但從賽靈思以前公開文件可知，AIE 是包裹六個指令的超長指令集架構（6-way VLIW），單一指令含兩個純量（Scalar）運算、一個向量乘法（Vector Multiplication）、兩個記憶體載入（Load）和一個記憶體回存（Store）。AIE 有兩個向量暫存器檔案，一組 6kB 提供浮點乘法器輸入，另一組 8kB 保存累加值。此外，AIE 有 16kB 指令記憶體和 64kB 資料記憶體，16 個 AIE 共用 2MB L2 快取。值得一提的是，和 Nvidia A100 / H100 一樣，AIE 支援 50% 稀疏率（Sparsity），特定場合可提高一倍理論效能。

▲ 這應是較少人注意到的細項：減輕音效處理負擔的音效輔助處理器（ACP，Audio Co-Processor，基本上是一顆數位訊號處理器），支援 AI 降噪，並以非常低時脈常態運作，目標不外乎想節省大量電力。

▲ ACP 這低功耗且隨時保持開啟的數位訊號處理器（DSP），AMD 提到很酷的應用：ACP 結合第三方軟硬體服務與微軟可信任執行環境（Tee，Trusted execution environment），可使用超音波聲納檢測人體（HPD，Human Presence Detection），如區分移動人體和靜態物體，滿好奇 AMD 何時會公開展示或公布合作夥伴。

▲ 總之，Ryzen 7040 系列 Phoenix 宛如浴火重生的鳳凰，讓長期找不到準確市場定位的 AMD APU 總算展現該有的樣貌。

Phoenix 是 AMD APU 最新成員，自從結合 Zen和 Vega 的 Picasso 以來，AMD APU 歷經頻繁更新，Zen 2 和 Zen 3 世代 APU 已是非常優秀的產品，而 Phoenix 大躍進更使其成為對英特爾而言非常危險的對手──若不考慮商業因素。

從前面可知，AMD 極度注重降低晶片各區域功耗，不僅 Zen 4 核心有大家都認同的出色表現，RDNA 3 的 Radeon 700M 提供強大繪圖效能，大量專用加速器有助提高人工智慧推論和音效處理能源效率，改良後 Infinity Fabric 更具較低功耗和更靈活時脈調整，最終成就了 Phoenix，也讓 AMD 願意 Hot Chips 這場處理器業界的年度盛會，鉅細靡遺精彩陳述自豪的成果。

英特爾 Meteor Lake 即將登場，Intel 20A 製程的 Aarow Lake 和 Intel 18A 製程 Lunar Lake 也蓄勢待發，AMD 後繼 Ryzen 8000 / 9000 家族與之較量，也很值得投以注目的眼神：醞釀「第二次帝國大反擊」的英特爾和「擺脫十年黑暗期」的 AMD，對決結果究竟如何？實在令人期待。但論能效，x86 雙雄能不能追上蘋果，還是不期不待，沒有傷害。

（首圖來源：Image By Freepik）