Hot Chips 2023》英特爾 Meteor Lake 沒有想像簡單

作者 | 發布日期 2023 年 09 月 28 日 7:50 | 分類 IC 設計 , 半導體 , 處理器 line share follow us in feedly line share
Hot Chips 2023》英特爾 Meteor Lake 沒有想像簡單


英特爾 2022 年 HotChips 34 公布不少新一代行動處理器「Meteor Lake」技術細節,最大亮點莫過於堪稱英特爾先進封裝技術集大成,透過 3D 封裝技術 Foveros,Base Tile(Intel 16 製程,22 奈米)整合 Compute Tile(Intel 4 製程,7 奈米)、GPU Tile(台積電 N5)、SoC Tile(台積電 N6) 和 I/O Tile(台積電 N6)。

▲ Meteor Lake 是英特爾個人電腦領域最大封裝技術突破,但實情卻沒有看起來簡單。

最近英特爾又更進一步,再藉 2.5D 封裝 EMIB,將 Meteor Lake 連接兩顆三星 LPDDR5X-7500 記憶體顆粒(K3KL3L30CM-BGCT),組成一顆有 16GB 記憶體的系統單晶片,120GB/s 記憶體理論頻寬,給人蘋果 M1、M2 即視感,或讓人不得不產生「英特爾也會從競爭對手找靈感」的念頭。

▲ 滿好奇這封裝 16GB LPDDR5X-7500 記憶體的特規 Meteor Lake 是否真有客戶下單。

但英特爾 Hot Chips 2023(第 35 屆)提出名稱有點隱晦、一看就知道要 Meteor Lake 的 Intel Energy Efficiency Architecture 議程,說了一些有趣觀點。結合不易查覺的蛛絲馬跡,筆者稍微列出幾點 Meteor Lake 的不簡單之處。

利用 AI 電源管理演算法

英特爾 2008 年迅馳(Centrino)平台,使用口號描述電源管理理念:HUGI(Hurry Up, Get Idle),中文翻譯是「跑快點,然後閒下來」,意思是低功耗處理器要先以更高功率、更快速度完成工作,然後再盡快轉換成低功耗狀態,突然有效能需求再切回去,這也是我們熟知的 DVFS(Dynamic Voltage and Frequency Scaling)和從 Skylake 開始導入的 Speed Shift。

英特爾宣稱 Meteor Lake 應用人工智慧演算法作電源管理及切換高效能模式和低功耗狀態,能「自學」使用者行為,掌握更詳細行為模式,預測使用者下一步,所以 AI 將帶來英特爾的「Centrino Moment」(意指像當年的迅馳一樣,出現節能領域的重大突破)。

英特爾表示這可提高 35% 系統反應速度,不影響使用者體驗同時,比以前節省 10%~20% 功耗。這會否動用 Meteor Lake 的 VPU,值得觀察。

▲ 不只 CPU 要跑 AI,現在連 CPU 電源管理也要 AI 化了。

英特爾更提出「應該頗具爭議」看法:過去節能關鍵指標的「每瓦性能」不再重要,多數筆電每天只有 4 分鐘處於高功率狀態,桌機則約 100 分鐘。

乍看英特爾似乎想訴諸「做完這些工作的總能量」(邏輯近似 Turbo Boost 2.0 這種「預算能量」內允許超出標準設計功耗的超頻方式)而不是「多少瓦數換取多少效能」。或許英特爾會在 19 日 Intel Innovation Day 透露更多細節,至於引發多少質疑就很有趣了。

▲ 那句 Performance AND Watts both important – not at the same time 令人玩味,難道英特爾打算放棄治療?

追求低功耗甚於效能的多晶片連結

英特爾打造 Meteor Lake 的首要之務不外乎「盡快看到蘋果車尾燈」,充分反應在重視降低功耗的多晶片連結架構。相較十年前 Haswell,Meteor Lake 聯結 Chiplet 的界面是更省電的 FDI(Foveros Die Interconnect),但事情卻沒這麼單純──關鍵在通訊協定。

▲ Meteor Lake 的 DFI 比 OPIO 資料傳輸率沒有較高,但 I/O 密度、延遲、功耗和最大晶片數量明顯勝出。

Meteor Lake 的 CPU(Compute Tile)和 SoC Tile 之間是源自 Nehalem 的 IDI(In-Die Interface)協定,最初用途是連接核心(Core)、非核心區域(UnCore)、透過環狀匯流排存取的 L3 快取記憶體區塊,採 MESIF 快取記憶體資料一致性協定,意味快取狀態是「已修改」(Modified)、「獨占」(Exclusive)、「共享」(Shared)、「無效」(Invalid)和「轉發」(Forward),還要負責封包排序等,總之功能非常複雜。

Meteor Lake 之前的英特爾內顯也是用 IDI,故有讓繪圖功能用到 L3 快取記憶體的能力,像 Haswell 內顯就仰賴 IDI 配置 eDRAM 快取。

但 Meteor Lake 放棄 IDI、改用基於 PCI Express 的 iCXL(不用 PHY CXL),將 GPU Tile 放在遠離 CPU 的位置,搞成很像獨立顯卡,這當然也有理由:省電。後面會講原因和英特爾目的。

▲ 同樣是 FDI 實體連結,但不同 Tile 是跑不同通訊協定和訊號。

GPU 可能不再共享 L3 快取

Meteor Lake 讓 GPU 和 CPU / L3 快取脫勾,代價是 GPU 很可能無法共享位於 CPU 的 L3 快取,但也可縮短 CPU 延遲,利於提升 CPU 時脈和 L3 快取性能,並 GPU 活動狀態時,將 CPU Tile 設置成低功耗延長電池壽命(SoC Tile 有獨立 E-Core)。「分而治之,盡其所能關掉不需要的功能單元」堪稱 Meteor Lake 的中心思想。

另外,內顯快取記憶體其實命中率不高,AMD 評估過,容量起碼要 64MB 以上才看得到明顯效果。與其內顯使用天高皇帝遠的 L3 快取,還不如直接搭配內顯更大的專用快取。

英特爾較新款 Xe 繪圖核心有比 AMD Vega 和 RDNA 2 內顯更大的區域快取,減少內顯依賴 L3 快取。其實 AMD APU 也是類似方法。

▲ AMD 以實際行動證明超高容量快取才對 GPU 有實用性。

Meteor Lake 能效將會讓人眼睛一亮嗎?

前陣子英特爾邀請不少媒體參觀馬來西亞檳城的封裝產線,也公開 Meteor Lake 生產流程,代表很快就會看到原本該名為「第 14 代 Core」的產品。不過蘋果 3 奈米製程 M3 家族也蓄勢待發,x86 雙雄大概很難有追上的一天。

話說回來,和 AMD 相比,英特爾行動運算市場享有「可善用 Chiplet」的彈性與優勢,即使可能要等好一陣子,才能看出英特爾如何發揮 Chiplet 的可重用性,就像 AMD 伺服器和桌機路線。

(首圖來源:英特爾

延伸閱讀: