
處理器大廠英特爾於 Hot Chips 2024 發表從資料中心、雲端和網路,到邊緣和 PC 等各種 AI 應用場景的最新進展,展現其技術的深度與廣度。
英特爾這次發表的新產品包括用於高速 AI 資料處理的首款全面整合光學運算互連(optical compute interconnect,OCI)小晶片。英特爾也公布預計於 2025 年上半年推出的Intel Xeon 6 SoC(代號Granite Rapids-D)最新細節。
首先、英特爾院士暨網路與邊緣運算晶片設計工程師 Praveen Mosur 說明 Intel Xeon 6 系統單晶片(System-on-Chip,SoC)設計的新細節,以及它如何克服不穩定網路連接以及有限空間和功率等邊緣應用情境中出現的挑戰。
其藉由全球超過 9 萬次邊緣布署所累積的知識經驗,這款 SoC 將成為英特爾目前為止最符合邊緣應用的最佳化處理器。從邊緣裝置擴展到邊緣節點,透過單系統架構和整合的 AI 加速功能,企業能更輕鬆、更有效率、更保密地管理從資料擷取到推論的完整 AI 工作流程,有助於改善決策、提升自動化程度,為客戶創造價值。
英特爾強調,Intel Xeon 6 SoC 結合 Intel Xeon 6 處理器的運算小晶片以及基於 Intel 4 處理技術打造的邊緣最佳化 I/O 小晶片,使這款 SoC 的效能、能耗效率和電晶體密度與先前相比都有顯著改善。另外,Intel Xeon 6 SoC 特色還包括32個通道的 PCI Express(PCIe)5.0、16 個通道的 Compute Express Link(CXL)2.0、雙埠 100G 乙太網路、4 個和 8 個記憶體通道,採用相容的 BGA 封裝、以及強化邊緣應用的功能,包括擴大工作負載溫度範圍和提升工業級可靠度,成為高效能強固型裝置的理想選擇。
英特爾表示,Intel Xeon 6 SoC 還有專為提高邊緣和網路工作負載效能和效率的設計,包括新媒體加速,強化即時 OTT、VOD 和廣播媒體的視訊轉碼和分析能力,提高推論效能的 Intel Advanced Vector Extensions 和 Intel Advanced Matrix Extensions,可達成更有效率網路和儲存效能的 Intel QuickAssist 技術,降低虛擬化 RAN 功耗的 Intel vRAN Boost。此外,還支援 Intel Tiber Edge Platform,使用者可利用此平台在標準硬體上進行如雲端般簡易的建構、布署、執行、管理並擴充邊緣和 AI 解決方案。
英特爾客戶端 CPU SoC 資深設計工程師 Arik Gihon 探討了 Lunar Lake 客戶端處理器,以及其設計如何提升 x86 處理器的能耗效率,並提供領先的核心、繪圖處理與客戶端AI效能。全新 P-core 和 E-core 有著驚人的效能,與上一代產品相比,系統單晶片功耗可降低高達 40%。新的神經元處理單元(Neural Processing Unit,NPU)速度最多可提升 4 倍,執行生成式 AI 任務的表現優於上一代產品。此外,新的 Xe2 GPU 核心也將遊戲和繪圖效能提高到上一代的 1.5 倍。Lunar Lake 的更多詳細資訊將在 9 月 3 日的 Intel Core Ultra 發表會中分享。
至於,英特爾 AI 加速器首席設計工程師 Roman Kaplan 也介紹了需要大量運算能力的生成式 AI 模型訓練和部署。隨著系統從單節點擴充到數千個節點的大型叢集,也帶來了巨大的成本和能耗挑戰。
Intel Gaudi 3 AI 加速器運用最佳化的架構改善運算、記憶體和網路架構,解決了上述的問題;透過採用高效率的矩陣乘法引擎(Matrix Multiplication Engines ,MME)、雙階層(two-level)快取整合和廣泛的 RoCE(RDMA over Converged Ethernet)網路通訊等策略,Gaudi 3 A I加速器能夠實現顯著的效能和能耗效率表現,使AI資料中心的運作更具成本效益與永續性,解決布署生成式 AI 工作負載時的可擴充性問題。Gaudi 3 AI 加速器和未來 Intel Xeon 6 產品的相關資訊將在 9 月的發表會中分享。
最後,英特爾整合光學解決方案(Integrated Photonics Solutions,IPS)事業部展示業界最先進的首款全面整合光學運算互連(OCI)小晶片,能與英特爾 CPU 共同封裝並處理即時資料。
英特爾工程師暨光學整合(Photonics Integration)負責人 Saeed Fathololoumi 介紹了 OCI 小晶片,其設計可在長達 100 公尺的光纖上雙向支援 64 個通道、32 Gbps 資料傳輸。 Fathololoumi 也說明了 OCI 小晶片如何滿足 AI 基礎設施對更高頻寬、更低功耗和更大覆蓋範圍日益增加的需求。英特爾的 OCI 小晶片使高頻寬互連獲得重大進展,可實現未來 CPU/GPU 叢集連接的可擴充性和新式運算架構,包括資料中心和高效能運算(HPC)應用的新興 AI 基礎設施,也可達到一致的記憶體擴充和資源分散。
(首圖來源:英特爾)