2025 OCP 高峰會》英特爾全面擁抱開放式異構 AI 架構，推新資料中心 GPU

晶片大廠英特爾（Intel）2025 OCP 高峰會宣布 AI 策略，強調將以全面「開放式方法」加倍投入 AI 領域，應對當前產業正經歷的重大轉型。英特爾指出，AI 是數十年才會發生一次的巨大顛覆。目標是與整個產業和生態系統夥伴合作，共同打造開放、模組化且可擴展的 AI 平台，以提供所需規模，實現 AI 的貨幣化，並轉變日常生活及商業運作。

聚焦推論與代理智慧，實現投資貨幣化

英特爾明確表示，嚴苛聚焦策略著重特定工作負載，即「推論」和「代理智慧」（Agentic AI）。英特爾堅信，數千億美元的 AI 投資將透過代工智慧實現貨幣化，此類智慧體將轉變企業經營和人們的日常生活。

英特爾指出，目前產業對 tokens 的需求正以驚人的速度增長。雲端服務大廠近期報告顯示，每月處理的代幣量已達 1.4 千兆（quadrillion）個，一年多增長 100 倍以上。這種爆炸性的指數成長代表著業界迫切需要解決「token 經濟學」問題，思考如何有效且大規模提供情報和服務。

批判垂直整合架構，呼籲異構開放系統

然而，當前的 AI 應用（如聊天機器人）多部署在同質化、垂直整合的系統，並依賴專有網路和軟體。英特爾認為，這種現行架構無法有效擴展。而且，代理智慧涉及多個模型、工具呼叫、數據處理和環境／沙盒需求（例如虛擬機或 API 呼叫），導致產生的代幣數量可能增加兩到三個數量級。

代工智慧工作負載極為多樣化。例如，即使是單一的大型語言模型推論呼叫，也包含「預填充」和「解碼」兩個階段。預填充需要計算最佳化的加速器，而解碼則需要記憶體頻寬最佳化的 GPU。此外，代理智慧體還需要 CPU 來處理環境運行（如編碼代理測試代碼）、工具呼叫以及安全防護。而由於每個組件對計算、記憶體頻寬和網路都有不同的要求，英特爾主張「一體適用」的同質化垂直整合架構不再適用。業界真正需要的是一個更靈活、開放且異構的基礎設施。

統一堆疊與協調的軟體為異構性關鍵

英特爾指出，實現這種靈活性和異構性的關鍵挑戰在於軟體。軟體必須能夠隱藏底層異構性的複雜性，為應用程式和開發人員提供零摩擦的體驗。因此，英特爾正在建立統一的軟體堆疊、編譯器和協調基礎設施，目標是讓開發人員無需更改代碼，無論他們使用 PyTorch、Hugging Face 還是 LangChain 進行開發，應用程式都能「正常運行」。系統負責剖析代工智慧的工作負載，將不同的組件放置在正確的硬體類型，並協調起來以實現端到端服務級別協議（SLA）。英特爾預計，第四季推出此類基礎設施。

英特爾與合作夥伴已經進行了基準測試，展示了開放系統架構的優勢。他們將 Nvidia GPU 系統（用於計算最佳化的預填充部分）與英特爾加速器系統（記憶體頻寬最佳化的解碼部分）通過乙太網路連接。這種簡單的異構系統組合，在相同工作負載下，相比同質化垂直整合系統，提供了至少 1.7 倍的每美元性能優勢。

新世代資料中心 GPU-Crescent Island 2026 年送樣

而除了軟體方面的努力，英特爾也將持續在底層硬體創新，以提供更多選擇。英特爾宣布推出下一代資料中心 GPU，代號為「Crescent Island」。這款 GPU 的重點是推論和代理智慧最佳化，旨在提供最佳的代幣經濟效益和每美元性能。

英特爾強調， Crescent Island 這下一代資料中心 GPU 採用通用可編程 GPU IP XC3 IB 構建，將具備低功耗特性，搭載 LPDDR 記憶體，並在記憶體容量和頻寬方面實現良好平衡。另外，GPU 最佳化「預填充」工作負載，具備恰到好處的計算最佳化和記憶體容量／頻寬組合，預計的上市時程是在 2026 下半年開始送樣。

此外，CPU 在代工智慧工作負載繼續扮演關鍵角色。英特爾強調 x86 作為主流 CPU 平台的重要性。英特爾正積極與 AMD 和眾多夥伴「x86 生態系統諮詢小組」開放合作，以推動 x86 生態系統的標準化和相容性，例如中斷處理和向量指令（AV extend）方面的標準化。因此，英特爾重申對開放式乙太網路標準化技術的支持，這對於將所有不同組件拼接成最佳化的機架至關重要。英特爾積極參與 OCP 及「開放AI系統」。

(首圖來源：Pixabay)