
晶片大廠英特爾(Intel)2025 OCP 高峰會宣布 AI 策略,強調將以全面「開放式方法」加倍投入 AI 領域,應對當前產業正經歷的重大轉型。英特爾指出,AI 是數十年才會發生一次的巨大顛覆。目標是與整個產業和生態系統夥伴合作,共同打造開放、模組化且可擴展的 AI 平台,以提供所需規模,實現 AI 的貨幣化,並轉變日常生活及商業運作。
聚焦推論與代理智慧,實現投資貨幣化
英特爾明確表示,嚴苛聚焦策略著重特定工作負載,即「推論」和「代理智慧」(Agentic AI)。英特爾堅信,數千億美元的 AI 投資將透過代工智慧實現貨幣化,此類智慧體將轉變企業經營和人們的日常生活。
英特爾指出,目前產業對 tokens 的需求正以驚人的速度增長。雲端服務大廠近期報告顯示,每月處理的代幣量已達 1.4 千兆(quadrillion)個,一年多增長 100 倍以上。這種爆炸性的指數成長代表著業界迫切需要解決「token 經濟學」問題,思考如何有效且大規模提供情報和服務。
批判垂直整合架構,呼籲異構開放系統
然而,當前的 AI 應用(如聊天機器人)多部署在同質化、垂直整合的系統,並依賴專有網路和軟體。英特爾認為,這種現行架構無法有效擴展。而且,代理智慧涉及多個模型、工具呼叫、數據處理和環境/沙盒需求(例如虛擬機或 API 呼叫),導致產生的代幣數量可能增加兩到三個數量級。
代工智慧工作負載極為多樣化。例如,即使是單一的大型語言模型推論呼叫,也包含「預填充」和「解碼」兩個階段。預填充需要計算最佳化的加速器,而解碼則需要記憶體頻寬最佳化的 GPU。此外,代理智慧體還需要 CPU 來處理環境運行(如編碼代理測試代碼)、工具呼叫以及安全防護。而由於每個組件對計算、記憶體頻寬和網路都有不同的要求,英特爾主張 「一體適用」 的同質化垂直整合架構不再適用。業界真正需要的是一個更靈活、開放且異構的基礎設施。
統一堆疊與協調的軟體為異構性關鍵
英特爾指出,實現這種靈活性和異構性的關鍵挑戰在於軟體。軟體必須能夠隱藏底層異構性的複雜性,為應用程式和開發人員提供零摩擦的體驗。因此,英特爾正在建立統一的軟體堆疊、編譯器和協調基礎設施,目標是讓開發人員無需更改代碼,無論他們使用 PyTorch、Hugging Face 還是 LangChain 進行開發,應用程式都能「正常運行」。系統負責剖析代工智慧的工作負載,將不同的組件放置在正確的硬體類型,並協調起來以實現端到端服務級別協議(SLA)。英特爾預計,第四季推出此類基礎設施。
英特爾與合作夥伴已經進行了基準測試,展示了開放系統架構的優勢。他們將 Nvidia GPU 系統(用於計算最佳化的預填充部分)與英特爾加速器系統(記憶體頻寬最佳化的解碼部分)通過乙太網路連接。這種簡單的異構系統組合,在相同工作負載下,相比同質化垂直整合系統,提供了至少 1.7 倍的每美元性能優勢。
新世代資料中心 GPU-Crescent Island 2026 年送樣
而除了軟體方面的努力,英特爾也將持續在底層硬體創新,以提供更多選擇。英特爾宣布推出下一代資料中心 GPU,代號為 「Crescent Island」。這款 GPU 的重點是推論和代理智慧最佳化,旨在提供最佳的代幣經濟效益和每美元性能。
英特爾強調, Crescent Island 這下一代資料中心 GPU 採用通用可編程 GPU IP XC3 IB 構建,將具備低功耗特性,搭載 LPDDR 記憶體,並在記憶體容量和頻寬方面實現良好平衡。另外,GPU 最佳化「預填充」工作負載,具備恰到好處的計算最佳化和記憶體容量/頻寬組合,預計的上市時程是在 2026 下半年開始送樣。
此外,CPU 在代工智慧工作負載繼續扮演關鍵角色。英特爾強調 x86 作為主流 CPU 平台的重要性。英特爾正積極與 AMD 和眾多夥伴「x86 生態系統諮詢小組」開放合作,以推動 x86 生態系統的標準化和相容性,例如中斷處理和向量指令 (AV extend) 方面的標準化。因此,英特爾重申對開放式乙太網路標準化技術的支持,這對於將所有不同組件拼接成最佳化的機架至關重要。英特爾積極參與 OCP 及「開放AI系統」。
(首圖來源:Pixabay)