
在全球半導體產業中,Cerebras Systems 最近創下新的里程碑,推出了世界上尺寸最大的 AI 晶片──WSE(Wafer Scale Engine),並在 AI 推理速度上超越了 NVIDIA 。這款晶片的尺寸是 8.5 英吋(約 22 公分)的巨大方形晶片,擁有驚人的 40 億個電晶體,這使得它在 AI 推理運算中達到每秒 2,522 個 token,比 NVIDIA 叢集(Cluster)快了約 2.5 倍。Cerebras 的資訊安全長 Naor Penso 在溫哥華的 Web Summit 大會中表示,這是全球最快的推理速度。
推理速度對於企業客戶來說至關重要,尤其是在需要即時反應的情境中,例如在購物車中添加AI引擎,以便快速提供食譜建議。隨著AI技術的進步,推理速度的需求將變得更加迫切,因為未來的AI代理將需要處理更複雜的多步驟任務。
WSE晶片的設計不僅依賴電晶體的數量,還包括將所有零件整合在一個晶片上,並配備44GB的高速RAM。這種設計使得Cerebras的晶片在性能上優於NVIDIA的Blackwell晶片,Cerebras每秒可達2,522個token,而NVIDIA Blackwell為1,038個token。「我們測試過數十家廠商,Cerebras是唯一在Meta主要模型上能超越Blackwell的推論解決方案。」Artificial Analysis執行長Micah Hill-Smith說。

(Source:Cerebras Systems)
WSE晶片可說是電腦晶片設計的一個有趣進化,這不僅是對傳統CPU和GPU架構的挑戰,更是對AI計算需求的全新解決方案。Cerebras的行銷長Julie Shin強調,這不是一項漸進式技術,而是晶片技術的一次飛躍。
- World’s Largest Chip Sets AI Speed Record, Beating NVIDIA
- Cerebras Launches World’s Fastest Inference for Meta Llama 4
(首圖來源:cerebras)