跨資料中心傳輸、光通訊成下一戰場!繼 Scale-Up、Scale-Out 後,NVIDIA 新喊出的 Scale-Across 是什麼?(上)

作者 | 發布日期 2025 年 09 月 30 日 7:50 | 分類 AI 人工智慧 , 光電科技 , 半導體 line share Linkedin share follow us in feedly line share
Loading...
跨資料中心傳輸、光通訊成下一戰場!繼 Scale-Up、Scale-Out 後,NVIDIA 新喊出的 Scale-Across 是什麼?(上)

在人工智慧(AI)、機器學習的推動下,全球資料流量正以倍數成長,目前資料中心伺服器與交換機之間的連線正從 200G400G 快速邁向 800G1.6T,甚至可能到達 3.2T 的時代。

市場調研機構 TrendForce 預期,2023 400G 以上的光收發模組全球出貨量為 640 萬個,2024 年約 2,040 萬個,預期至 2025 年將超過 3,190 萬個,年增率達 56.5%。其中,AI 伺服器的需求持續推升 800G 1.6T 的成長,而傳統伺服器也隨著規格升級,帶動 400G 光收發模組的需求。

另據法人調查,2026 1.6T 光模組需求將大幅超出預期,總出貨量預期高達 1,100 萬支,主要動能來自 NVIDIA Google 的強勁拉貨,以及 Meta、微軟、AWS 的部分占比。

光通訊因為高頻寬、低損耗與長距離特性,逐漸成為機櫃內外互連間的主要選擇方案,使得光收發模組成為資料中心互連的關鍵。TrendForce 指出,未來 AI 伺服器之間的資料傳輸,都需要大量的高速光收發模組,這些模組負責將電訊號轉換為光訊號,並透過光纖傳輸,以及將接收到的光訊號轉換回電訊號。

(Source:思科)

光收發模組、光通訊和矽光子有何關係?

根據下圖的前兩個示意圖可知,目前市面上的可插拔光收發器傳輸速率可達  800G,下一階段的光引擎(Optical Engine,簡稱 OE) 已經可安裝在 ASIC 晶片封裝周圍,這稱為載板光學封裝(On-Board Optics,簡稱 OBO),其傳輸能力可支援至 1.6T

(Source:日月光)

目前業界希望走向「CPO」(Co-packaged Optics,共封裝光學),即光學元件與 ASIC 能共同封裝,透過這項技術實現超過 3.2T、最高達 12.8T 的傳輸速度;而最終目標則是達到「Optical I/O」(光學 I/O),實現類似全光網路的技術,推動傳輸速度超過 12.8T

如果仔細觀察上圖,可以發現做為黃色方塊的光通訊模組(以前為可插拔型態)距離 ASIC 越來越近,這主要是為了縮短電訊號的傳輸路徑,從而實現更高的頻寬。而矽光子製程技術,就是將光學元件整合到晶片上的技術。

(Source:日月光)

光通訊需求暴增,業界聚焦三種擴展伺服器架構

由於 AI 應用大爆發,對於高速光通訊的需求急遽提升,目前伺服器主要聚焦 Scale Up(垂直擴展)、Scale Out(水平擴展)兩種擴展方向,分別對應不同的傳輸需求與技術挑戰,而近期 NVIDIA 又新宣布「Scale Across」這個概念,為業界增添一個思考方向。

Scale-Up

(Source:新思科技

Scale-Up 主要做為機櫃內高速互連(上圖黃色部分),傳輸距離通常在 10 公尺以內,由於對延遲的要求極低,內部仍主要以「銅互連」(Copper Interconnects),避免光電轉換造成延遲與能耗。目前解決方案主要以 NVIDIA NVLink(封閉架構)及 AMD 及其他公司主導的 UALink(開放架構)。

有趣的是,今年 NVIDIA 推出 NVLink Fusion,首度開放 NVLink 技術給外部晶片廠商,將 NVLink 從單一伺服器節點延伸至整個機櫃級(Rack-Scale)架構,不排除是為了因應 UALink 的競爭。

另個值得關注的是,原本主要專注在 Scale-Out 的博通,正嘗試透過「乙太網路」(Ethernet)進軍 Scale-Up 市場。該公司近期推出多款可用 Scale-Up、符合 SUEScale-Up Ethernet)標準的晶片,而這部分可以往後看後續的 NVIDIA 與博通的競爭。

Scale-Out

Scale-Out 則是橫跨伺服器的大規模平行運算(上圖中藍色部分),為了解決資料高吞吐量,並實現無限擴充。這是以「光通訊」為主,主要的網路互連技術需要靠 InfiniBand 或者乙太網路(Ethernet),也將帶動光通訊模組市場。

InfiniBand Ethernet 又可以分成兩大陣營,前者較受 NVIDIA、微軟等大廠的青睞,而後者則以博通、GoogleAWS 為主。

談到 InfiniBand,不得不提領導廠商 Mellanox,他在 2019 年被 NVIDIA 收購,主要是提供端到端 Ethernet InfiniBand 智慧互連解決方案供應商。而中國近期裁定 NVIDIA 違反反壟斷法,就是針對這起收購案。另個關注點是,雖然 NVIDIA 推出許多 InfiniBand 產品,但也針對乙太網路推出相關產品如 NVIDIA Spectrum-X,可以說是兩種市場兼吃。

做為另一大陣營,包括英特爾、AMD、博通等大廠則於 2023 年 7 月集結組成「超乙太網路聯盟」(Ultra Ethernet Consortium,簡稱 UEC),合作發展改進的乙太網路傳輸堆架構,成為挑戰 InfiniBand 的力量之一。

TrendForce 分析師儲于超認為,Scale Out 所帶動的光通訊模組市場,正是未來數據傳輸的核心戰場。

Scale-Across

(Source:NVIDIA)

做為新興的解決方案,NVIDIA 近期提出「Scale-Across」的概念,即跨資料中心的「遠距連接」,距離能超過數公里以上,並推出以乙太網路為基礎、串接多座資料中心的 Spectrum-XGS 乙太網路。

Spectrum-XGS 乙太網路將做為 AI 運算是 Scale-Up Scale-Out 以外的第三大支柱,主要用來擴展 Spectrum-X 乙太網路的極致效能與規模,可連接多個分散式資料中心。NVIDIA 介紹,NVIDIA Spectrum-X 乙太網路除了提供 Scale-Out 的架構,連結整個叢集、將多個分散式資料中心進行互連,快速將大量資料集串流至 AI 模型,還可在資料中心內協調 GPU GPU 之間的通訊。

換言之,這個解決方案結合 Scale-Out 與跨域擴展,能根據跨域距離靈活調整負載平衡、動態調整演算法,因此概念更類似「Scale-Across」。

NVIDIA 創辦人暨執行長黃仁勳表示,「我們在 Scale-Up Scale-Out 能力之上,進一步加入 Scale-Across,把跨城市、跨國家乃至跨洲際的資料中心連結起來,打造龐大的超級 AI 工廠。」

如果從目前產業走向來看,Scale-Up 和 Scale-Out 都是必爭之地,可以看出 NVIDIA 和博通如何從對方手中奪取多一分領地。而 NVIDIA 新喊出的 Scale-Across 則是聚焦橫跨數公里乃至於數千公里的跨資料中心傳輸,有趣的是,博通也有推出相關的解決方案,詳情請見下一篇:《AI 晶片傳輸到 CPO 卡位戰:NVIDIA、博通到底在競爭什麼?(下)》

(首圖來源:shutterstock)

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》