CPU 與 GPU、VCU 的關係愈加「微妙」

作者 | 發布日期 2021 年 06 月 10 日 7:45 | 分類 GPU , IC 設計 , 處理器 line share follow us in feedly line share
CPU 與 GPU、VCU 的關係愈加「微妙」


一個 GPU 總需要一個 CPU,但 CPU 的選擇已經不再單一,GPU 的功能也不再「簡單」,曾經穩固的關係,不再是單純的合作。

4 月份,輝達(Nvida)發布了採用 Arm 架構的首款數據中心 CPU Grace 引發廣泛關注。本月,外媒 Tomshardware 報導,像 GPU 一樣總需要一個 CPU 的 Google 自研視訊編解碼處理單元 Argos VCU,預計可以換掉 3,000-4,000 萬個英特爾(Intel)CPU。

依賴 CPU 的 GPU 與 VCU 為什麼會有替代 CPU 的態勢?晶片巨頭與網路科技巨頭間的競合關係,是如何加深的?

CPU 市場的雙重變化

回答 CPU 與其它依賴 CPU 的處理器關係變化之前,不妨先了解 CPU 市場本身的變化。

在很長一段時間,由於 CPU 的性能已經足夠滿足包括 PC 在內的各種應用需求,再加上 RAM 和頻寬成為 CPU 性能提升的瓶頸。CPU 王者英特爾在提升 CPU 性能動力不足,以及先進製程進展不如預期的情況下,連續多代 CPU 性能提升幅度不大,被稱作「擠牙膏」。

英特爾在領先位置緩慢前進的幾年間,AMD 憑藉 Zen 架構的迅速迭代以及台積電先進製程的加持,性能迅速接近甚至超越英特爾 Core 和 Xeon CPU 的性能。「AMD Yes」表達了消費者對於 AMD 產品迅速提升的認可。

英特爾和 AMD 的 x86 CPU 是 PC 時代的標誌,然而在性能提升陷入瓶頸,以及先進半導體製程提升難度越來越大的背景下,兩家最具代表性的 CPU 公司表現相差甚遠,並且開始體現在了市場占比。

依舊有領先優勢的英特爾感受到了老對手帶來的競爭壓力,因此無論是產品性能提升還是市場策略都更加積極。然而,英特爾在服務器 CPU 市場除了要面臨同為 x86 陣營 AMD 的競爭,Arm 陣營的公司也來勢洶洶。

Ampere 董事長兼首席執行長 Renee James 說:「我們知道未來將與過去不同,因為軟體環境變了,不再是關於 PC 和 PC 伺服器的業務,而是圍繞雲端和雲邊緣。現在,需要另一種不同的微處理器。」

Ampere 基於 Arm Neoverse N1 核心,推出了 80 核心的 Altra CPU 和 128 核心 Altra Max CPU,持續刷新伺服器 CPU 核心數的紀錄,突顯出與 x86 CPU 相比更高的核心數以及在雲端原生市場的優勢。

同樣是強調差異化優勢,輝達的 Grace 主要是面向數據密集型 HPC 和 AI 應用。輝達首席執行長黃仁勳稱,基於 Grace 的系統與輝達 GPU 緊密結合,性能將比目前最先進的 NVIDIA DGX 系統(在 x86 CPU 上運行)高出十倍。

無論是 Ampere 還是輝達,其差異化高性能 CPU 的基礎都是 Arm。而 Arm 也在今年 3 月推出了針對未來十年的新一代架構 Armv9,Arm 希望將其架構在智慧終端的成功擴展到高性能運算市場,包括邊緣、雲端及 5G 等。基於 Armv9 架構的 Neoverse N2 正 是Arm 向高性能市場拓展的關鍵產品。

整體看來,已經在 PC 和伺服器 CPU 市場大獲成功的 x86 陣營正開始一場激烈的競爭。此時,針對雲端運算、AI 的 Arm 架構 CPU 迅速發展,要在新興市場分一杯羹。未來,RISC-V CPU 會以怎樣的方式參與到 CPU 市場的競爭,也讓人充滿期待。

異構時代,定製 CPU 優勢突顯

CPU 市場發生雙重變化的一個關鍵因素是市場需求,在市場的驅動下,CPU 的價值也更多體現在異構系統中。輝達在今年 4 月發布 Grace CPU 的時候,也同時將其數據中心產品路線圖升級為 GPU+CPU+DPU 的三類晶片,逐年飛躍,一個架構的策略。在這個新的策略中,GPU 和 DPU 性能的充分發揮依舊需要有 CPU 強大的性能,也就是說,CPU 運算和控制的基礎和核心作用沒有改變。

(Source:影片截圖)

變的是新興應用對於算力的大幅快速增長,異構系統的性能是更重要的關注點。「目前市場上每年交付的 3,000 萬台數據中心伺服器中,有三分之一用於執行軟體定義的資料中心堆棧,其負載的增長速度遠遠快於摩爾定律。除非我們找到加速的辦法,否則用於執行應用的算力將會越來越少。」黃仁勳說,「新時代的電腦需要新的晶片、新的系統架構、新的網路、新的軟體和工具。」

這也是輝達推出 DPU,並且將 DPU 歸入其資料中心產品路線圖的原因。「現代超大規模雲端技術推動資料中心從基礎上走向了新的架構,利用一種專門針對資料中心基礎架構軟體而設計的新型處理器,來解除和加速加速由虛擬化、網路、儲存、安全和其它雲端原生 AI 服務產生的巨大演算負荷。BlueField DPU 正是為此而生。」黃仁勳此前表示。

異構組合才能更好滿足未來市場的需求,這也已經是業界共識,從英特爾擁有 CPU+GPU+FPGA+AI 加速器的完整晶片組合,到輝達宣布收購 Arm,再到 AMD 宣布收購賽靈思,晶片巨頭們都希望藉由不同類型的晶片組合滿足雲端運算、AI 等計算更加密集應用的需求。

在這種變化中,CPU 的選擇也會更加多樣。Computex 21 上,黃仁勳在回答提問時表示:「未來的世界非常多樣,當然也會有不同的 CPU,包括 x86 架構和 Arm 架構,大型 CPU 和小型 CPU,針對 邊緣、資料中心、超算等 CPU,我們的策略是在我們服務的市場,選擇最合適的 CPU,我們會繼續支援 x86 CPU。」

針對特定的市場,並非所有 CPU 都合適。因此在不同的市場需要不同的 CPU,比如在筆電市場,英特爾的 x86 CPU 是不錯的選擇,在 DGX 系統中,AMD 的 CPU 表現非常好。在 5G 基地台中,基於 Arm 的 Marvell CPU 是一個理想選擇。在雲端運算市場,Ampere 的 CPU 性能出色。輝達的 CPU 為的是解決 AI 推薦系統和自然語言理解這樣大型 AI 模型的演算挑戰。

「我相信未來既需要通用 CPU,也需要定製 CPU。支持 Arm 和 x86 對我們來說都是很好的戰略。」黃仁勳表示。

CPU 與 GPU、VCU 更加微妙的競合關係

既有自研的 Arm CPU,也支援 x86 CPU,讓輝達與 CPU 巨頭間的競爭成分更高。在 PC 時代,晶片巨頭間的競爭,是 CPU 公司或者 GPU 公司各自間的競爭,而 CPU 與 GPU 公司以合作為主旋律。

邁入 AI 時代,輝達憑藉其 GPU 硬體加上通用的軟體,成為了 AI 晶片公司的代表,在 AI 市場成為了英特爾強大的競爭對手。面向市場空間巨大的雲端運算和 5G 市場,輝達的 GPU 依舊離不開英特爾和 AMD 的 CPU,但同時輝達會更加注重 Arm 架構 CPU 的開發,晶片巨頭間的競合關係進一步加深。

這種關係變化更明顯的轉變是在晶片巨頭與網路科技巨頭之間。比如文章開頭提到的 Google Argos VCU,多年來 Google 都使用英特爾 CPU 中的視訊編解碼引擎,但隨著影音內容越來越多,以及解析度越來越高,Google 需要性能更強但是功耗和成本更低的晶片。

定製的專用晶片性能往往會比通用晶片更強,藉由自研核心功能加上整合第三方 IP,能在規模應用中實現優勢。Google 表示,與英特爾 Skylake 驅動的伺服器系統相比,其基於 VCU 的設備在性能、TCO(總體擁有成本)、計算效率方面實現了 7 倍(H.264)和高達 33 倍(VP9)的提升。

▲ CPU、GPU 和配備 VCU 的系統離線雙通道單輸出(SOT)吞吐量。(Source:MINEWS

除了 VPU,Google也 已經藉由自研的 TPU 減少了購買 CPU 和 GPU。Google 與晶片巨頭們的關係,不再單純是緊密的合作夥伴,在特定市場也成為了競爭對手。

對於這種轉變,英特爾公司副總裁兼中國區總經理王銳此前對雷鋒網表示,「競爭對手可以在某一參數或者是在製程上縮短與我們的差距。但要打造整個架構,在計算和AI的各個方面都要能夠赶超英特爾,不是那麼容易的事情。」

這是晶片巨頭應對技術、市場變化的自信和底氣,當然,晶片巨頭們也需要更多地考慮與自研晶片的網路科技巨頭們的關係。

不要忽略,無論是晶片巨頭們之間的競爭,還是晶片巨頭與網路科技巨頭們之間關係的變化,本質上除了市場和應用變化的驅動,還有成熟的晶片產業鏈,包括成熟的設計工具、 IP、代工廠和封裝,很大程度降低了 GPU 公司設計 CPU,以及網路科技巨頭設計定製晶片的門檻。

晶片行業的門檻還在進一步降低,這還會帶來怎樣的變化?

(本文由 雷鋒網 授權轉載;首圖來源:Unsplash