輝達在 CUDA 13.1 中推出全新的 CUDA Tile,甚至可直接以 Python 定義 Tile 運算,由編譯器自動完成底層最佳化。開發門檻大幅降低之餘,也使得專家提出質疑,輝達此做法會不會反而造成自家多年的護城河瓦解?
The largest advancement of the CUDA platform since its creation in 2006 is here 👀
Introducing CUDA Tile, a tile-based programming model that provides the ability to write algorithms at a higher level and abstract away the details of specialized hardware, such as tensor cores.… pic.twitter.com/C9eloDN0Wn
— NVIDIA AI Developer (@NVIDIAAIDev) December 5, 2025
CUDA Tile 是什麼?
CUDA Tile 的核心在於新的 CUDA Tile IR,CUDA Tile IR 是 NVIDIA 推出的新型程式表示方式,開發者只需定義資料如何切分、每個區塊要執行哪些運算,編譯器會自動處理 thread、記憶體與 Tensor Core 等底層細節,讓 GPU 程式的撰寫方式更簡單,也更容易跨硬體移植。
(Source:輝達)
而且 CUDA Tile 也與現有 CUDA 模型並存,開發者仍可在需要時撰寫傳統 SIMT,而在需要加速 Tensor Core 或高維度張量計算時,改以 Tile 設計。

(Source:同上)
對一般開發者而言,輝達提供了更高階的 cuTile Python 作為主要入口,讓使用者能以 Python 撰寫 Tile-based GPU 程式;而對編譯器或 DSL 開發者,則可直接使用 Tile IR 作為後端目標,構建新的框架或語言工具鏈。
CUDA 護城會被瓦解嗎?
曾參與 AMD Zen、Apple A 系列、Tesla Autopilot 設計,現在為AI 晶片新創公司 Tenstorrent 執行長 Jim Keller 指出,若未來主流 GPU 程式設計逐漸轉向 Tile-based ,可能會使得像是 AMD、Intel 或新創 AI 加速器更有機會切入。
Curious. Did Nvidia end the Cuda “moat" ? If they move to tiles like most other hardware, the AI kernels will be easier to port.https://t.co/ggeT0RUbfv
— Jim Keller (@jimkxa) December 7, 2025
等開發者習慣了「寫 Tile、硬體自己最佳化」這種方式後,同一套程式邏輯就更容易搬到不同的 GPU 上使用,不像過去 CUDA C++ 那麼綁硬體。
然而,目前 Tile IR 與 cuTile Python 仍是 NVIDIA 專屬的編譯與執行環境,其他硬體廠商並無法直接運行或兼容這些高階抽象。開發者若要在非 NVIDIA 硬體上使用,相同的程式仍需改寫或切換完全不同的工具鏈。
CUDA Tile 雖讓 GPU 開發更簡化、更貼近 Python,但其核心生態仍掌握在輝達手中。業界普遍認為:短期內 CUDA 的護城河不會被削弱,反而可能因抽象層提高而更鞏固。不過長期會怎麼發展下去仍要觀察。
(首圖來源:輝達)






