NVIDIA 放出 12 年來最大更新:全新圖靈架構登場,全球首批即時光線追蹤 GPU 同步亮相

作者 | 發布日期 2018 年 08 月 14 日 16:45 | 分類 GPU , 晶片 , 記憶體 line share follow us in feedly line share
NVIDIA 放出 12 年來最大更新:全新圖靈架構登場,全球首批即時光線追蹤 GPU 同步亮相


輝達(NVIDIA)CEO 黃仁勳(Jensen Huang)在 14 日 SIGGRAPH 2018 正式發表已曝光的新一代 GPU 架構 Turing(圖靈)。同時,一系列基於圖靈架構的 GPU 包括 Quadro RTX 8000Quadro RTX 6000Quadro RTX 5000 及 Quadro RTX ServerCUDA10 也共同亮相。

黃仁勳表示:「圖靈架構是自 2006 年 CUDA GPU 發明以來最大的飛躍,Quadro RTX 系列也是全球首批支援即時光線追蹤(Real Time Ray Tracing)的 GPU。」

圖靈架構

黃仁勳說圖靈架構為 NVIDIA 十多年來在電腦圖形領域最重要的創新。這是很明確的標準,圖靈架構是 NVIDIA 第八代 GPU 架構,使全球首款光線追蹤 GPU 成為可能,也是超過一萬名工程師努力的成果。圖靈架構搭載 RT 核心(RT Core)及全新張量核心(Tensor Core)。

RT 核心是專門即時光線追蹤的處理器,能加速計算 3D 環境下傳遞的光線和聲音,據稱即時光線追蹤能力提升到 Pascal 架構的 25 倍。張量核心是為深度學習訓練和推斷加速的處理器,支援每秒 500 兆次張量運算。這些新功能包括 DLAA(深度學習抗鋸齒),以及去噪、解析度縮放和影片調速。這些特徴是 NVIDIA NGX 軟體開發套件的一部分,全新深度學習技術堆疊可助力開發者透過預先訓練的網路,輕鬆整合加速且增強的圖形、照片成像和影片處理至應用。

NVIDIA 承諾圖靈架構 GPU 模擬物理世界的能力將比 Pascal 架構提升 倍。

需要補充的是,RTX 光線追蹤技術(Ray-Tracing)是 NVIDIA 月發表的新技術,這項新技術能計算光線反射、折射、散射等路線,渲染出逼真的畫面,可為遊戲開發者提供電影級畫質的即時渲染。更具體說,就是真實世界中,我們看到的 3D 物體被光源照亮,且光子可在到達觀看者眼睛前從一個物體反彈到另一個物體。光線追蹤技術則反過來,透過觀者眼睛(觀景式照相機)反向追蹤光線捕捉這些效果,透過追蹤 2D 視表面每個像素光線的路徑,並應用到場景 3D 模型。

即時光線追蹤技術過去只在影視作品的 CG 製作出現,一般是用幾天時間,渲染出幾幀動畫,這個動畫的陰影、金屬和水面折射以及反射等都很逼真。

全球首批即時光線追蹤 GPU:Quadro RTX

黃仁勳在 SIGGRAPH 2018 同時帶來全球首批支援即時光線追蹤的 GPU:Quadro RTX 系列。Quadro 是 NVIDIA 的專業級顯卡,主要針對設計、特效、科學可視化等視覺計算工作。

基於圖靈架構的 GPU 採用流式多處理器(SM)架構,新增與浮點資料路徑並列執行的整數執行單元,以及頻寬為先前架構兩倍的全新統一緩衝區架構。結合可變速率著色等全新圖形技術,圖靈流式多處理器架構達成前所未有的單核效能水準。

新發表的 Quadro RTX 包括 3 款產品,為 Quadro RTX 8000Quadro RTX 6000Quadro RTX 5000,具 16T 單精準度浮點效能,每秒 10G GigaRaysGigaRays/sec,說明光線追蹤的效能),每秒 500TOPs 深度學習,支援 NVLink,每秒100GB,支援每秒 500 兆張量的作業。

核心面積增至 754 平方公厘,最大顯存 48GB GDDR6,整合 186 億電晶體,顯存頻率 14GHz,可達成硬體加速的 AI、光線追蹤和模擬。

現場,黃仁勳還展示幾幀用 Quadro RTX 渲染《復仇者聯盟:無限之戰》裡蜘蛛人跳起射蛛絲的畫面。

Quadro RTX 系列新品的特徴包括:

  • RT Core 可做到物件和環境的即時光線追蹤,並物理上精確的陰影、反射和折射及全域光照。
  • Tensor Core 可加速深度神經網路訓練和推理。
  • 圖靈流式多處理器(Turing Streaming Multiprocessor)架構有 4,608 個 CUDA core,可提供高達 16teraflops 的計算效能,並列運算每秒 16 萬億次整數運算,以加速模擬真實世界的物理模擬。
  • 先進的程式化著色技術可提高複雜視效和圖形密集型工作體驗。
  • 首次採用超快速的三星 16Gb GDDR6 記憶體,支援更複雜的設計、大量建築資料集、8K 電影內容等。
  • NVIDIA NVLink 可透過高速鏈路聯通兩個 GPU,將記憶體容量延伸至 96GB,並可透過高達 100GB/s 的資料傳送,提供更高效能。
  • 提供對 USB Type-C 和 VirtualLink 硬體支援。
  • 增強型技術可提高VR應用效能,包括可變速率著色(Variable Rate Shading)、多視角渲染(Multi-View Rendering)和 VRWorks Audio

據了解,3 款新 GPU 預計今年第四季發售,開發人員可透過新的 NVIDIA RTXTM)存取 Quadro RTX,並提供一系列創意應用程式和工具,包括用於光線追蹤、AI、光域化和模擬 API。價格方面,Quadro RTX 8000 配備 48GB 記憶體,售價 10,000 美元;Quadro RTX 6000 配 24GB 記憶體,售價 6,300 美元;Quadro RTX 5000 配 16GB 內 2,300 美元 ESP

Quadro RTX 伺服器

展示基於 RTX 的 Porsche demo 後,黃仁勳還發表 Quadro RTX 伺服器,將 Quadro RTX GPU 與明年第一季推出新 Quadro Infinity 軟體結合,提供強大而靈活的架構,滿足創意專業人士的需求。Quadro Infinity 將允許多用戶透過虛擬工作站存取單個 GPU,進而顯著提高資料中心的密度。

據悉,Quadro RTX 伺服器預裝了內容建立和渲染軟體,提供功能強大且易於部署的渲染解決方案,可從小型安裝延伸到最大的資料中心,僅占 CPU 成本的四分之一渲染農場。

CUDA10

CUDA 是構建 NVIDIA GPU 加速的軟體,與之前的版本相比,CUDA10 新特徴包括:

  • 支援圖靈架構。
  • 新增效能最佳化程式庫,在 16-GPU 系統達成強大的 FFT 效能延伸。
  • nvJPEG:用於混合 JPEG 處理的新程式庫,單個和批量影像解碼速度是原來 倍。
  • CUDA / Graphics InteropCUDA 和圖形 API 之間的新互作業性。
  • 新的開發人員工具:用於追蹤,分析和除錯 CUDA 應用程式的新 Nsight 產品系列工具。

軟體層面,NVIDIA 還宣布開放 MDL

當然,黃仁勳最後還表示從 Adobe(針對 Dimension CC)到皮克斯、SiemensBlack MagicWeta DigitalEpic Games 和 Autodesk 等公司已簽約支援新的圖靈架構。看來這將讓產品設計師、遊戲設計師、建築師的光線計算變得簡單。

(本文由 雷鋒網 授權轉載;首圖來源:NVIDIA