NVIDIA RTX 40 系列台積電 4 奈米助攻,RTX 4090 / 4080 上市

作者 | 發布日期 2022 年 09 月 21 日 6:00 | 分類 GPU , 半導體 , 電腦 line share follow us in feedly line share
NVIDIA RTX 40 系列台積電 4 奈米助攻,RTX 4090 / 4080 上市


GPU 大廠輝達 (NVIDIA) 台北時間 20 日宣布,推出全新 GeForce RTX 40 系列 GPU。全新旗艦級產品 RTX 4090 GPU 效能是前一代產品四倍,為遊戲玩家及創作者帶來革命性表現。RTX 40 系列是全球首款採用全新 NVIDIA Ada Lovelace 架構的 GPU 產品,運算效能及效率較前一代產品顯著提升,揭示即時光線追蹤與人工智慧 (AI) 產生畫素的神經渲染進入全新時代。

NVIDIA 創辦人暨執行長黃仁勳在 GTC 大會 GeForce Beyond 特別直播表示,RTX 光線追蹤與神經渲染時代如火如荼展開,全新 Ada Lovelace 架構提升光線追蹤與神經渲染表現。遊戲玩家可感受 Ada 架構飛躍性提升,並為創作者奠定打造完全模擬世界的基礎。Ada 架構效能是前一代產品四倍,為 GPU 產業樹立全新標準。

RTX 40 系列 GPU 具多項技術創新,包括串流多處理器 (Streaming Multiprocessor) 著色器運算效能達 83teraflops,是前一代產品 2 倍多。第三代 RT 核心有效光線追蹤運算效能達 191teraflops,是前一代產品 2.8 倍。第四代 Tensor 核心運算效能達 1.32 Tensor petaflops,用 FP8 加速為前一代產品 5 倍。

著色器執行重新排序 (Shader Execution Reordering,SER) 藉重新安排著色作業負載以利用 GPU 資源,提高執行效率。SER 是與 CPU 非依序執行一樣重要的創新技術,提升光線追蹤效能達 3 倍,遊戲畫格率可提高達 25%。Ada 光流加速器 (Ada Optical Flow Accelerator) 有 2 倍快效能,使 DLSS 3 預測場景運動,神經網路便能維持影像畫質同時提高畫格率。架構改善與客製化台積電 4N 製程密切配合,提升電源效率達兩倍。雙 NVIDIA 編碼器 (NVENC) 將匯出時間減半並支援 AV1。OBS、Blackmagic Design DaVinci Resolve、Discord 等皆採用 NVENC AV1 編碼。

NVIDIA 數十年來即時以符合物理原則的準確打光渲染光線追蹤,視為繪圖領域的終極目標。隨著 3D 遊戲和繪圖力求以精準方式呈現現實世界,環境與物體幾何複雜度也日漸提升。想製作符合物理原則的精準繪圖需仰賴高運算力。如《電馭叛客 2077》光線追蹤遊戲,光要判斷打光,每畫素就要進行超過 600 次運算,較四年前第一批光線追蹤遊戲增加 16 倍之多。

全新第三代 RT 核心測試光線三角點交點集 (ray-triangle intersection) 時,速度是過去 2 倍,亦加入兩個重要全新硬體單元。Opacity Micromap Engine 將 alpha 測試幾何的光線追蹤速度提升 2 倍,Micro-Mesh Engine 是動態產生微網格,以產生額外幾何。Micro-Mesh Engine 提供增加幾何複雜性的優點,不會有過去產生複雜幾何形狀所需的傳統效能和儲存成本。

RTX 40 系列 GPU 與 DLSS 3 為 NVIDIA Studio 創作者提供更多機會。3D 藝術家可使用精準符合物理原則又逼真的材料渲染全光線追蹤環境,無需使用代理便能即時查看各項調整後變化。提升 GPU 效能及加入兩個全新第八代 AV1 編碼器,影片編輯與直播表現更出色。NVIDIA Broadcast 軟體開發套件三項更新內容已提供合作夥伴,包括臉部表情判斷 (Face Expression Estimation)、眼神接觸 (Eye Contact) 及提升虛擬背景畫質。

NVIDIA RTX 4090 是世界最快遊戲 GPU,具驚人功率、噪音控制及溫度特性。全光線追蹤遊戲搭載 DLSS 3 的 RTX 4090 運算速度比上一代 DLSS 2 的 RTX 3090 Ti 快 4 倍;保持 450W 功耗時,處理各款遊戲速度亦提升 2 倍。RTX 4090 有 760 億個電晶體、16,384 個 CUDA 核心和 24GB 高速美光 (Micron) GDDR6X 記憶體,可以超過每秒 100 畫格速度執行 4K 解析度遊戲。RTX 4090 將於 10 月 12 日上市,售價新台幣 56,990 元起。

NVIDIA 亦推出 RTX 4080,有兩款配置供選擇。RTX 4080 16GB 有 9,728 個 CUDA 核心及 16GB 高速美光 GDDR6X 記憶體,運用 DLSS 3 執行各款遊戲速度是 GeForce RTX 3080 Ti 的 2 倍,以更低功率提供比 GeForce RTX 3090 Ti 更優異的運算表現。RTX 4080 12GB 有 7,680 個 CUDA 核心和 12GB 美光 GDDR6X 記憶體,運用 DLSS 3 較前一代旗艦級 GPU RTX 3090 Ti 速度更快。RTX 4080 兩款配置 11 月上市,RTX 4080 16GB 售價 42,990 元起,RTX 4080 12GB 為 31,990 元起。

(首圖來源:影片截圖)