NVIDIA Turing 新品發不停,Tesla T4 聚焦資料中心推論應用

作者 | 發布日期 2018 年 09 月 28 日 10:49 | 分類 GPU , 汽車科技 , 零組件 follow us in feedly

GTC Japan 2018 風光落幕,儘管即將進入第四季,NVIDIA 執行長黃仁勳依然釋出相當多訊息,其中NVIDIA 釋出以 Turing 架構為主的新一代 GPU Tesla T4 相關訊息,該產品將會聚焦在資料中心的推論領域,只要是視覺相關應用,皆是 Tesla T4 可涵蓋的範圍。簡單列舉 Tesla T4 相關硬體規格:1. Tensor Cores:320;2. CUDA Cores:2560;3. 傳輸介面:PCIe Gen3 ×16;4. 功耗:75W。



Turing 架構發表,一個月內新品三連發

NVIDIA 發布的 Turing 架構是依據 CUDA 10 為基礎而打造出來的全新架構,儘管還有更多細節沒有釋出,但基本上搭配 RT Cores(光線追蹤處理器)已是 100% 確定的事實。

NVIDIA 旗下眾多產品皆是依據歷代 GPU 架構衍生出來,在 Turing 架構發布後,聚焦於設計與視覺化應用的 Quadro 繪圖卡馬上就發布 3 款全新版本,緊接在遊戲應用則是 GeForce 系列,推出 3 款全新 RTX 系列,一口氣彌補自 Pascal 架構以來遺留的新品空缺,畢竟之前發布的 Volta 架構,NVIDIA 並未順勢推出遊戲專用的繪圖卡產品線,這也使得外界對 NVIDIA 在遊戲繪圖卡市場策略抱持著較為擔憂的態度。

然而在 Turing 架構發布後,NVIDIA 在短短一個月內接連發布 Quadro RTX、GeForce RTX 與 Tesla T4,顯見其產品布局規劃相當完整。

▲ NVIDIA Turing 架構產品發表狀況一覽。(Source:NVIDIA;拓墣產業研究院整理,2018/09)

Tesla T4 聚焦伺服器,但不會走上 Tesla V100 道路

值得留意的是,相較 Tesla V100,Tesla T4 並未搭載 HBM2 記憶體,就 NVIDIA 官方設定,Tesla T4 定位是在推論應用,而非訓練。從這一點來看,NVIDIA 似乎是想讓 Tesla V100 與 Tesla T4 都在資料中心領域有其發揮空間,前者全力聚焦在模型訓練,後者則是針對視覺相關領域,進行推論工作。

Tesla T4 除了沒有搭載 HBM2 記憶體外,為人所熟知的 NVLink 技術也未見其中,則是改採 16 通道數 PCIe Gen3,就這些現象來看,Tesla T4 要走上 Tesla V100 的路,依序推出 DGX-1 與 DGX-2 等衍生產品,似乎是不可能的事。但這也不表示,T4 就無法打進伺服器市場,以目前 T4 設計,最多可以一次安插 16 張 T4 加速卡在伺服器系統內,顯然在推論應用上,不需要過於強大的系統效能,但換個角度,針對視覺相關領域推出專屬的推論產品,顯然 NVIDIA 也意識到 CSP 業者在 AI 領域上會有不少特定的應用需求要被滿足,未來在因應 CSP 市場需求上,NVIDIA 是否會針對訓練與推論各自祭出相應的產品,值得後續觀察。

(首圖來源:NVIDIA

延伸閱讀:

關鍵字: , , , , , ,