NVIDIA 發表全球首款深度學習超級電腦

作者 | 發布日期 2016 年 04 月 06 日 17:40 | 分類 AI 人工智慧 , 市場動態 , 電腦 line share follow us in feedly line share
NVIDIA 發表全球首款深度學習超級電腦


為因應人工智慧大量運算需求,NVIDIA(輝達)6 日宣布推出全球首款深度學習超級電腦 NVIDIA® DGX-1

NVIDIA DGX-1 是首座專為深度學習所設計的系統,完全整合硬體、深度學習軟體以及開發工具,讓用戶可以簡單快速地布署。此統包式系統搭載新一代 GPU 加速器,資料處理量相當於 250 部 x86 伺服器。

DGX-1 深度學習系統讓研究人員與資料科學家能輕易地運用 GPU 加速運算能力來打造更接近人類學習、觀察和感知世界的智慧機器。前所未有的運算能力滿足新一代人工智慧的應用,大幅減少研究人員在訓練更龐大、更精密複雜的深度神經網路所需的時間。

NVIDIA 針對全新運算模式所設計的 DGX-1,針對科學、企業和不同層面的日常生活領域,影響力無遠弗屆,掀起人工智慧的革命。強大的深度神經網路以海量資料開創出新一類的軟體,並且需要更高階的運算效能表現。

NVIDIA 公司共同創辦人暨執行長黃仁勳表示:「人工智慧是我們現在這一世代影響最深遠的科技進展項目,它不僅僅改變每個產業、每間公司,並且改變所接觸的一切事物,此外還開創了多個市場,造福更多人群。資料科學家與人工智慧研究人員目前花費太多時間自行打造高效能運算解決方案。反觀 DGX-1 不僅建置簡易,我們設計它就為了一個目的: 釋放超凡的運算能力,用以解決未解難題。」

 

五大突破

NVIDIA DGX-1 深度學習系統搭載採用全新 NVIDIA Pascal GPU 架構的 NVIDIA Tesla P100 GPU,提供等同於 250 個搭載 CPU 的伺服器、網路、纜線和機架處理量,而這一切都整合在一個電腦糸統中。

此外DGX-1還具備 4 項突破性技術,帶來極致效能與易用性,包括 NVIDIA NVLink 高速互連 技術,提供最大的應用擴充性;16 奈米 FinFET 製程技術提供亮眼的省電效能;CoWoS(Chip on Wafer on Substrate)封裝技術搭載 HBM2 記憶體,用來處理巨量資料的作業負載;以及全新半精度指令,為深度學習提供超過 21 TFLOPS 的尖峰運算效能。

這些重大技術進展讓搭載 Tesla P100 GPU 的 DGX-1 系統帶來比一年前推出的四向 NVIDIA Maxwell 架構解決方案提升超過 12 倍的訓練速度。

Pascal 架構已獲得人工智慧產業生態系統的強力支持。

臉書公司人工智慧研究部總監 Yann LeCun 表示:「NVIDIA 的 GPU 加速人工智慧的發展。隨著神經網路規模不斷增加,我們不僅需要更快的 GPU 以及更大且更快的記憶體,還需要提升 GPU 與 GPU 間資料傳遞的速度,以及能利用降低精度演算法優勢的硬體,而這些正是 Pascal 架構所擁有的優點。」

百度公司首席科學家吳恩達(Andrew Ng)表示:「人工智慧電腦就像太空火箭一樣越大越好。Pascal 架構的資料處理量與互連技術將打造出前所未見最大規模的火箭。」

微軟公司研究部首席語言學家黃學東(Xuedong Huang)表示:「微軟正著手開發千層以上超深度神經網路。NVIDIA Tesla P100 的超強運算實力將讓微軟的 CNTK 加快人工智慧突破性發展的腳步。」

 

完備的深度學習軟體套件

NVIDIA DGX-1 系統包含整套最佳化的深度學習軟體,讓研究人員與資料科學家能用它們輕易快速地訓練深度神經網路。

DGX-1 軟體內含用以設計深度神經網路(DNN)完整的互動式系統 NVIDIA 深度學習 GPU 訓練系統(DIGITS)。另外也包含最新發表、用於設計 DNN 的 GPU 加速基本函式庫 NVIDIA CUDA 深度神經網路函式庫(cuDNN)第 5 版。

軟體套件亦包含 Caffe、Theano 及 Torch 等數個被廣泛採用的深度學習架構之最佳化版本。DGX-1 並額外提供雲端管理工具、軟體更新、以及支援虛擬化的程式庫。

NVIDIA DGX-1 系統規格如下:

  • 高達 170 TFLOPS 的半精度(FP16)尖峰運算效能
  • 8 個分別配置 16GB 的記憶體的 Tesla P100 GPU 加速器
  • NVLink Hybrid Cube Mesh
  • 容量達 7TB 的 SSD DL 快取記憶體
  • 雙埠 10GbE、Quad InfiniBand 100Gb 網路
  • 3U – 3,200瓦