Nvidia 黃仁勳:資料中心將成為巨無霸,但 AI 加速計算才是未來

作者 | 發布日期 2019 年 03 月 25 日 15:30 | 分類 AI 人工智慧 , GPU , 網路 follow us in feedly

相對前兩年輝達舉辦的 GTC(GPU Technology Conference)來說,今年 GTC 在 GPU 技術架構和硬體創新的進展並不明顯。Keynote 環節,輝達創始人兼 CEO 黃仁勳發表了一款定價 99 美元的 Jetson Nano──除此之外,並沒有之前預想的新架構或「大核彈」。



儘管如此,在現場見證了 Keynote 之後,依然感受到黃仁勳的激情,以及他在打造基於現有 GPU 技術應用生態方面的努力。無論是基於圖靈架構和 RTX 技術的 Nvidia Omniverse 和 NVIDIA RTX Servers 伺服器,還是 7 家世界級的廠商將推出基於 NVIDIA T4 GPU 和 NVIDIA CUDA-X AI 加速庫的伺服器,都讓人體會到輝達在技術應用生態方面的努力。

黃仁勳依舊強調這句話:買的(GPU)越多,省的(Money)越多。

GTC 大會第二天,黃仁勳出現在媒體參與的 Q&A 環節,他首先重點強調本次 GTC 的兩個核心關鍵詞──Ray-Tracing 和 Data Science,隨後回答眾多外界關注的關鍵問題,比如說未來的 GPU 技術路線、收購以色列公司 Mellanox、資料中心的未來、摩爾定律的終結等。

以下是本次 Q&A 關鍵內容摘要。

一、關於輝達收購 Mellanox

本次 GTC 開幕前一週,輝達宣布收購以色列科技公司 Mellanox,這是輝達史上最大筆收購。對此,黃仁勳提到以下幾點:

  • 摩爾定律放緩時期,網路軟體堆疊必須盡可能轉移到架構,為 CPU 減輕負擔;現在 CPU 是一種有限資源,所以必須盡可能減輕 CPU 負擔。Mellanox 是 CPU 減輕負擔領域的一流企業。
  • 資料中心的計算架構不再停留在節點,而將擴展到網路,整個網路都涉及輝達的 GPU。輝達有能力與第一大互聯技術公司 Mellanox 緊密合作,整個行業都很歡迎。
  • 輝達收購 Mellanox 一案獲得監管部門的批准表示樂觀,這將使輝達加速創新並推進技術發展,以服務客戶。因為我們缺乏網路技術,而我們的目標是推進網路技術,為資料中心節省成本。而輝達的客戶普遍表示支持並樂見其成。
  • 輝達並不經常收購公司,因為喜歡與別人合作,輝達也是一個開放平台(比如 CUDA、DGX),同時輝達的業務模式必須是開放的。但之所以收購 Mellanox,是因雙方長達 10 年的合作,輝達認為 Mellanox 在高速、高性能計算和網路設計方面非常擅長。
  • 輝達為什麼願意以如此高價收購?因 Mellanox 值這個價錢──這不是成本問題,而是價值問題。

二、關於 3D 和堆疊技術、7 奈米技術

本次 GTC,輝達沒有推出之前廣泛預測的 7 奈米 GPU 架構,這也引起外界質疑:處理技術放緩的情況下,輝達將如何看待 3D 和堆疊技術?面對 AMD 推出的 7 奈米 CPU,輝達會否在 7 奈米有所動作?

黃仁勳表示:

  • Tesla V100 已是處理量最大的 3D 封裝矽片,而輝達也是台積電最大的晶片堆疊客戶。事實上,3D 堆疊已有 5 年歷史,有些人甚至用它堆疊手機晶片,這樣可降低封裝高度。這技術存在一段時間了,不是新東西。
  • 但對輝達來說,不僅需要 3D 堆疊,也需要 2D 堆疊。輝達達成 2D 堆疊的方法就是 NVLink。輝達也需要一定規模的資料中心,這不再是為了 2D 堆疊,而是為了提升處理量。為此,輝達需要透過 Mellanox 達成,將多個 GPU 與大型計算引擎相連。
  • 未來,資料中心將成為巨大的計算引擎,且體積要不斷縮小,計算效果卻非常驚人──這需要具備高性能技術專長,也是 Mellanox 擅長的。

針對外界關注的 7 奈米技術和下一代 GPU 發展,黃仁勳表示:

實際上 7 奈米技術已公開發售,台積電也希望能賣給我們;我要買它也非常容易。但對輝達來說,我要考慮的問題是,購買 7 奈米的要義和益處是什麼?對 NVIDIA 來說,從台積電購買 7 奈米處理器技術,並不會讓我們成為一家好公司,只會讓台積電更好。而輝達的與眾不同之處在於,我們任何時候都能開發最具能效的 GPU,且利用的是最具成本效益的技術。實際上,我們的工程師也是架構師,他們必須開發最具能效的 GPU,比如 Turing;我們的貢獻是兼顧效率與最佳架構──我們為 Turing 選擇了最佳技術,即 12 奈米。

三、關於軟硬體關係、RTX 的技術應用

對本次 GTC 來說,最新發表的 CUDA-X 加速庫成為亮點,同時資料中心和 RTX 技術成為重中之重,GPU 硬體提及的次數明顯少了很多。當被問及為什麼硬體在 GTC 2019 的角色相對弱化,黃仁勳表示:

你之所以聽到很多關於軟體的內容,是因為:如果我們不為硬體開發軟體,那麼硬體將沒有用武之地;(正是因為有相應的)軟體存在,才使硬體出色。如果我們不自己開發軟體,那麼市場將只有適用 CPU 的軟體。輝達的業務是向新市場銷售電腦平台,如果我們想這樣做,我們必須打造新的軟體架構(比如 CUDA-X)。這方面沒人會幫我們,我必須親力親為。

面對外界對基於圖靈架構的 RTX 市場銷售和技術應用情況的質疑,黃仁勳回應:

RTX 最初 8 週的增長幾乎比 Pascal 快 50%。然而,人們為什麼會覺得 RTX 的應用放緩?這是因為當我們首次向市場推出產品時,我們有加密產品庫存,我們不能推出整個系列──我想這樣做,但是不能。現在,我們已推出整個系列,它們都表現得很出色。

另外,伴隨 RTX 伺服器推出,外界也開始關心 RTX 技術何時能納入 Geforce Now(簡稱為 GFN)並開放,對此,黃仁勳回應以下要點:

  • 目前新製造的 GFN 伺服器都採用光線追蹤技術。
  • 目前 GFN 等待名單有 30 萬玩家和 100 萬用戶。首要挑戰是要確保能大規模、高品質地提供這項服務,其次就是必須降低成本,以便減低客戶成本,讓他們去玩免費的遊戲。另外,第三個挑戰就是確保 GFN 能涵蓋全球更多國家,而不僅是西方國家。
  • 預計光線追蹤將在 2019 年第三、第四季開放。

四、關於摩爾定律的終結和資料中心的未來

本次 GTC,以資料中心為載體的資料科學(Date Science)也是黃仁勳談到的重點內容。當被問及對英特爾最新架構的看法時,黃仁勳表示:

首先我認為英特爾也認識到加速計算是未來的發展方向。整個行業不再認為 CPU 和 GPU 互斥,這當然是好事,因為那條路已經走不通了。我們要承認,需要新方法引領產業向前發展。其次,我們僅占全球 HPC 總量的一小部分,在全球超級電腦企業(500 強企業)中,英特爾有充分理由占非常大的市占率。英特爾是一家競爭力很強的公司。我期待他們奮勇向前,我們也將積極面對挑戰,最後受益的將是全世界用戶和研究人員。第三,我不太確定,英特爾最新架構是設計本身的成功,還是原有技術的延展。但我認為非常好的是,英特爾的聲明基本是在討論加速計算;是在說:「來點真格的吧,加速我們的堆疊。」

關於目前資料中心發展所受的限制,黃仁勳最後表示:

其實很簡單,目前對資料中心的唯一限制就是:摩爾定律的終結。我們深知,未來計算負荷呈指數趨勢增長。如果摩爾定律已經終結了,唯一的方式將是構建更多的資料中心。我相信,將來的趨勢是增加資料中心的工作負荷,這樣,資料中心的計算能力將會以 10 倍的速度提升,結果是:軟體創新將會突飛猛漲,計算能力將進一步增強,而這會推動更多創新。

(本文由 雷鋒網 授權轉載)

延伸閱讀: