英特爾宣布首款 AI 商用晶片已生產，新一代 Movidius VPU 2020 年見

美國時間 11 月 12 日，2019 英特爾人工智慧高峰會談（Intel AI Summit 2019）在舊金山舉行。在會議期間，英特爾展示了一系列 AI 相關新產品和相關進展，其中，包括針對訓練（NNP-T1000）和推理（NNP-I1000）的英特爾 Nervana 神經網路處理器（NNP）都逐一亮相，而英特爾也公布新一代 Movidius Myriad 視覺處理單元。

英特爾公司副總裁兼人工智慧產品事業部總經理 Naveen Rao （見首圖）表示：

隨著人工智慧的進一步發展，運算硬體和記憶體都將到達臨界點。如果要在該領域繼續取得巨大進展，專用型硬體必不可少，如英特爾 Nervana NNP 和 Movidius Myriad VPU。採用更先進的系統級人工智慧，我們將從「數據到資訊的轉換」階段發展到「資訊到知識的轉換階段」。

Nervana NNP 已經投入生產

對於英特爾來說，Nervana NNP 是它在神經網路處理器方面的重要產品，可以說是第一款 AI 商用晶片，而且這款產品從發表、測試、量產到應用，實際上經歷了一個漫長的產品週期。

新一代 Nervana NNP 首先亮相是在 2018 年 5 月。當時，在英特爾人工智慧開發者大會（AIDevCon 2018）上，Naveen Rao 發表新一代專為機器學習設計的神經網路處理器（NNP）晶片，並表示這是英特爾第一款商業 NNP 晶片，將不只是提供給小部分合作夥伴，將在 2019 年發貨。

到了 2019 年 8 月，英特爾在 Hot Chips 大會召開期間公布 NNP 晶片的更多資訊，其中，它依據用途分為 Nervana NNP-T 和 Nervana NNP-I，分別用於訓練和推理。

據了解，Nervana NNP-T 代號 Spring Crest，採用了台積電的 16 奈米 FF+ 製程，擁有 270 億個晶體管，矽片面積 680 平方毫米，能夠支援 TensorFlow、PaddlePaddle、PYTORCH 訓練框架，也支援 C++ 深度學習軟體庫和編譯器 nGraph。

而 Nervana NNP-I，代號為 Spring Hill，是一款專門用於大型資料中心的推理晶片。這款晶片是基於10 奈米技術和 Ice Lake 核心打造的，打造地點是以色列的 Haifa ，英特爾號稱它能夠利用最小的能量來處理高負載的工作，它在 ResNet50 的效率可達 4.8TOPs/W，功率範圍在 10W 到 50W 之間。

按照官方說法，英特爾 Nervana 神經網路訓練處理器（Intel Nervana NNP-T）在運算、通訊和記憶體之間取得了平衡，不管是對於小規模群集，還是最大規模的 pod 超級電腦，都可進行近乎線性且極具能效的擴展。英特爾 Nervana 神經網路推理處理器（Intel Nervana NNP-I）具備高效能和低成本，且其外形規格靈活，非常適合在實際規模下運行高強度的多模式推理。這兩款產品針對百度、 Facebook 等先進人工智慧客戶，並針對他們的人工智慧處理需求進行了定制開發。

在 2019 英特爾人工智慧高峰會現場，英特爾宣布──新推出的英特爾 Nervana 神經網路處理器（NNP）現已投入生產並完成客戶交付。其中，Facebook 人工智慧系統協同設計總監 Misha Smelyanskiy 表示：

我們非常高興能夠與英特爾合作，利用英特爾神經網路推理處理器（NNP-I）部署更快、更高效的推理計算；同時，我們最新的深度學習編譯器 Glow 也將支援 NNP-I。

另外，百度 AI 研究員 Kenneth Church 在現場表示，在今年 7 月，百度與英特爾合作宣布雙方在 Nervana NNP-T 的合作，雙方透過硬體和軟體的合作來實現用最大的效率來訓練日益增長的複雜模型。Kenneth Church 還宣布，在百度 X-Man 4.0 的加持下，英特爾的 NNP-T 已經推向市場。

新一代 Movidius VPU 2020 年見

在峰會現場，英特爾公布全新一代 Movidius VPU。

下一代英特爾 Movidius VPU 的代號是 Keem Bay，它是專門為邊緣 AI 打造的一款產品，專注於深度學習推理、電腦視覺和媒體處理等方面，採用全新的高效能架構，並且透過英特爾的 OpenVINO 來加速。按照官方數據，它在速度上是輝達 TX2 的 4 倍，是華為海思 Ascend 310 的 1.25 倍。另外在功率和尺寸上，它也遠遠超過對手。

英特爾方面表示，新一代 Movidius 計劃於 2020 年上半年上市，它憑藉獨一無二的高效架構優勢，能夠提供業界領先的性能：與上一代 VPU 相比，推理性能提升 10 倍以上，效能則可達到競品的 6 倍。

據了解，英特爾曾經在 2017 年 8 月推出一款 Movidius Myriad X 視覺處理器（VPU），該處理器是一款低功耗 SoC，採用了 16 奈米製程，由台積電來代工，主要用於基於視覺的設備的深度學習和 AI 演算法加速，比如無人機、智慧相機、VR / AR 頭盔。

除了新一代 Movidius，英特爾還發表全新的英特爾 DevCloud for the Edge，該產品旨在與英特爾 Distribution of OpenVINO 工具包共同解決開發人員的主要痛點，即在購買硬體前，能夠在各類英特爾處理器上嘗試、部署原型和測試 AI 解決方案。

另外，英特爾還介紹了自家的英特爾至強可擴展處理器（Xeon）在 AI 方面的進展。

英特爾方面表示，推進深度學習推理和應用需要極其複雜的數據、模型和技術，因此在架構選擇上需要有不同的考量。事實上，業界大部分組織都基於英特爾至強可擴展處理器部署了人工智慧。英特爾將繼續透過英特爾向量神經網路指令（VNNI）和英特爾深度學習加速技術（DL Boost）等功能來改進該平台，進而在數據中心和邊緣部署中提升人工智慧推理的性能。

英特爾強調稱，在未來很多年中，英特爾至強可擴展處理器都將繼續成為強有力的人工智慧計算支柱。