中國 RISC-V 技術公司,宣稱設計了一款性價比超過同等級 ARM 架構的 AI 晶片

作者 | 發布日期 2018 年 12 月 03 日 9:00 | 分類 晶片 , 零組件 follow us in feedly

誕生於加州大學柏克萊分校的 RISC-V 開源指令集近來在中國關注度非常高。5 月,上海發表國內首個 RISC-V 支援政策。9 月,中國 RISC-V 產業聯盟在上海成立。11 月,中國開放指令生態(RISC-V)聯盟在烏鎮宣布成立。有意思的是,中國最早做 RISC-V 的公司選擇落腳深圳,並僅用 7 個月就設計出一款基於 RISC-V 指令集的 AI 晶片,能耗和面積明顯優於同等級 ARM 架構晶片,更讓行業吃驚的是該款晶片一次性流片成功。這是否意味著 ARM 在 AI 和 IoT 領域即將面臨一場與新興技術的硬戰?



僅用 7 個月完成晶片研發的兩大關鍵

僅用 7 個月就完成從零開始設計驗證到交付流片全部研發工作的公司叫睿思芯科,是 2017 年美國矽谷新創 OURS 公司在深圳設立的中資公司,OURS 創始人兼 CEO 譚章熹在清華大學電子工程系獲得學士學位,之後於加州大學柏克萊分校深造,師從新晉圖靈獎得主 David Patterson,取得計算機科學博士。RISC-V 就出自 2017 年圖靈獎得主 David Patterson 之手,這意味著譚章熹博士成了離 RISC-V 技術最近的中國人。

譚章熹接受雷鋒網專訪時表示:「說我們是中國最早做 RISC-V 指令集晶片的公司應該不會有爭議,之所以把中資公司設在深圳,是因為我覺得無論從環境、文化還是人才的角度,深圳和我們最匹配。我們基於 RISC-V 指令集的 AI 晶片 Pygmy 僅用 7 個月,就完成從零開始設計到交付流片。」

譚章熹提到的 Pygmy AI 晶片並沒有隆重的發表會,首次亮相是在 11 月初 Patterson 教授於烏鎮世界網路大會的演講,Pygmy 也在大會期間展出。據了解,Pygmy 是全世界最小的鸚鵡。譚章熹透露,睿思芯科的第二代架構叫 Pocket,是世上第二小的鸚鵡。不難發現,睿思芯科的架構和產品都以鳥種類命名,但新一代產品命名使用的鳥體型比上一代大,譚章熹希望公司產品能涵蓋越來越多市場空間。

▲ 譚章熹和老師 David Patterson。

睿思芯科的產品命名很有特色,但更引人關注的是其如何在 7 個月內完成全部研發工作。譚章熹表示:「之所以能在不到一年完成全部研發工作,很關鍵的因素就是 RISC-V 指令集。我們知道微處理器的設計很難,因為軟體和硬體接口的地方很多,比如 OS、SW framework、模擬器等,不過我們依靠 RISC-V 的生態,開發工具、工具鏈等幫助我們縮短晶片的校驗時間。另一個關鍵因素,就是我們有經驗豐富的工程師,對 RISC-V 更深的理解及知道設計晶片的關鍵,對縮短晶片研發的時間也非常重要。」

到底是架構重要,還是經驗豐富的工程師更重要?譚章熹表示兩者同等重要,當然睿思芯科的晶片量產也會有必要的週期。他同時指出,想在 7 個月內完成晶片的全部設計工作並不容易,除了需對指令集有深刻理解及有經驗豐富的工程師明白如何做晶片業非常關鍵,軟體也非常關鍵。特別對 AI 而言,AI 演算法不斷演進,對晶片算力和記憶體的要求也會不斷提升,因此晶片需要具備快速更新的能力,此時架構和軟體都將發揮關鍵作用。

能耗和面積明顯優於同等級 ARM 架構晶片

時間上 Pygmy 僅用 7 個月就完成全部研發工作,晶片性能卻很強,根據睿思芯科的說法,Pygmy 比同等級 ARM 晶片,能耗下降 85%、面積減少 80%,相當於用一般 32 位元處理器的面積和功耗,就達到 64 位元處理器的性能。具體來看,Pygmy 基於 64 位元 RISC-V 指令集,使用台積電 28 奈米製程,採用多核異構架構,其中 CPU 架構是睿思芯科基於 RISC-V 指令集設計,並針對多種 AI 應用最佳化,還有 12 個高度可編程 AI 加速引擎,同樣基於睿思芯科自定義開發的 RISC-V 矢量擴展指令集設計。

性能方面,Pygmy 主控 CPU 有 64 位元位寬,主頻 600 MHz,基於 RV64G 指令集,支援雙精度浮點運算,具備乘法器、除法器、開方器等;12 個 AI 內核均為高度可編程,可以支援各種主流 AI 演算法。能耗方面,主控 CPU 功耗僅為 10mW,透過前端/後段的全棧設計,待機設計功耗不超過 1mW。且 Pygmy 在 Int8 時可實現 4 TOPS/watt,對比 Google 第一代 28 奈米 TPU 92 TOPs 超過 40 watt,差不多 2.3 TOPS/watt。另外,提供 Pygmy 晶片的同時,睿思芯科還開發了編譯器、SDK、工具鏈,基於 GCC、LLVM 等開源實現,可支援 Pygmy 用戶二次開發。

▲ Pygmy 晶片。

需指出的是,雖然上面提到 Pygmy 比同等級 ARM 晶片能耗和面積有超過 80% 下降,但因為目前沒有 ARM 晶片與 Pygmy 完全類似,因此比較的是 Pygmy 主控 CPU。那麼,Pygmy 到底是如何實現低功耗和高效能?譚章熹表示:「最主要的還是因為 RISC-V 架構的精髓──簡單、面積小、速度快。因此我們不僅架構創新,也可把晶片做得簡單高效,剛開始設計 Pygmy 時,也沒想到能得到這麼好的成績。」

除了架構不需由複雜向下精簡,架構創新也很重要。Pygmy 採用多核異構,譚章熹表示:「通用的 CPU 也能處理 AI 任務,但效率不高,這時候就需要有特殊核心和架構來滿足 AI 的需求。Pygmy 除了有主控 CPU 還有 12 個高度可編程的 AI 加速引擎,主要針對神經網路及 CNN 演算法最佳化,支援 AI 圖像和語音應用。之所以整合 12 個可編程 AI 加速引擎,和晶片面積有很大的關係。當然 12 個加速引擎只代表一個邊界,根據不同應用的性能及功耗需求,可配置數量不同的可編程 AI 加速引擎,且團隊能在 3 個月內就完成 AI 加速引擎核客製。未來,我們還會推出整合更多 AI 加速引擎的產品。」需要指出,異構架構會讓晶片編程複雜性增高。

另外,AI 晶片選擇支援的數據類型也非常重要,因為目前哪種數據類型最適合深度學習還沒有定論。據悉,Pygmy 之所以支援 Int8 和 FP16 兩種數據類型,一方面是出於晶片模組性能和功耗的表現,支援這兩種數據類型時,在終端推理表現良好;另一方面是用戶需求,因為除了晶片,相應的軟體及應用也需要支援對應的數據類型。

還有,AI 晶片消耗能量更多數據搬運而非計算,因此如何減少數據搬運及數據類型的支援,對 AI 晶片的設計者而言,也是必須考慮的問題。可以看到的是,Pygmy 搭載 1MB 的 SRAM 支援 LPDDR4、SPI、UART 等數據輸入輸出模式,但對如何減少數據搬運的耗能,譚章熹透露,睿思芯科有比較獨特的技術,主要是考慮架構設計,另外就是透過軟體控制而非傳統的硬體管理。

當然,無論傳統晶片還是 AI 晶片,除了性能、功耗以及面積,成本也至關重要。譚章熹表示,之所以選擇 28 奈米製程而非更先進的製程,是因為先進製程的提升成本越來越高,但性能提升卻有限,綜合來看 28 奈米對睿思芯科而言性價比最高。

ARM 在 IoT 領域遭遇來自 RISC-V 的挑戰?

既然 Pygmy 整體表現優於 ARM 同等級晶片,Pygmy 也面向各種物聯網終端的 AI 推理場景。同時我們還看到,國外 GreenWaves,中國中天微系統、君正集成電路、華米推出基於 RISC-V 指令集的晶片,都對準物聯網市場,這是否意味著 RISC-V 指令集晶片在 IoT 領域已勢不可擋?

譚章熹表示:「RISC-V 整個軟體生態與 ARM 的生態還有一定距離,ARM 也有一定的技術優勢,這不是短期建立的。不過我樂觀地認為 RISC-V 縮小與 ARM 生態之間的差距,要比 ARM 趕上 x86 所需的時間更短。至於與 ARM 的競爭,手機晶片領域 RISC-V 的機會不大,但我們看到 AI 以及 IoT,在新興領域 RISC-V 有非常大的機會。因為在 IoT 市場,有非常多差異化需求,且每個地區和市場還可能有特殊需求,因此在這市場大公司有競爭優勢,小公司也有優勢。」

(Source:睿思芯科

更具體地說,對於新興應用,RISC-V 指令集的晶片更靈活,小公司更能滿足這些應用的需求,這在很大程度上與 ARM 形成競爭。至於已在 ARM 投入很多且從中獲益的公司,競爭對手及成本可能是選擇 RISC-V 的關鍵因素。據了解,包括 Google、輝達、高通、AMD、IBM、華為等巨頭都已加入 RISC-V 基金會,有一些 ARM 用戶開始接觸 RISC-V 一兩年,一旦有其中一家公司推出能效和成本更低的 RISC-V 晶片,競爭對手也會迅速跟進,這對 RISC-V 指令集不僅是種認可,也有利於 RISC-V 與 ARM 競爭。

睿思芯科到底會選擇哪些 AIoT 應用切入市場,譚章熹並沒有透露。但他表示,睿思芯科的業務模式不僅提供客製化晶片或模組,也會基於已有產品做垂直服務,提供客製化解決方案。被問到是否會進入熱鬧的安防市場時,他表示,對安防市場保持關注,要進入這個市場一定會是戰略合作夥伴的方式,且會找到特定的應用角度切入,而非常見的監控鏡頭。

譚章熹也表示,即便是新的 IoT 和 AI 市場,RISC-V 想占優勢,也並非一家企業可做到,而是要一個完整的系統,這需要 5 年甚至 10 年,但他非常有信心。對於目前的 RISC-V 市場,還沒有到要彼此激烈競爭的階段,更應該共同把生態做大。僅組建聯盟而沒有拿出實際產品,也不是發展和壯大 RISC-V 的好方式,更應該拿出實際產品及實質合作,進一步貢獻 RISC-V 生態。

小結

譚章熹認為 RISC-V 的精髓在精簡、面積更小、速記更快,基於 RISC-V 指令集可設計出更好的晶片,授權費、便宜在靈活性和開放面前顯得不是那麼重要。而他對 RISC-V 的理解及晶片領域的積累,讓他和團隊能在 7 個月內就完成一款晶片的全部研發工作。當然,無論美國 OURS 還是深圳睿思芯科,文化及做事方式都充滿不少矽谷作風。

ARM 在手機領域的地位難以撼動,但在 AIoT 領域,ARM 顯然已感受到來自 RISC-V 陣營的競爭,並保持警戒。因此 AIoT 領域到底是 RISC-V 能占據優勢還是 ARM,只能讓時間解答。畢竟從歷史經驗來看,一項技術成功除了技術本身,還關係到非常多因素。

(本文由 雷鋒網 授權轉載;首圖來源:shutterstock)

延伸閱讀:

關鍵字: , , , , ,