GDDR5X 顯示記憶體技術規範出爐,或將成為 A/N 卡中階市場發力點

作者 | 發布日期 2016 年 01 月 27 日 14:30 | 分類 晶片 , 零組件 follow us in feedly
雷鋒網配圖

2015 年 10 月,美光(Micron)對外稱,將要在未來一段時間內給市場帶來一種經過改進後的 GDDR5 顯示記憶體——GDDR5X。不過並沒有透露更多細節,而且當時連美光自己都不確定這項技術是否具有可行性。



美光之前預計在 2016 年年底開始量產 GDDR5X 顯示記憶體,能否成功投入商用就得看 AMD、NVIDIA 是否採用。不過日前,JEDEC 已正式認可並公布了 GDDR5X 的顯示記憶體技術規範,這能夠顯著增加該技術的吸引力。

 

GDDR5X vs. GDDR5

HBM 顯示記憶體已經成為新一代高階顯示卡的標準之一,而且之前 JEDEC 也正式公布了 JESD235A 的技術規範標準,帶來了 TB/s 級頻寬、16 / 32GB 超大容量的 HBM2 顯示記憶體。不過 HBM 的問題在於成本依然很高,不可能短時間內應用在全部顯示卡上。

而另一方面,雖然全新的 GDDR6 早已開始投入研發,但是因為技術、市場各方面的原因,也無法在短時間內投入商用。

GDDR5X 則可以簡單理解為在 GDDR5 技術基礎上的一個延伸,畢竟 GDDR5 已經在顯示卡上用了將近 7 年,技術已經相對成熟。如果能夠像 HBM 那樣大幅提高顯示記憶體頻寬的話,理論上性能也能夠得到進一步提升。

於是,GDDR5X 選擇採用雙管齊下的方式來提升顯示記憶體頻寬。首先,它的匯流排從 DDR(雙倍數據倍率)升級到了 QDR(4 倍數據倍率)。

雷鋒網配圖

▲ SDR、DDR 和 QDR 之間的資料傳輸速率差異。

需要說明的是,SDR(單倍數據倍率)即只利用時脈信號的上沿來傳輸資料;而 DDR(雙倍數據倍率)則同時利用了時脈信號的上沿和下沿來傳輸資料,這意味著系統可以在同樣的時間內、同一 clock 頻率下將傳輸資料的速率提升一倍;而 QDR(4 倍數據倍率)則在 DDR 的基礎上,進一步提供獨立的寫入介面和讀取介面,以此達到 4 倍之於 SDR 的資料傳輸速率。

同時,GDDR5X 還簡單的將資料預取位元寬從 8-Bit 提升到 16-Bit,從而得到更高的頻寬,初期即可達到 10-12Gbps,而隨著進一步的研發最高能夠提升到 16Gbps。相比之下,GDDR5 現在最高也才 7Gbps。

傳輸速率的提升再加上顯示記憶體位寬的提升,相當於在提高車速的基礎上又拓寬了車道數量。

外媒 MonitorInsider 從 GDDR5X 的技術標準層面上剖析了它與 GDDR5 的不同之處,他們在文中提到,使用 GDDR5X 顯示記憶體技術時可能無法完美適用於 Nvidia 的 GPU。

因為 16-Bit 資料預取位元寬意味著每次預取都將包含有 64 位元組的資料,而 Nvidia 的 GPU 所使用的是 32-Bit 標準,所以每當 N 卡訪問 L2 快取記憶體時,DRAM 都將獲取到兩倍之於 L2 快取記憶體中的資料量。

不過為了保持與 GDDR5 的相容性,方便廠商升級,GDDR5X 顯示記憶體引入了一項名為「偽獨立記憶體讀取」(Pseudo independent Memory Accesses)的新技術,這應該能夠幫助解決這一問題。

 

GDDR5X 並沒有解決 GDDR5 的核心缺陷

既然 JEDEC 已經正式公布了 GDDR5X 的技術標準,那麼 AMD 和 Nvidia 很有可能在未來應用這項技術。鑒於 HBM 和 HBM2 在量產上的技術難度,以及有別於平面結構的 3D TSV 立體矽穿孔技術,導致產業內很多人士都認為實際上 GDDR5X 是更佳的長期選擇。

平心而論,RDRAM、Larrabee 和安騰處理器都過於超前了,因為目前來說這些技術仍不成熟,相對而言成本過於昂貴。而事實也證明,這些超前的新技術分別被改進多次之後的 DDR 記憶體、光柵和 AMD 的 x86-64 所替代。

但為什麼 HBM 卻得到一個不同的結局呢?

原因就在於,HBM 和 HBM2 的改進不僅停留在提高記憶體頻寬上,這兩個技術標準都大幅削減了 VRAM 功耗,還顯著提高了顯示記憶體性能。此外,HBM2 所提供的 VRAM 密度是 GDDR5X 所無法比擬的。

4GB-HBM2-DRAM-structure_main

(圖片來源:Samsung

舉個例子,就在 1 月 19 日,三星宣布基於 HBM2 技術的產業首個 4GB DRAM 顯示記憶體顆粒,已經開始批量生產,4GB HBM2 封裝下面是緩衝晶片,上面是 4 個 8Gb(1GB)容量的 HBM2 DRAM 晶片。

不僅如此,三星還計劃今年推出 8GB HBM2,容量在此基礎上再翻一倍,一顆就能滿足高階顯卡的需求,從而比 GDDR5 節省 95% 的電路板空間。

而反觀當下的美光生產的 GDDR5 顯示記憶體最高也只能達到單晶片 1Gb。即使假設美光能夠在未來將其提升到 2Gb,也仍需 16 顆晶片才能追上三星,而且這 16 個晶片都需要各自獨立的尋跡路由,物理上的面積需求也是一個大問題。雖然 GDDR5X 能夠把訊號電壓降低到 1.35v,但這仍不足以抵消晶片數量的增加所帶來的整體功耗提升。

雷鋒網配圖

▲ 這張圖片顯示出在平面結構上無限疊加 RAM 所帶來的問題:GDDR5X 下單個 32Gb 的 GPU 需要更多的晶片。

在 2D 平面上進行顆粒疊加也存在技術瓶頸,而且還會進一步增加發熱量和功耗,最終的研發和生產成本甚至並不亞於 HBM2。上面的這張幻燈片就是 AMD 在一次演講中所述,它同樣也適用於 Nvidia。

 

發力中階市場,解燃眉之急

不過,至少在最近的一段時間內,我們或許能夠看到一到兩家供應商開始使用 GDDR5X 技術。這在短期內能夠使 AMD 和 Nvidia 在 GPU 頻寬 VRAM 緩衝大小上獲得實質性的提升。

雖然 HBM2 、GDDR5X 和 GDDR5 到底誰主沉浮仍不明朗,但沒有哪家公司會想要放棄 GDDR5X 帶來的競爭優勢。畢竟,搭載 GDDR5X 顯示記憶體能夠使得 Nvidia 或 AMD 在中階顯卡上的頻寬問題得到有效緩解。

(本文由 雷鋒網 授權轉載)

關鍵字: , ,

發表迴響