Intel 第六代處理器 Skylake 完全解析:GPU 篇

作者 | 發布日期 2015 年 09 月 14 日 13:37 | 分類 Apple , 晶片 , 精選 follow us in feedly
X01

上一篇當中,我們提到了Intel新處理器 Skylake 的 4 大特點,包括製程提升、支援 DDR3 與 DDR4、取消 FIVR、BCLK 獨立等功能。當然這僅止於處理器層面的變化,Skylake 平台還有繪圖核心的改變,以及主機板晶片組的改進。這次讓我們來看看,Skylake 在繪圖核心有哪些改變。



Intel 這幾年處理器的效能增長如擠牙膏般一滴滴被壓榨出來,而且絕大多數的增長都是顯示核心層面,而非處理器本身的運算效能提升。從 HD Graphics 時代開始,Intel 顯示核心的地位逐漸提升,近幾年甚至能達到中低階 NVIDIA 與 AMD 獨立顯卡的效能表現。

試想,當每顆處理器都有內建不亞於低階獨立顯卡的顯示效能,何必選擇獨立顯卡呢?一方面可減少耗電量,再者也能釋放電腦的可用空間。這次 Skylake 繪圖核心主要在架構規模上提升,並且給了它個新的命名原則。

X02

▲ Skylake 的處理器分配如上圖,最左側即為繪圖核心。

GPU 特色 1:EU 規模暴增

EU 是什麼?EU(Eexecution Uunit) 是 Intel 繪圖核心基本的運算單位,地位等同於 NVIDIA 的 CUDA Core,以及 AMD 的 ALU(Arithmetic Logic Unit)。過去在 Haswell 上使用的架構為 Gen 7.5,是將 10 個 EU、Thread Dispatch(執行緒調度器)、Sampler(採樣器) 等元件,共同組成 1 組 Subslice。

若將 2 組 Subslice、Fixed function units,加上 L3 Data Cache,就成了完整的運算單元 Slice。因此 Slice 內有 20 個 EU,這也是為什麼在 Haswell 上,完整的繪圖核心規格都是 20 或 40 個 EU,例如 Core i7-4770K 的 GT2 有 20 個 EU,Core i7-4770R 的 GT3e 是 40 個 EU。至於低階產品,核心架構肯定是會刪減,因此只有 1 組 Subslice 構成 Slice,像是低階的繪圖核心 GT1 就只有 10 個 EU。

X03

▲ EU 是基本的運算單位,即便如此,內部還是有許多次層級的元件。

Gen 9 架構換湯不換藥

Broadwell 時代進化到了 Gen 8 架構,此時 Slice 內的架構設計略有變化,每組 Subslice 內僅存 8 個 EU。你可能會問,這樣效能不就更差了嗎?的確,若 Slice 內僅有 2 組 Subslice 的話確實會讓效能降低,但 Intel 讓 Slice 內增為 3 組 Subslice,讓整體的運作效率提升。

 

X04

▲ Gen 7.5 架構內 Subslice 有 10 個 EU,後來到了 Gen 8 時期為了效率,刪減為 8 個 EU。

為何 Broadwell 重新排列組合後效率會增加?從架構圖中我們可以看到,每組 Subslice 內只有 8 個 EU,也就是說每個 Thread Dispatch(執行緒調度器)、Sampler(採樣器) 可以更有效率分配。而運算效能的部分,可以藉由堆疊更多的 Subslice 來達成(也就是更多的 EU),讓 Broadwell 運算效能更高。因而在 Broadwell 上,看到的 EU 數量大多是 24 或 48 等等 8 的倍數。

X05

▲ Gen 8 與 Gen 9 皆採用 8 個 EU 的配置,並且由增加 Subslice 的總數,來達到提升整體效能的目的。簡單來說,就是靠一堆運算單位來堆出效能。

到了 Skylake 時期,繪圖核心架構被稱為 Gen 8.5 或 Gen 9,從已知的架構來看,設計與 Broadwell 的 Gen 8 相同,差別僅在於顯示核心內 Slice 數量最多增加到 3 組,EU 從原本的 24、48 個,增加到最多 72 個。

X06

▲ Skylake 時期 Slice 內有 3 組 Subslice,每個繪圖核心內又有 3 組 Slice,因此EU總計有 8x3x3=72 個。

GPU 特色 2:型號新命名原則

剛剛說過,EU 從原本的 24 增加到最多 72 個,因此繪圖核心的型號增加最高的 GT4 等級,再往下依序是 GT3、GT2、GT1。當然這是給廠商以及內部使用的型號,對消費者 Intel 仍保留了 Iris Pro、Iris、HD Graphics 等品牌行銷代號。

且為了精簡型號代碼,型號從原本的 4 碼變更為3碼,像是 Iris 540、HD Graphics 515 等型號。你可以從型號中得知繪圖效能高低,Iris Pro 優於 Iris 優於 HD Graphics。內建 72 個 EU 最高級的 GT4e 就是 Iris Pro,48 個 EU 的 GT3 與 GT3e 就是 Iris,再往下就是 HD Graphics。

重生的 GPU 效能

過往 Intel 的繪圖效能都只有被嘲笑的份,但從 HD Graphics 時代開始已經有明顯的進步,到了近幾年,Iris 系列更是能與中低階獨立顯示卡抗衡。內建就能有不錯的效能,何必多花錢買獨立顯卡。但仍有許多消費者認為獨立顯示晶片還是比較好,這造成了部分筆電上,搭配的獨立顯示晶片,竟然比內建的 Intel 顯示效能還要差的怪現象。目前最高級的 Iris Pro,也就是 GT4e 等級,約莫等同 GTX 740、HD 7750。

X07

▲ Skylake 基本的 Gen 9 架構配置如上,可視情況再增加 Slice 以提升效能。

GPU 特色 3:eDRAM 運作改變

eDRAM 是 Haswell 開始搭載的硬體設計,簡單來說它的作用為 L4 Cache。會增加這功能,主要是因為 IGP(整合型繪圖晶片) 經常面臨記憶體頻寬不足的問題,Intel 提供的解決方式就是在處理器內,有個獨立的記憶體區塊也就是 eDRAM,時脈最高 1.6GHz。

之所以位於獨立區塊,原因是這區塊製程不同於其他區域,且獨立的好處是能隨市場增加或減少記憶體容量,操作彈性較高。有意思的是,這 eDRAM 並非完全隸屬於 GPU,而是可隨狀況動態調整支援 CPU(處理核心) 或 GPU(繪圖核心)。這意味著,當安裝獨顯的時候,eDRAM 就會完全替 CPU 工作,因為此時 GPU 是關閉的。

在Skylake時期,繪圖核心可與處理核心共用 LLC(L3快取),但跟 Haswell 時期相比,差異在於 eDRAM 運作方式改變。現在 eDRAM 控制器位於 System Agent,此時 LLC 能空出 512KB 的空間,讓 eDRAM 被視為 LLC 與系統主記憶體之間的快取機制。

然而,並非所有 Skylake 處理器都有 eDRAM 設計,像是 Core i7-6700K 就沒有 eDRAM。一般而言 eDRAM 容量約 64 至 128MB 不等,最高時脈 1.6GHz,讀寫的匯流排採分離設計,各有 32byte 的傳輸量。

X08

▲eDRAM 可動態服務 CPU 或 GPU,但並非所有產品都有配制 eDARM。

GPU 特色 4:設計小改效率提升

雖說 Gen 9 跟 Gen 8 的架構設計大同小異,但深層仍有些變動,在此一併解說差異。基本的運算單位 EU,現在可將當下執行的執行緒中斷,改執行其他執行緒,也就是 EU 可支援多工的運作。此外,支援列表還有 round-robin,以及執行途中不中斷的 32bit 浮點數原子式操作。

先前說過 LLC 空出多餘的空間,這讓 Shared Virtual Memory 的寫入效能提升。材質樣本現在可支援 NV12 YUV 格式。

此外,單一 Slice 內 L3 Cache 容量從先前的 384 至 576KB,增加到 768KB。並有共享記憶體,用以存放各 EU 間互通的資料。Skylake 的繪圖核心靠的是 Graphics Technology Interface 與其他硬體溝通,它位於架構圖最底下的位置,即為繪圖核心的溝通介面,意義上與 LLC 連接。

Gen 9 架構的規格、效能,大多與 Gen 8 相同,但靠著比較多的 EU 總數,效能面還是可以勝過自家前代產品。且靠著已經成熟的 Slice 架構配置,可增減需要的 Subslice 數量,藉此作出產品區隔與效能差異。

X09

▲ 中央橘黃色即為 Intel 這幾年很重視的 Ring,用以連接處理器內各原件的資訊,簡單來看可視為資料的交換、傳輸管道。

靠堆量取勝的小改款

整體而言,Skylake 的繪圖核心設計與 Haswell 相比變化不大,這讓我們看到了當年 AMD 與 NVIDIA 的影子。靠著堆疊與切割運算單位,藉此達到效能增減的效果。以 Intel 目前的架構規模來說,這方式仍可運作一段時間,但仍有幾點值得關注。

第一,繪圖核心規模增加後,是否會影響到處理核心原本的表現,像是 TDP 的問題。其二,處理器內,能夠容納的繪圖核心有多大的區塊,雖然製程精進電晶體密度更高,但總會有物理極限的問題,以及 Die 可用面積有限。

Skylake 的 Gen 9 架構,沒帶給我們太多的驚喜,但效能差距擺在眼前,對於消費者來說,關心的永遠不會是架構上的改變。而是效能增加的多少,價格又便宜了多少。以這點來說,Skylake 應該還算相當成功的產品。

延伸閱讀:

關鍵字: , , , , , , ,

發表迴響