ARM 透過 64 位元 HPC 系統加速數學運算效能

作者 | 發布日期 2015 年 12 月 10 日 14:55 | 分類 市場動態 , 軟體、系統 line share follow us in feedly line share
ARM 透過 64 位元 HPC 系統加速數學運算效能


為強化對高效能運算 (HPC) 伺服器的實行,全球 IP 矽智財授權廠商 ARM® 宣布推出專為 64 位元 ARM®v8-A 處理器精準調校的全新數學函式庫。ARM Performance Libraries
為基礎數學例行程序,可讓基於 ARM 核心的高效能運算 (HPC) 伺服器和系統發揮最大運算軟體效能。ARM 數學函式庫充分利用晶片合作夥伴為 ARMv8-A 架構系統單晶片 (SoC) 設計的創新特色和功能,確保系統效能達到高峰。ARM Performance Libraries 將於 SC15 會議中首次公開亮相,歡迎 HPC 社群蒞臨參觀。

ARM 開發者系統事業群總經理 Hobson Bullman 表示:「ARM Performance Libraries 為 ARM 伺服器和 HPC 生態體系的發展立下另一個重要的里程碑。HPC 社群向來是 ARM 伺服器的早期使用者,推出優化的數學例行程序有助於為 64 位元 ARM 運算平台建立科學運算的基礎。ARM Performance Libraries 可同時滿足軟體效能和函式庫介面一致性的需求, 進而簡化 ARMv8-A 伺服器平台的軟體開發和移植。」

 

專為合作夥伴晶片優化的 ARM Performance Libraries

ARM 協助負載優化晶片和伺服器平台大幅拓展 HPC 的效能範圍。為了讓終端客戶見證因 ARMv8-A 架構差異化所帶來的驚人成果,ARM 與晶片合作夥伴密切合作,為每一款 64 位元的 ARM SoC 進行調校以增強效能。這種方式巧妙地運用晶片的創新和設計,例如記憶體層級和管線配置 (pipeline configuration),對運算成果將直接產生影響。

 

ARM Performance Libraries 的核心 Numerical Algorithms Group

NAG 函式庫和相關的驗證套件是全球最大的商用數值和統計演算法組庫。NAG 函式庫代表嘗試與測試過的基準線,從而建立 ARMv8-A 架構設計的變數。奠基於 NAG 經業界測試的 BLAS、LAPACK 和 FFT 數學例行程序,ARM 得以快速推出成熟、精確且經驗證的核心函式庫。ARM Performance Libraries 採多線程、SIMD (單指令多數據指令) 優化、且使用業界最新的編譯器,可讓 64 位元 ARM SoC 設計達到峰值傳輸量。

NAG 技術長 Mike Dewar 表示:「利用 NAG 的線性代數和 FFT 演算法作為核心,ARM Performance Libraries 為高階科學運算應用的最佳建構模塊(building block)。透過 ARM Performance Libraries 對特定硬體的效能調校,加上 NAG 對穩健性和運算正確性的嚴格要求,可為 ARM 生態體系提供最快速且精確的運算數學例行程序。」

Cavium 生態體系暨合作夥伴計畫總監 Larry Wikelius 表示:「Cavium 很高興與 ARM 和 NAG 合作推出優化函式庫,以滿足 HPC 和大數據分析軟體等應用嚴苛的需求。ThunderX™ 是 Cavium 48 核心、支援雙插槽的 ARMv8-A 工作負載優化處理器 (Workload Optimized Processor),為採用 ARM Performance Library 的高效能運算應用,提供頂級效能的最佳平台。Cavium 和 ARM 將持續積極地推動 ARMv8-A 伺服器生態體系的發展,與業界領先的系統和軟體合作夥伴攜手為 HPC、企業級和超大規模伺服器市場提供關鍵解決方案。」

 

助力 ARM HPC 開源應用

為了讓軟體加速移植到 ARMv8-A 架構平台,例如 64 位元的 ARM Cortex® 核心伺服器,ARM Performance Libraries 為廣受歡迎的 HPC 開源應用提供二進制發布測試版,包括 ATLAS、OpenMPI、NumPy 和 TAU。所有將開源應用移植到 ARM 平台所需的變動,都將回饋給開源資料庫,以促進 HPC 社群的發展和合作。

 

授權時程

ARM Performance Libraries 已開放授權,由 ARM 提供無限制、完全支持、零權利金、且負責開發平台的維運。內建的開源套件組合則依個別協議內容提供。