Category Archives: GPU

機器數據時代:AI 伺服器的訓練與推理應用分析

作者 |發布日期 2023 年 05 月 22 日 7:30 | 分類 AI 人工智慧 , GPU , 伺服器

AI 將為商業市場帶來廣大效益,使大廠積極投入 AI 訓練,推動硬體設備需求。ChatGPT 用戶數量和使用頻率持續成長下,推動更多推理算力消耗;同時模型更新,訓練資料增加亦造成更多算力消耗,使 AI 訓練無止境進行。由於模型成長速度遠高於硬體成長速度,推動 AI 伺服器零組件發展,並隨著硬體效能增加而提高成本。 繼續閱讀..

生成式 AI 動力核心,NVIDIA 宣布 DGX H100 系統開始出貨

作者 |發布日期 2023 年 05 月 02 日 12:20 | 分類 AI 人工智慧 , GPU , 半導體

生成式 AI 熱潮方興未艾,核心動能的資料中心 GPU 更令人關心。GPU 大廠輝達 (NVIDIA) 運算副總裁 Manuvir Das 參加 1 日 MIT Technology Review 舉行的 Future Compute 活動,宣布 DGX H100 系統開始出貨,可幫助從東京到斯德哥爾摩客戶,用 NVIDIA 最新 AI 超級電腦提升製造、醫療照護、機器人等生成式 AI 應用需求。

繼續閱讀..

Google 推出號稱速度更快、更省電的 AI 超級電腦,輝達為何沒在怕?

作者 |發布日期 2023 年 04 月 22 日 10:30 | 分類 AI 人工智慧 , Google , GPU

自 ChatGPT 掀起 AI 聊天機器人大戰,各家大廠無不摩拳擦掌。目前 AI 模型訓練與部署市占率超過九成的輝達(Nvidia),股價自年初暴漲近一倍,反觀也是 AI 技術推動者的 Google,雖然在過去十年取得不少 AI 重大突破,卻在這波聊天機器人大戰失色。 繼續閱讀..

輝達 Blackwell 架構 GPU 仍將採單晶片設計,台積電 3 奈米打造

作者 |發布日期 2023 年 04 月 12 日 11:45 | 分類 GPU , IC 設計 , 半導體

外媒報導,2022 年的 Arete 技術大會上,輝達 (NVIDIA) 副總裁兼加速計算負責人 Ian Buck 重申了輝達將致力於每兩年更新主要 GPGPU 架構的計畫,確認新一代 Blackwell 架構 GPU 將會在 2024 年推出。預計 GTC 2024 年可能是 Blackwell 架構的首次處女秀,而應用在伺服器的產品預計將會領先 GeForce 顯示卡出現。

繼續閱讀..

英特爾能否重演資料中心戰場發動反擊的「核戰」?

作者 |發布日期 2023 年 04 月 10 日 8:10 | 分類 GPU , IC 設計 , 伺服器

英特爾最近發表新伺服器處理器時程表,確立現在到 2025 年 Xeon 藍圖,除了送樣中的第五代 Xeon Scalable「Emerald Rapids」第四季問世,2024 上半年英特爾將推出「追求能耗比」的 144 個「節能小核」(源自 Atom 體系的 E-Core)「Sierra Forest」處理器,對抗 AMD 的 128 個 Zen 4c 核心 EPYC「Bergamo」,而「標準大核」(P-Core)「Granite Rapids」則預定 2024 下半年登場,對決 AMD Zen 5 世代 EPYC。 繼續閱讀..