傳 DeepSeek 擬提早推出 R2 人工智慧模型

綜合港媒報導，據路透社引述消息人士透露，中國人工智慧（AI）新創公司 DeepSeek（深度求索）正加速推出 R1 模型的後續版本，其原計劃於今年 5 月初發布 R2，但現在希望能盡早推出，具體時間則未透露。

DeepSeek本週啟動「開源週」，週一開源代碼庫為FlashMLA，針對Hopper GPU優化的高效MLA解碼內核，專為處理可變長度序列而設計；25日開源DeepEP，為首個專用於MoE模型訓練和推理設計的EP通信庫。

在此之前，據路透社報導指出，根據六名知情人士表示，由於對DeepSeek低成本人工智慧模型的需求激增，中國企業正在增加輝達H20人工智慧晶片的訂單。H20是輝達為中國市場定製的人工智慧晶片。

其中兩位知情人士表示，自DeepSeek於1月進入全球公眾視野以來，騰訊、阿里巴巴和字節跳動對H20的訂單「大幅增加」。報導中並指出，醫療保健和教育等行業的小型企業也在購買配備DeepSeek模型和輝達H20晶片的AI伺服器，惟訂單規模細節尚未披露。

（本文由 MoneyDJ新聞授權轉載；首圖來源：shutterstock）

從這裡可透過《Google 新聞》追蹤 TechNews

科技新知，時時更新

想請我們喝幾杯咖啡？