傳 DeepSeek 擬提早推出 R2 人工智慧模型

作者 | 發布日期 2025 年 02 月 26 日 9:20 | 分類 AI 人工智慧 , 新創 line share Linkedin share follow us in feedly line share
傳 DeepSeek 擬提早推出 R2 人工智慧模型

綜合港媒報導,據路透社引述消息人士透露,中國人工智慧(AI)新創公司 DeepSeek(深度求索)正加速推出 R1 模型的後續版本,其原計劃於今年 5 月初發布 R2,但現在希望能盡早推出,具體時間則未透露。

DeepSeek本週啟動「開源週」,週一開源代碼庫為FlashMLA, 針對Hopper GPU優化的高效MLA解碼內核,專為處理可變長度序列而設計;25日開源DeepEP,為首個專用於MoE模型訓練和推理設計的EP通信庫。

在此之前,據路透社報導指出,根據六名知情人士表示,由於對DeepSeek低成本人工智慧模型的需求激增,中國企業正在增加輝達H20人工智慧晶片的訂單。H20是輝達為中國市場定製的人工智慧晶片。

其中兩位知情人士表示,自DeepSeek於1月進入全球公眾視野以來,騰訊、阿里巴巴和字節跳動對H20的訂單「大幅增加」。報導中並指出,醫療保健和教育等行業的小型企業也在購買配備DeepSeek模型和輝達H20晶片的AI伺服器,惟訂單規模細節尚未披露。

(本文由 MoneyDJ新聞 授權轉載;首圖來源:shutterstock)

延伸閱讀:

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》