
綜合港媒報導,據路透社引述消息人士透露,中國人工智慧(AI)新創公司 DeepSeek(深度求索)正加速推出 R1 模型的後續版本,其原計劃於今年 5 月初發布 R2,但現在希望能盡早推出,具體時間則未透露。
DeepSeek本週啟動「開源週」,週一開源代碼庫為FlashMLA, 針對Hopper GPU優化的高效MLA解碼內核,專為處理可變長度序列而設計;25日開源DeepEP,為首個專用於MoE模型訓練和推理設計的EP通信庫。
在此之前,據路透社報導指出,根據六名知情人士表示,由於對DeepSeek低成本人工智慧模型的需求激增,中國企業正在增加輝達H20人工智慧晶片的訂單。H20是輝達為中國市場定製的人工智慧晶片。
其中兩位知情人士表示,自DeepSeek於1月進入全球公眾視野以來,騰訊、阿里巴巴和字節跳動對H20的訂單「大幅增加」。報導中並指出,醫療保健和教育等行業的小型企業也在購買配備DeepSeek模型和輝達H20晶片的AI伺服器,惟訂單規模細節尚未披露。
(本文由 MoneyDJ新聞 授權轉載;首圖來源:shutterstock)