知情人士透露,中國 AI 新創公司 DeepSeek 去年以低成本模型震撼全球,但在推出重大更新前,卻未依照業界慣例,向美國晶片商展示即將發布的旗艦模型以進行效能最佳化。
消息人士指出,深度求索(DeepSeek)預計將推出下一次重大更新版本V4,但僅向包括華為技術公司(Huawei Technologies)在內的中國本土供應商提供了搶先使用權。
人工智慧(AI)開發商通常會在模型正式發布前,將主要模型的預發布版本分享給輝達(Nvidia)與超微(Advanced Micro Devices)等主要晶片製造商,以確保其軟體能在廣泛使用的硬體上高效運行。DeepSeek過去也曾與輝達的技術團隊密切合作。
未向輝達與超微提供
消息人士表示,這款原本預計於農曆新年前後發布的新模型,DeepSeek並未向輝達與超微提供測試權限,反而讓包括華為在內的中國晶片製造商提前數週著手為其處理器進行軟體最佳化。
輝達與超微拒絕發表評論,DeepSeek與華為則未回覆記者詢問。
《路透社》目前無法確認此項決定的原因。
加州的創意策略公司(Creative Strategies)分析師巴荷林(Ben Bajarin)表示:「對輝達與超微在通用資料加速器方面的影響有限——多數企業並未實際運行DeepSeek,它更多只是作為基準測試模型存在。」他補充說,新一代AI程式編寫工具已將軟體適配硬體所需時間「從數月縮短至數週」。
巴荷林表示,此舉可能是中國政府更廣泛戰略的一部分,「試圖讓美國硬體與模型在中國處於不利地位」。
此事發生之際,川普政府高官告訴《路透社》,DeepSeek最新AI模型是在中國使用輝達最先進的Blackwell晶片組叢集進行訓練,此舉似乎違反美國出口管制規定。
2025年1月崛起以來,DeepSeek的模型在開源平台Hugging Face的下載次數已超過7500萬次,並帶動中國開源模型浪潮,與美國AI實驗室展開競爭。在過去一年發布的模型中,中國模型的下載量已超過該平台上其他任何國家。
(譯者:鄭詩韻;首圖來源:shutterstock)






