AI 晶片商 Cerebras:企業客戶 DeepSeek 需求暴增

作者 | 發布日期 2025 年 02 月 03 日 16:30 | 分類 AI 人工智慧 , 晶片 , 處理器 line share Linkedin share follow us in feedly line share
AI 晶片商 Cerebras:企業客戶 DeepSeek 需求暴增

AI 晶片新創商 Cerebras 開始在美國伺服器提供中國 AI 新創 DeepSeek 服務,並稱企業客戶對 DeepSeek 需求暴增。

Fortune 1月31日報導,Cerebras製造超大晶片、擅長快速AI推論任務,而非AI模型訓練。宣稱旗下硬體執行700億個參數DeepSeek「R1」中型模型的速度,比最快GPU高57倍。

Cerebras執行長Andrew Feldman受訪時表示,企業客戶對DeepSeek極為熱情。DeepSeek的AI模型因號稱能以極低成本訓練應用,效能媲美OpenAI等對手的「推理」模型,對市場頗具破壞性。他說DeepSeek釋出R1十天後,「我們迎接暴增需求。」

為示範Cerebras伺服器DeepSeek執行速度,Feldman現場指示模型以Python語言撰寫西洋棋遊戲,只花1.5秒便完成,OpenAI「o1-mini」推理模型卻要花22秒才能用傳統GPU完成相同任務。但因OpenAI模型屬封閉系統,無法直接在Cerebras硬體測試,故難完全等效比較。

Feldman強調,數學與程式任務,DeepSeek表現較o1優異。對某種類型任務,「你能更快獲得精確答案。」

然而,DeepSeek也有嚴重安全隱憂及偏見問題。從DeepSeek官方App或網路介面使用R1時,北京當局視為敏感的議題會自我審查,DeepSeek也證明有漏洞易操縱,有心人士可利用模型產生炸彈製作指南等內容。美國海軍已禁止職員使用。

Feldman表示,DeepSeek是全世界最受歡迎app,若直接使用,資料勢必會被傳回中國。他要大家「別這麼做」,建議選擇美國企業託管的大型語言模型(LLM),例如Cerebras、Perplexity等業者。

雖然Feldman坦言DeepSeek確實有些問題,但使用者只需保持基本判斷力即可。他比喻「當你用電鋸時,應穿戴鋼頭靴和護目鏡。但不代表不應用電鋸,而是要謹慎使用。」

DeepSeek宣稱的成本優勢也有爭議。號稱旗下效能媲美OpenAI聊天機器人「ChatGPT」的AI模型「V3」,訓練硬體費用只有557.6萬美元、僅2,048顆輝達(Nvidia)「H800」繪圖處理器(GPU),成本遠低於美國科技巨擘,引起全球嘩然。晶片顧問機構Semianalysis最新分析卻發現,DeepSeek硬體支出其實「遠超過5億美元」。

(本文由 MoneyDJ新聞 授權轉載;首圖來源:Cerebras)

延伸閱讀:

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》