DeepSeek 有助 AI 民主化?外媒:提升輝達 GPU 需求

作者 | 發布日期 2025 年 02 月 03 日 12:10 | 分類 AI 人工智慧 , GPU line share Linkedin share follow us in feedly line share
DeepSeek 有助 AI 民主化?外媒:提升輝達 GPU 需求

DeepSeek 號稱能以極低成本訓練出效能媲美 OpenAI 聊天機器人「ChatGPT」的 AI 模型,對美國科技界投下震撼彈,並衝擊 AI 晶片龍頭輝達(Nvidia Corp.)股價跳水。然而,外媒分析,成本下降有助 AI 普及,反倒能提升輝達晶片需求。

MarketWatch專欄作家Jurica Dujmovic發文指出,無論是DeepSeek或其他大型語言模型(LLM)提供商,AI模型依舊需要繪圖處理器(GPU)及資料中心運作。事實上,更有效率的模型有望促進AI普及:當成本下降,企業就可將省下來的資金再投入,進一步提升AI能力。

誠然,這代表高階GPU銷售量可能下滑,但輝達可在更為廣大的AI消費者市場提升銷量、彌補損失。DeepSeek的突破性發展,有望讓輝達專為消費者設計的GPU需求大增。

DeepSeek效能媲美OpenAI先進模型「o1」的AI模型「R1」,以蒸餾(distillation)與量化(quantization)技術,能在消費者級電腦執行,暗示AI有望逐步民主化。隨著更具效率且開源的模型問世,過去曾是專有封閉市場的AI,如今有望跨入主流運算。

Dujmovic認為,輝達在這波轉換潮極具優勢,不但能擴充現有消費者AI業務,還能維持商用資料中心的領導地位。換言之,輝達在高效能資料中心商用晶片市場、以及個人AI消費者運算市場的地位,都有望同步提升。

何謂蒸餾?根據微軟(Microsoft)資深機器學習工程師Vishal Yadav、應用科學家Nikhil Pandey說法,「蒸餾是將大型預訓練模型(教師模型)知識轉移到較小模型(學生模型)的技術,能使學生模型達到與教師模型相當的效能。這項技術讓使用者能利用大型LLM優質輸出,以較小學生模型降低推理成本。」

英國金融時報1月29日報導,OpenAI透露發現「蒸餾」證據,懷疑是來自DeepSeek。雖然蒸餾在業界很常見,但DeepSeek或許藉此打造競爭模型,違反OpenAI服務條款。

(本文由 MoneyDJ新聞 授權轉載;首圖來源:輝達

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》