DeepSeek 有助 AI 民主化？外媒：提升輝達 GPU 需求

DeepSeek 號稱能以極低成本訓練出效能媲美 OpenAI 聊天機器人「ChatGPT」的 AI 模型，對美國科技界投下震撼彈，並衝擊 AI 晶片龍頭輝達（Nvidia Corp.）股價跳水。然而，外媒分析，成本下降有助 AI 普及，反倒能提升輝達晶片需求。

MarketWatch專欄作家Jurica Dujmovic發文指出，無論是DeepSeek或其他大型語言模型（LLM）提供商，AI模型依舊需要繪圖處理器（GPU）及資料中心運作。事實上，更有效率的模型有望促進AI普及：當成本下降，企業就可將省下來的資金再投入，進一步提升AI能力。

誠然，這代表高階GPU銷售量可能下滑，但輝達可在更為廣大的AI消費者市場提升銷量、彌補損失。DeepSeek的突破性發展，有望讓輝達專為消費者設計的GPU需求大增。

DeepSeek效能媲美OpenAI先進模型「o1」的AI模型「R1」，以蒸餾（distillation）與量化（quantization）技術，能在消費者級電腦執行，暗示AI有望逐步民主化。隨著更具效率且開源的模型問世，過去曾是專有封閉市場的AI，如今有望跨入主流運算。

Dujmovic認為，輝達在這波轉換潮極具優勢，不但能擴充現有消費者AI業務，還能維持商用資料中心的領導地位。換言之，輝達在高效能資料中心商用晶片市場、以及個人AI消費者運算市場的地位，都有望同步提升。

何謂蒸餾？根據微軟（Microsoft）資深機器學習工程師Vishal Yadav、應用科學家Nikhil Pandey說法，「蒸餾是將大型預訓練模型（教師模型）知識轉移到較小模型（學生模型）的技術，能使學生模型達到與教師模型相當的效能。這項技術讓使用者能利用大型LLM優質輸出，以較小學生模型降低推理成本。」

英國金融時報1月29日報導，OpenAI透露發現「蒸餾」證據，懷疑是來自DeepSeek。雖然蒸餾在業界很常見，但DeepSeek或許藉此打造競爭模型，違反OpenAI服務條款。

（本文由 MoneyDJ新聞授權轉載；首圖來源：輝達）