
台積電昨(16 日)舉辦第三季法說會,從法人提問來看,最關注的除了公司業務外,還有 AI 泡沫是否破裂,目前董事長魏哲家持正向看法,但似乎無法緩解市場對於 AI 泡沫的擔憂。
外媒《金融時報》(FT)指出,AI 設備有個奇妙的跡象,那就是 GPU 買起來很貴,但租用卻很便宜。例如,NVIDIA B200 於 2024 年底剛推出時,單顆要價 50 多萬美元,但到 2025 年初時,每小時租金卻只要 3.20 美元,上個月最低租金更是跌到每小時 2.80 美元。
由於 NVIDIA 每兩年就會升級一次晶片架構,資金最雄厚的資料中心業者能以超低價格出租「非最新世代」的晶片,藉此綁定客戶。
不過,雖然 GPU 租金的穩定下滑是常見的「削價競爭」狀況,但報導認為實情更複雜。
從 RBC Capital Markets 收集的價格數據來看,NVIDIA H200 和 H100 晶片今年的每小時租金分別下跌 29% 與 22%,但在四大雲端巨頭間(此指亞馬遜、微軟、Google 和甲骨文)價格並無太大變動,使得小型業者和超大規模雲端服務業者的價格差距不斷擴大。
整體 GPU 租金之所以下跌,很大部分在於新進業者,這與現實的價格戰不同。一般來說,價格戰大都是大企業以量大進而價廉,迫使小公司跟進削價競爭。
報導推測,這可能與使用 GPU 的用戶型態有關。第一種是 AI 新創或研究機構,他們要在短期內進行大量模型訓練,因此需要龐大算力,這些公司或機構本就是雲端巨頭的既有用戶,因此更習慣使用同一平台,即使價格較高也願意買單。
第二種是想建立網站聊天機器人、摘要工具或類似 AI 小工具的一般公司,他們過去可能選擇在雲端租用 GPU,但隨著相關技術逐漸到位,這些公司可能會直接使用 OpenAI、Anthropic 等現成的大型語言模型來打造聊天機器人,並採取「按字元」(token)付費的方式,而不是按小時計費。
最後一種是客戶都被吸走、還留在市場上會租用 GPU 的人,這可能是經費較拮据的學者、想做金融模型的投資團隊等業餘玩家或者小團隊。報導稱,面對絕大部分客戶層都被大公司吸走,只能不斷下殺價格來吸引剩餘的用戶。
再從現有價格來看,一台入門級 NVIDIA DGX A100 叢集(含八顆 GPU),在 2020 年上市時售價約 19.9 萬美元。假設晶片使用壽命約五年、全年不間斷運作,每顆 GPU 至少要創造每小時約 4 美元收入才能收支平衡。
但到 2020 年時,A100 平均租金為每小時 2.40 美元,現在更降至每小時 1.65 美元;相比之下,超大雲端業者仍以每小時 4 美元以上價格出租,部分小型競爭者則低至每小時 0.40 美元。雖然這當中忽略很多重要因素,但仍能判斷目前定價是否合理。
最後報導認為,由此可推論,在疫情時購買的 NVIDIA GPU 可能還沒回本,就拿去二手市場;客戶即使受到低價吸引,也缺乏能力支付更高費用;超大雲端業者選擇靜觀,等待低價市場競爭者自己破產出局;預期資料中心整併潮即將到來,將淘汰大量無法負擔真實運算成本的 AI 新創;如果一般企業只想讓 OpenAI 或 Anthropic 幫忙打造聊天機器人、摘要工具,實際價值可能不到 3 兆美元,那 GPU 市場的規模可能是被高估的。
(首圖來源:Unsplash)