
中國新創 Z.ai(前稱智譜)28 日宣布推出 AI 模型 GLM-4.5,稱成本比 DeepSeek 更低,基於「代理式」AI 技術構建,能自動將複雜任務分解為子任務以提高準確性,與傳統同時處理所有資料不同。
定價方面,GLM-4.5 每百萬輸入 token 收費 11 美分,略低於 DeepSeek-R1 的 14 美分;但輸出 token 每百萬僅收費 28 美分,遠低於 DeepSeek 的 2.19 美元,降幅達 87%。GLM-4.5 規模約 DeepSeek 一半,3,550 億參數但僅會觸發 320 億,運作時只需八顆 Nvidia H20。
Z.ai 行政總裁張鵬表示,H20 是 Nvidia 為符合美國出口管制的中國市場客製化晶片。目前運算能力充足,毋須購買更多晶片,但拒絕透露模型訓練成本,細節稍後才公開。
模型以多階段工作流程訓練,首先使用 15 兆 token 資料庫開發初版,之後共超過 7 兆 token 較小訓練資料庫提升推理力。Z.ai 以 12 項熱門 AI 基準測試評估模型,稱 GLM-4.5 整體排名列第三,僅次 xAI Grok 4 和 OpenAI o3,勝過 Claude 4 Opus 等多款熱門產品。
Z.ai 亦有精簡版 GLM-4.5-Air,1,060 億參數,專為注重成本效益客戶設計。此外還有免費版 GLM-4.5-Flash,專為編程、推理和其他代理任務而建。模型可從 Z.ai 平台、API 和 Hugging Face 開放權重導入。
1 月 DeepSeek 稱 V3 模型訓練成本不到 600 萬美元,讓全球投資者震驚,但分析師指其長期硬體投資超過 5 億美元。稍早時阿里巴巴旗下 Moonshot 發表 Kimi K2 模型,也稱一些編程方面勝過 OpenAI ChatGPT 和 Anthropic Claude。
OpenAI 於 6 月底警告中國 AI 進展時特別提及智譜,美國也將之列入限制美國公司與其往來的實體清單。Z.ai 成立於 2019 年,計劃大中華區首次公開招股,從阿里巴巴、騰訊、啟明創投等投資者籌得逾 15 億美元資金。