OpenAI 發表開放權重模型 gpt-oss,效能堪比 o4-mini、可離線運行

作者 | 發布日期 2025 年 08 月 06 日 11:39 | 分類 AI 人工智慧 , ChatGPT , OpenAI line share Linkedin share follow us in feedly line share
Loading...
OpenAI 發表開放權重模型 gpt-oss,效能堪比 o4-mini、可離線運行

OpenAI 終於推出自 GPT-2 以來首款開放權重推理模型,包括 gpt-oss-120b、gpt-oss-20b 兩種版本,擁有堪比 o4-mini 的強大性能,可在裝置端上運行,能對特定用途進行微調。對 OpenAI 而言,代表發展策略除專有模型外,也嘗試開放模型這一條路,以應對 DeepSeek 等對手所帶來的競爭壓力。

gpt-oss-120b、gpt-oss-20b 皆採 OpenAI 去年秋季 o1 模型中的 CoT(Chain of Thought)推理方式,讓生成式 AI 工具透過多步驟處理來回答提問,而非直接提供答案。

兩款 gpt-oss 僅支援文字,而非多模態,但能瀏覽網頁、呼叫雲端模型協助特定任務、執行程式碼,並能做為 AI 代理操作軟體。此外,兩款皆採 Apache 2.0 授權,是開放權重模型的常見選項,可用於商業用途,或納入其他授權軟體中。

gpt-oss-120b 在核心推理基準測試中的表現與 o4-mini 幾乎持平,只要單一 80GB GPU 就能高效運行。參數量較小的 gpt-oss-20b 基準測試結果與 o3-mini 相似,甚至可在至少 16GB 記憶體的裝置執行,無需昂貴的運算基礎設施。

NVIDIA 表示,gpt-oss 可在 NVIDIA GeForce RTX 和 RTX PRO GPU 運行,如 AWS、微軟 Azure 也提供 gpt-oss 給客戶選用。

▲ 奧特曼認為 gpt-oss 的發表意義非凡。

「我們很高興能將這款耗費數十億美元研發的模型提供給全球用戶,讓更多人能接觸到 AI」,OpenAI 執行長奧特曼(Sam Altman)表示,gpt-oss-120b 與 gpt-oss-20b 已經上傳至開源機器學習社群平台 Hugging Face,提供免費下載。而 OpenAI 上一次釋出開放權重模型,是 2019 年發表的 GPT-2。

開放權重模型獨特之處,在於「權重」對外公開,任何人都能檢視內部參數,了解模型如何處理資訊。「開放權重模型具備截然不同優勢」,OpenAI 總裁布洛克曼(Greg Brockman)認為,並非要以免費選項取代專有模型,而是與現有付費模型互補。

這批開放權重模型原訂今年 3 月公開,為了進一步安全測試不得不延後。實際上,開放權重模型比封閉模型風險更高,任何人都能取得並微調以達到特定用途,在安全上需要更多考量。

來自中國的 DeepSeek 以其低成本運行的開放權重模型震撼 AI 市場,為業界帶來更多競爭壓力,美國也有 Meta 的 Llama 作為開放代表。雖然 OpenAI 發表 gpt-oss 未直接提及 DeepSeek 或任何 AI 公司,但奧特曼明確表示,期望美國成為開放權重模型的創新重鎮,「OpenAI 的使命是確保通用人工智慧造福全人類」,期待全球都能在基於民主價值、由美國打造且免費開放的 AI 技術上共同創新,共享利益。

(首圖來源:shutterstock)

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》