
OpenAI 16 日推出程式設計 AI 代理工具「Codex」的研究預覽版本。
Codex 由 codex-1 模型驅動,是以 o3 推理模型為軟體工程所微調的版本。OpenAI 表示,與 o3 相比,codex-1 產生的程式碼比較乾淨,更能精確遵循提示指令,且能自行執行測試,直到通過測試為止。
Codex 是在受到沙盒保護的雲端虛擬電腦運行,與 GitHub 連接後,Codex 的工作環境能夠預先載入 GitHub 儲存庫。OpenAI 表示,這款 AI 編碼代理工具可在 1~30 分鐘內完成如簡單功能、修復錯誤、執行測試及回答程式碼庫相關問題等任務,並能同時處理多項軟體工程任務。
即日起 OpenAI 開始向 ChatGPT Pro / Team / Enterprise 用戶提供 Codex。OpenAI 表示,使用者初期將能自由存取,但未來數週內,OpenAI 將對這項 AI 編碼代理工具施加速度限制,使用者可選擇購買額外點數來繼續使用 Codex,OpenAI 計劃不久後也將 Codex 擴展至 ChatGPT Plus / Edu 用戶。
獲得 Codex 資格的使用者可在 ChatGPT 側邊欄找到這項工具,輸入提示指令並點擊「Code」按鈕就能指派編碼任務。
此外,OpenAI 也為先前推出的開源編碼代理程式 Codex CLI 做出更新,預設採用最新 o4-mini 模型,透過 OpenAI API 以每百萬個輸入詞元(token)收費 1.5 美元、每百萬輸出詞元收費 6 美元的價格提供服務。
▲ OpenAI 發表 AI 編碼代理工具 Codex。
近年來,瞄準軟體工程師需求的 AI 工具大受歡迎。Google 和微軟的執行長皆稱,約有 30% 程式碼由 AI 代勞產出。今年 2 月,Anthropic 推出自研編碼代理工具 Claude Code。到了 4 月,Google 為其 Gemini Code Assist 增加更多 AI 編碼代理能力。
這種透過自然語言方式向 AI 描述需求並生成程式碼的 Vibe Coding 熱潮,使 AI 編碼平台背後的所屬公司迅速成長,像是 Cursor 在 4 月達成近 3 億美元的年化收入,根據外媒報導計劃以 90 億美元估值進行新一輪募資。而 OpenAI 也有意布局,傳以 30 億美元收購另一家熱門 AI 編碼平台 Windsurf。Codex 的推出意味著,OpenAI 正在建構自有的 AI 編碼工具。
值得注意的是,現今 AI 編碼代理工具仍然容易出錯。微軟最近一項研究發現,用於程式設計的模型(如 Claude 3.7 Sonnet 和 o3-mini)在軟體偵錯方面表現不佳。然而,這似乎未減少投資人對這些工具以及背後團隊的興趣。
- OpenAI introduces Codex, its first full-fledged AI agent for coding
- OpenAI launches Codex, an AI coding agent, in ChatGPT
- OpenAI launches research preview of Codex AI software engineering agent for developers — with parallel tasking
(首圖來源:OpenAI)