為期 12 個工作天的「12 Days of OpenAI」來到第 9 天,主題與 AI 開發者切身相關。
OpenAI 將強化推理的 o1 模型引進 API,取代 API 中已有的 o1-preview 版本。從 17 日開始,o1 將向使用等級第五級(Tier 5)的開發者推出。如要獲得第五級資格,開發者必須在 OpenAI 花費至少 1,000 美元,且帳戶距首次成功付款超過 30 天。
OpenAI 在官網說明提到,最新的 o1 應能提供「更全面、更準確的回應」,特別是有關程式設計的問題,而且不太可能拒絕提問請求。與大多數 AI 不同的是,像 o1 這樣的推理模型能夠自身進行事實查核,避免一些容易使模型出錯的陷阱,缺點則是模型需要較長的時間才能回應。
OpenAI API 中的 O1 比 o1-preview 自訂性更高,歸功於函式呼叫(允許模型連接外部資料)、結構化輸出、開發者訊息(允許開發者指導模型的語氣和風格)、視覺能力、更低延遲等功能。o1 還有一個「reasoning_effort」API 參數,可控制模型在回應問題之前所思考的時間。
不過,使用這部分 API 的成本不便宜,一部分原因是模型需要大量運算資源才能運作。OpenAI 表示,o1 每次分析 75 萬字內收費 15 美元,每次產生 75 萬字內收費 60 美元,o1 這部分的成本是 GPT-4o 的 6 倍。
OpenAI 也宣布 GPT-4o 和 GPT-4o mini 模型的新版本,可做為 Realtime API 的一部分,使開發者能在有關語音的應用程式建立低延遲、多模態的體驗,OpenAI 也對 Realtime API 引進 WebRTC 的支援。
Sora API
影像生成模型 Sora 釋出引發市場高度矚目,在 OpenAI 開發團隊所舉行的 AMA(Ask Me Anything)活動,「我們還沒有 Sora API 的計畫」,OpenAI 開發體驗的負責人 Romain Huet 表示,但未說明具體原因。
由於 Sora 釋出後流量超出預期,OpenAI 不久後被迫關閉 Sora 驅動的影像創作和編輯應用程式,因此暫時無法進一步考慮 Sora API。
值得一提的是,競爭對手 Google 升級推出第二代影像生成模型 Veo 2,對現實世界的物理原理以及人類動作和表情的細微差異有更深入的理解,甚至在文字提示寫道「18mm 鏡頭」、「淺景深」等,模型就能依照指令產生相應的畫面,同樣受到市場關注。
- OpenAI brings its o1 reasoning model to its API — for certain developers
- OpenAI says it has no plans for a Sora API — yet
(首圖來源:OpenAI)