OpenAI 一直努力確保足夠的運算基礎設施來運行並訓練生成式模型。路透社引述消息,OpenAI 數月一直與博通(Broadcom)合作開發執行模型的 AI 晶片,最快 2026 年推出,但算力不足卻成為無法如期推出產品的主因,OpenAI 執行長阿特曼(Sam Altman)1 日於 Reddit 論壇 AWA 活動坦承不諱。
AWA 活動,面對「OpenAI 下代 AI 模型為何花這麼長時間」提問,阿特曼回答,所有模型的複雜度極高,算力如何分配給許多絕佳想法,遇到許多限制和艱難決策。
4 月 OpenAI 首度展示 ChatGPT 視覺功能,執行 ChatGPT 智慧手機,可回應鏡頭看到的視覺線索,如某人穿的衣服。但基於某些因素(算力不足是主因),此功能近期無法推出。
《財富》(Fortune)雜誌報導透露,活動其實是為了搶在同週舉行 Google I/O 開發者大會前先吸引眾人注意。OpenAI 許多人認為 GPT-4o 並未準備好,「進階語音模式」(Advanced Voice Mode)的純語音版也延後數月才推出。
阿特曼表示,OpenAI 下代圖片生成器 DALL-E 尚無公開計畫。換言之,模型沒有確切時間表。影片生成工具 Sora 也受「需要完善模型,做好安全/模仿及其他事,並擴展算力」阻礙而遲遲未出。再度遇上算力不足問題。
Sora 因種種技術障礙無法有效應付 Luma、Runway 等競爭對手的挑戰。《The Information》甚至指出,2 月亮相的 Sora 初始版系統光產生 1 分鐘影片竟然要耗時超過 10 分,雪上加霜的是,Sora 共同負責人之一 Tim Brooks 竟在 10 月離職並跳槽到 Google。
AMA 活動後半場,阿特曼提到 OpenAI 仍在考慮未來允許 ChatGPT 出現「NSFW」(Not Safe For Work,工作場所不宜)內容,目前首要任務是改進 o1 系列「推理」模型及後續版本。他說今年稍晚會有非常棒的產品發表,「但不包括 GPT-5」。
(首圖來源:shutterstock)