不到半小時的 OpenAI 發表會,由技術長穆拉蒂(Mira Murati)揭曉 ChatGPT 三項更新:旗艦新模型「GPT-4o」、適用於 Mac 電腦的桌面版 App、一般用戶可以免費造訪 GPT Store。
GPT-4o 具 GPT-4 等級的智慧,同時改進 GPT-4 在文字、圖像及音訊方面的能力。GPT-4o 可接受文字、圖像、音訊的任意輸入組合,即時產生文字、音訊、圖像的任意輸出組合,大大改善 ChatGPT 體驗,尤其與 ChatGPT 對話更像真人交談。
發表會現場示範時,支援 GPT-4o 的 ChatGPT 還會模仿機器人語氣說話,甚至高歌一曲。
▲ 與支援 GPT-4o 的 ChatGPT 對話。
OpenAI 稱 GPT-4o 可在短短 232 毫秒的時間內回應人們輸入的語音資料,平均需要 320 毫秒,這接近人們對話的反應時間。GPT-4o 在英語文字和編輯程式碼的表現媲美 GPT-4 Turbo,非英語文字的性能也有所提升,同時 API 的回應速度更快,成本只需一半。
OpenAI 橫跨文字、圖像、音訊資料端到端訓練出這款新模型,意味著所有輸入和輸出都由同一神經網路處理。
GPT-4o 文字和圖像功能今日起支援 ChatGPT,一般用戶可免費使用,未來幾週內將為 ChatGPT Plus 用戶推出具新版語音模式的 GPT-4o alpha 版。
已有手機版 App 的 ChatGPT,如今增添桌面版 App,優先適用於 Mac 電腦,至於 Windows 電腦的版本今年稍晚推出。桌面版連同網頁版一起調整 UI,包含更具對話性的主畫面和訊息輸入設計。此外,一般用戶也能免費造訪 GPT Store,不再限於付費用戶。
GPT-4o 是 OpenAI 突破深度學習界限的最新成果,這次 OpenAI 朝著實用方向開發。GPT-4o 字尾的 o 代表拉丁文「omni」,有「全能」之意,也意指 GPT-4o 的多模態,這使 ChatGPT 邁向更自然的人機互動。
(首圖來源:影片截圖)