ChatGPT 變身強大語音助理,OpenAI 新模型 GPT-4o 突顯對話能力

作者 | 發布日期 2024 年 05 月 14 日 2:59 | 分類 AI 人工智慧 line share Linkedin share follow us in feedly line share
ChatGPT 變身強大語音助理,OpenAI 新模型 GPT-4o 突顯對話能力


不到半小時的 OpenAI 發表會,由技術長穆拉蒂(Mira Murati)揭曉 ChatGPT 三項更新:旗艦新模型「GPT-4o」、適用於 Mac 電腦的桌面版 App、一般用戶可以免費造訪 GPT Store。

GPT-4o 具 GPT-4 等級的智慧,同時改進 GPT-4 在文字、圖像及音訊方面的能力。GPT-4o 可接受文字、圖像、音訊的任意輸入組合,即時產生文字、音訊、圖像的任意輸出組合,大大改善 ChatGPT 體驗,尤其與 ChatGPT 對話更像真人交談。

發表會現場示範時,支援 GPT-4o 的 ChatGPT 還會模仿機器人語氣說話,甚至高歌一曲。

▲ 與支援 GPT-4o 的 ChatGPT 對話。

OpenAI 稱 GPT-4o 可在短短 232 毫秒的時間內回應人們輸入的語音資料,平均需要 320 毫秒,這接近人們對話的反應時間。GPT-4o 在英語文字和編輯程式碼的表現媲美 GPT-4 Turbo,非英語文字的性能也有所提升,同時 API 的回應速度更快,成本只需一半。

OpenAI 橫跨文字、圖像、音訊資料端到端訓練出這款新模型,意味著所有輸入和輸出都由同一神經網路處理。

GPT-4o 文字和圖像功能今日起支援 ChatGPT,一般用戶可免費使用,未來幾週內將為 ChatGPT Plus 用戶推出具新版語音模式的 GPT-4o alpha 版。

已有手機版 App 的 ChatGPT,如今增添桌面版 App,優先適用於 Mac 電腦,至於 Windows 電腦的版本今年稍晚推出。桌面版連同網頁版一起調整 UI,包含更具對話性的主畫面和訊息輸入設計。此外,一般用戶也能免費造訪 GPT Store,不再限於付費用戶。

GPT-4o 是 OpenAI 突破深度學習界限的最新成果,這次 OpenAI 朝著實用方向開發。GPT-4o 字尾的 o 代表拉丁文「omni」,有「全能」之意,也意指 GPT-4o 的多模態,這使 ChatGPT 邁向更自然的人機互動。

(首圖來源:影片截圖)

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》