OpenAI 開始向少部分 ChatGPT Plus 用戶推出進階語音模式(Voice Mode),將能提供更自然、更即時的語音對話,這樣的 AI 助理還能感受和回應用戶情緒。
自從發表 GPT-4o 模型同時展示進階語音模式以來,OpenAI 持續強化語音對話安全性和品質。OpenAI 計劃今年秋季讓所有 ChatGPT Plus 用戶都能存取語音模式 Alpha 測試版本,另外視訊和螢幕共享功能預計今年稍晚推出,尚未確認釋出日期。
OpenAI 已與 100 多名外部成員,針對由 GPT-4o 支援的 ChatGPT 語音功能進行紅隊演練,涉及多達 45 種語言。為了保護用戶隱私,OpenAI 訓練的模型只提供 4 種預設聲音,並建立特殊系統阻止與預設聲音不同的語音輸出,OpenAI 也提出防護措施阻止暴力或受版權保護內容的語音請求。
「透過逐步推出,我們可以密切監控使用情況,並根據現實世界的意見回饋不斷改進模型功能和安全性」,OpenAI 表示。
We’re starting to roll out advanced Voice Mode to a small group of ChatGPT Plus users. Advanced Voice Mode offers more natural, real-time conversations, allows you to interrupt anytime, and senses and responds to your emotions. pic.twitter.com/64O94EhhXK
— OpenAI (@OpenAI) July 30, 2024
▲ OpenAI 開始向少部分 ChatGPT Plus 用戶推出進階語音模式。
在 GPT-4o 支援下,ChatGPT 語音功能顯現 AI 對話互動的巨大潛力。不過日前受到好萊塢女星史嘉蕾喬韓森(Scarlett Johansson)抗議,OpenAI 撤下有爭議的 Sky 聲音,可能因此影響原定計畫進度,趕在 7 月底展開測試。
this is a cool one!
we will improve the feature quickly. https://t.co/8TYnQ1VXKw
— Sam Altman (@sama) August 1, 2024
▲ OpenAI 執行長分享很有趣的語音模式測試,從 1 數到 50 竟然會像人類一樣停下來喘口氣。
(首圖來源:pixabay)