影片生成模型 Sora 今年內上線,加上音效影片更逼真

作者 | 發布日期 2024 年 03 月 14 日 8:55 | 分類 AI 人工智慧 , 數位內容 line share follow us in feedly line share
影片生成模型 Sora 今年內上線,加上音效影片更逼真


OpenAI 技術長穆拉蒂(Mira Murati)接受《華爾街日報》專訪證實,文字轉成影片的 AI 新模型「Sora」將在今年稍晚提供大眾使用。

OpenAI 上個月首度展示 Sora 強大功能,透過簡短或詳細文字敘述,或是提供靜態圖片,Sora 就能產生具有多個角色、不同運鏡和背景細節的 1080p 影片,影片最長可達 60 秒。OpenAI 只向少數電影製作人員、視覺藝術家、設計師先行測試,這讓一些 Sora 生成影片在 X(前身為 Twitter)等社群平台曝光,成果品質令人驚豔。

OpenAI 不僅將向大眾提供這款新工具,更計劃整合影片音效,使影片場景逼真,不再是無聲電影。

由於 AI 工具還無法準確產生影像,OpenAI 允許用戶編輯 Sora 生成影片中的內容,「我們試圖弄清楚如何使用這項技術來做為人們編輯和創作的工具」,穆拉蒂告訴《華爾街日報》。

當被問及 OpenAI 使用哪些資料訓練 Sora 時,穆拉蒂並未正面回答,似乎迴避這個問題。「我不會詳細介紹它使用的數據,但是來自公開可用或獲得許可的數據」,她表示無法確定 Sora 是否有用 YouTube、Facebook、Instagram 的影片,僅證實 Sora 有用來自 Shutterstock 圖庫的內容,是因 OpenAI 與該公司有合作關係。

穆拉蒂還告訴《華爾街日報》,運算 Sora 所消耗的電力相當昂貴,OpenAI 試圖讓這款新工具能有類似 DALL·E 的成本結構,再提供大眾使用。

年末迎來美國總統大選,世界各地也有多場選舉將舉行,人們加深對生成式 AI 工具產生錯誤資訊的擔憂。對此穆拉蒂指出,Sora 上線後可能無法製作公眾人物影像,與 DALL·E 的政策類似,且 Sora 生成影片會有浮水印,與真實拍攝影片有所區分。

(Source:Mira Murati

(首圖來源:OpenAI