OpenAI 技術長穆拉蒂(Mira Murati)接受《華爾街日報》專訪證實,文字轉成影片的 AI 新模型「Sora」將在今年稍晚提供大眾使用。
OpenAI 上個月首度展示 Sora 強大功能,透過簡短或詳細文字敘述,或是提供靜態圖片,Sora 就能產生具有多個角色、不同運鏡和背景細節的 1080p 影片,影片最長可達 60 秒。OpenAI 只向少數電影製作人員、視覺藝術家、設計師先行測試,這讓一些 Sora 生成影片在 X(前身為 Twitter)等社群平台曝光,成果品質令人驚豔。
OpenAI 不僅將向大眾提供這款新工具,更計劃整合影片音效,使影片場景逼真,不再是無聲電影。
由於 AI 工具還無法準確產生影像,OpenAI 允許用戶編輯 Sora 生成影片中的內容,「我們試圖弄清楚如何使用這項技術來做為人們編輯和創作的工具」,穆拉蒂告訴《華爾街日報》。
當被問及 OpenAI 使用哪些資料訓練 Sora 時,穆拉蒂並未正面回答,似乎迴避這個問題。「我不會詳細介紹它使用的數據,但是來自公開可用或獲得許可的數據」,她表示無法確定 Sora 是否有用 YouTube、Facebook、Instagram 的影片,僅證實 Sora 有用來自 Shutterstock 圖庫的內容,是因 OpenAI 與該公司有合作關係。
穆拉蒂還告訴《華爾街日報》,運算 Sora 所消耗的電力相當昂貴,OpenAI 試圖讓這款新工具能有類似 DALL·E 的成本結構,再提供大眾使用。
年末迎來美國總統大選,世界各地也有多場選舉將舉行,人們加深對生成式 AI 工具產生錯誤資訊的擔憂。對此穆拉蒂指出,Sora 上線後可能無法製作公眾人物影像,與 DALL·E 的政策類似,且 Sora 生成影片會有浮水印,與真實拍攝影片有所區分。
(Source:Mira Murati)
(首圖來源:OpenAI)