影片生成模型 Sora 今年內上線，加上音效影片更逼真

OpenAI 技術長穆拉蒂（Mira Murati）接受《華爾街日報》專訪證實，文字轉成影片的 AI 新模型「Sora」將在今年稍晚提供大眾使用。

OpenAI 上個月首度展示 Sora 強大功能，透過簡短或詳細文字敘述，或是提供靜態圖片，Sora 就能產生具有多個角色、不同運鏡和背景細節的 1080p 影片，影片最長可達 60 秒。OpenAI 只向少數電影製作人員、視覺藝術家、設計師先行測試，這讓一些 Sora 生成影片在 X（前身為 Twitter）等社群平台曝光，成果品質令人驚豔。

OpenAI 不僅將向大眾提供這款新工具，更計劃整合影片音效，使影片場景逼真，不再是無聲電影。

由於 AI 工具還無法準確產生影像，OpenAI 允許用戶編輯 Sora 生成影片中的內容，「我們試圖弄清楚如何使用這項技術來做為人們編輯和創作的工具」，穆拉蒂告訴《華爾街日報》。

當被問及 OpenAI 使用哪些資料訓練 Sora 時，穆拉蒂並未正面回答，似乎迴避這個問題。「我不會詳細介紹它使用的數據，但是來自公開可用或獲得許可的數據」，她表示無法確定 Sora 是否有用 YouTube、Facebook、Instagram 的影片，僅證實 Sora 有用來自 Shutterstock 圖庫的內容，是因 OpenAI 與該公司有合作關係。

穆拉蒂還告訴《華爾街日報》，運算 Sora 所消耗的電力相當昂貴，OpenAI 試圖讓這款新工具能有類似 DALL·E 的成本結構，再提供大眾使用。

年末迎來美國總統大選，世界各地也有多場選舉將舉行，人們加深對生成式 AI 工具產生錯誤資訊的擔憂。對此穆拉蒂指出，Sora 上線後可能無法製作公眾人物影像，與 DALL·E 的政策類似，且 Sora 生成影片會有浮水印，與真實拍攝影片有所區分。