Google 推出影片生成模型 Lumiere,畫面動作連貫順暢

作者 | 發布日期 2024 年 01 月 30 日 7:40 | 分類 AI 人工智慧 , Google line share follow us in feedly line share
Google 推出影片生成模型 Lumiere,畫面動作連貫順暢


圖像生成 AI 現在已經變得越來越強大,不過影片生成則不是那麼容易。最近 Google 發表了最新的影片生成模型,可以提供更暢順的影片。

Google 新公布的 Lumiere 影片生成模型採用了全新的 Diffusion 模型技術 STUNet,可以讓模型認知物件在時間和空間中的定位,一次生成整個影片,使動作更加流暢自然。以前的技術雖然可以逐格生成影片,不過連貫性始終有一定程度的缺陷,讓人感到不自然。

Lumiere 的影片生成最多可以製作 80 格,比 Stable Video Diffusion 模型的 25 格要多,而且可以支援文字指令、圖片風格指令以及影片編輯指令等,用法相當多元化。目前 Lumiere 只是研究階段,未來實際提供相關產品還有一段長時間,特別是在解決濫用風險之前應該不會對外公開。

(本文由 Unwire HK 授權轉載;首圖來源:Google Research

延伸閱讀: