Google 去年發表「Genie 3」世界模型(World Model),僅憑一段簡單的文字提示即可生成互動的 3D 虛擬世界。起初,Google 只開放給少數學者和創作者測試,現在進一步以「Project Genie」,開放給美國 Google AI Ultra 的訂閱用戶。
世界模型是一種 AI 系統,可模擬環境,用於教育、娛樂或訓練機器人、AI 代理等場景,是邁向 AGI(Artificial General Intelligence,通用人工智慧)的關鍵基石。透過世界模型,使用者只需要給出提示文字,模型便會生成一個能夠自由探索的空間,不同於以 3D 素材手工打造,整個世界由 AI 生成。Google 所開發的 Genie 3 會生成一段能對使用者要求作出回應的影片,彷彿置身虛擬世界中探索模擬環境。
Project Genie 本質上是經過改良與最佳化的 Genie 3,並且整合最新模型,包括 Nano Banana Pro 與 Gemini 3。Google 在 Project Genie 提供多個預先建構的虛擬世界,但真正讓它引人入勝的,是能夠自行創造新內容的能力。你可以提供一張圖片作為參考,或是直接告訴它你想要的環境與角色設定。
Project Genie 會先生成一張靜態圖片,由此生成整個虛擬世界,Google 將這個過程稱為 world sketching。如果你不滿意 Nano Banana Pro 生成的參考圖片,修改圖片以微調虛擬世界。
最終生成的影片解析度為 720p,畫面更新率約為 24 fps。當你使用 WASD 鍵移動角色時,會以接近即時的方式呈現角色前方的路徑。
Google 強調,Project Genie 目前仍屬研究階段的產品原型,因此存在一些明顯的限制。任何使用過 Google Veo 或 OpenAI Sora 來製作 AI 影片的人都知道,即便是生成一小段影片,也需要花點時間。Project Genie 能夠讓整體體驗看起來具有互動性、令人驚豔,實際操作會有輸入延遲的狀況,而且每個虛擬世界一次只能探索 60 秒。此外,先前在 Genie 3 示範過的可插入事件功能,也就是在模擬中加入新元素的做法,目前在 Project Genie 並未提供。
儘管 Google 曾大力宣傳 Genie 3 準確模擬物理效果的能力,但在 Project Genie,很可能會看到一些不逼真、不符合現實世界物理規律的狀況。
Project Genie 目前只能透過網頁版測試使用,並不會整合至 Gemini 應用程式,現階段提供訂閱 Google AI Ultra 方案的用戶使用這項工具。由於生成這類 AI 影片的成本相當高,從高階訂閱方案開始開放也算合理。Google 則表示,目標是隨時間演進,逐步擴大 Project Genie 的使用對象。
(首圖來源:Google Blog)






