Google 推出 Project Genie，以世界模型建立互動虛擬世界

Google 去年發表「Genie 3」世界模型（World Model），僅憑一段簡單的文字提示即可生成互動的 3D 虛擬世界。起初，Google 只開放給少數學者和創作者測試，現在進一步以「Project Genie」，開放給美國 Google AI Ultra 的訂閱用戶。

世界模型是一種 AI 系統，可模擬環境，用於教育、娛樂或訓練機器人、AI 代理等場景，是邁向 AGI（Artificial General Intelligence，通用人工智慧）的關鍵基石。透過世界模型，使用者只需要給出提示文字，模型便會生成一個能夠自由探索的空間，不同於以 3D 素材手工打造，整個世界由 AI 生成。Google 所開發的 Genie 3 會生成一段能對使用者要求作出回應的影片，彷彿置身虛擬世界中探索模擬環境。

Project Genie 本質上是經過改良與最佳化的 Genie 3，並且整合最新模型，包括 Nano Banana Pro 與 Gemini 3。Google 在 Project Genie 提供多個預先建構的虛擬世界，但真正讓它引人入勝的，是能夠自行創造新內容的能力。你可以提供一張圖片作為參考，或是直接告訴它你想要的環境與角色設定。

Project Genie 會先生成一張靜態圖片，由此生成整個虛擬世界，Google 將這個過程稱為 world sketching。如果你不滿意 Nano Banana Pro 生成的參考圖片，修改圖片以微調虛擬世界。

最終生成的影片解析度為 720p，畫面更新率約為 24 fps。當你使用 WASD 鍵移動角色時，會以接近即時的方式呈現角色前方的路徑。

Google 強調，Project Genie 目前仍屬研究階段的產品原型，因此存在一些明顯的限制。任何使用過 Google Veo 或 OpenAI Sora 來製作 AI 影片的人都知道，即便是生成一小段影片，也需要花點時間。Project Genie 能夠讓整體體驗看起來具有互動性、令人驚豔，實際操作會有輸入延遲的狀況，而且每個虛擬世界一次只能探索 60 秒。此外，先前在 Genie 3 示範過的可插入事件功能，也就是在模擬中加入新元素的做法，目前在 Project Genie 並未提供。

儘管 Google 曾大力宣傳 Genie 3 準確模擬物理效果的能力，但在 Project Genie，很可能會看到一些不逼真、不符合現實世界物理規律的狀況。

Project Genie 目前只能透過網頁版測試使用，並不會整合至 Gemini 應用程式，現階段提供訂閱 Google AI Ultra 方案的用戶使用這項工具。由於生成這類 AI 影片的成本相當高，從高階訂閱方案開始開放也算合理。Google 則表示，目標是隨時間演進，逐步擴大 Project Genie 的使用對象。