Google 推出 Project Genie,以世界模型建立互動虛擬世界

作者 | 發布日期 2026 年 01 月 30 日 16:50 | 分類 AI 人工智慧 , Gemini , Google line share Linkedin share follow us in feedly line share
Loading...
Google 推出 Project Genie,以世界模型建立互動虛擬世界

Google 去年發表「Genie 3」世界模型(World Model),僅憑一段簡單的文字提示即可生成互動的 3D 虛擬世界。起初,Google 只開放給少數學者和創作者測試,現在進一步以「Project Genie」,開放給美國 Google AI Ultra 的訂閱用戶。

世界模型是一種 AI 系統,可模擬環境,用於教育、娛樂或訓練機器人、AI 代理等場景,是邁向 AGI(Artificial General Intelligence,通用人工智慧)的關鍵基石。透過世界模型,使用者只需要給出提示文字,模型便會生成一個能夠自由探索的空間,不同於以 3D 素材手工打造,整個世界由 AI 生成。Google 所開發的 Genie 3 會生成一段能對使用者要求作出回應的影片,彷彿置身虛擬世界中探索模擬環境。

Project Genie 本質上是經過改良與最佳化的 Genie 3,並且整合最新模型,包括 Nano Banana Pro 與 Gemini 3。Google 在 Project Genie 提供多個預先建構的虛擬世界,但真正讓它引人入勝的,是能夠自行創造新內容的能力。你可以提供一張圖片作為參考,或是直接告訴它你想要的環境與角色設定。

Project Genie 會先生成一張靜態圖片,由此生成整個虛擬世界,Google 將這個過程稱為 world sketching。如果你不滿意 Nano Banana Pro 生成的參考圖片,修改圖片以微調虛擬世界。

最終生成的影片解析度為 720p,畫面更新率約為 24 fps。當你使用 WASD 鍵移動角色時,會以接近即時的方式呈現角色前方的路徑。

Google 強調,Project Genie 目前仍屬研究階段的產品原型,因此存在一些明顯的限制。任何使用過 Google Veo 或 OpenAI Sora 來製作 AI 影片的人都知道,即便是生成一小段影片,也需要花點時間。Project Genie 能夠讓整體體驗看起來具有互動性、令人驚豔,實際操作會有輸入延遲的狀況,而且每個虛擬世界一次只能探索 60 秒。此外,先前在 Genie 3 示範過的可插入事件功能,也就是在模擬中加入新元素的做法,目前在 Project Genie 並未提供。

儘管 Google 曾大力宣傳 Genie 3 準確模擬物理效果的能力,但在 Project Genie,很可能會看到一些不逼真、不符合現實世界物理規律的狀況。

Project Genie 目前只能透過網頁版測試使用,並不會整合至 Gemini 應用程式,現階段提供訂閱 Google AI Ultra 方案的用戶使用這項工具。由於生成這類 AI 影片的成本相當高,從高階訂閱方案開始開放也算合理。Google 則表示,目標是隨時間演進,逐步擴大 Project Genie 的使用對象。

(首圖來源:Google Blog

延伸閱讀:

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》