Google DeepMind 宣布開發模擬真實世界的 AI 模型

AI 模型近年不斷發展，對於多媒體處理和生成都已經逐漸純熟，不過要處理現實世界的物理變化等細節則尚有改進空間。最近 Google 就宣布開發能夠模擬真實世界的模型，做為 DeepMind 的一部分。

新的開發計畫將由 OpenAI Sora 影片生成工具前共同負責人 Tim Brooks 領導，Brooks 在 X 表示，新團隊將與 Google 現有 Gemini、Veo 和 Genie 等團隊合作，招募文宣說影片與多模態資料 AI 訓練規模化，將是通往通用人工智慧（AGI）的發展方向。新團隊集中開發「即時互動生成」工具，與現有多模態模型 Gemini 等整合，提供更全面的功能。

DeepMind has ambitious plans to make massive generative models that simulate the world. I’m hiring for a new team with this mission. Come build with us!https://t.co/pqvALtAvLs https://t.co/vtwgeXl9Dl

— Tim Brooks (@_tim_brooks) January 6, 2025

真實世界模擬應用範圍相當廣泛，從視覺推理、模擬、規劃具身智慧助理 (Embodied Agent)，到即時互動娛樂等都會用到。除了 Google 開發中 Genie 模型，其他「世界模型」還有 World Labs、Decart 和 Odyssey 等，可生成互動多媒體內容如遊戲和電影等，以及逼真模擬、訓練機器人等。

（本文由 Unwire Pro 授權轉載；首圖來源：shutterstock）