AI 模型近年不斷發展,對於多媒體處理和生成都已經逐漸純熟,不過要處理現實世界的物理變化等細節則尚有改進空間。最近 Google 就宣布開發能夠模擬真實世界的模型,做為 DeepMind 的一部分。
新的開發計畫將由 OpenAI Sora 影片生成工具前共同負責人 Tim Brooks 領導,Brooks 在 X 表示,新團隊將與 Google 現有 Gemini、Veo 和 Genie 等團隊合作,招募文宣說影片與多模態資料 AI 訓練規模化,將是通往通用人工智慧(AGI)的發展方向。新團隊集中開發「即時互動生成」工具,與現有多模態模型 Gemini 等整合,提供更全面的功能。
DeepMind has ambitious plans to make massive generative models that simulate the world. I’m hiring for a new team with this mission. Come build with us!https://t.co/pqvALtAvLs https://t.co/vtwgeXl9Dl
— Tim Brooks (@_tim_brooks) January 6, 2025
真實世界模擬應用範圍相當廣泛,從視覺推理、模擬、規劃具身智慧助理 (Embodied Agent),到即時互動娛樂等都會用到。除了 Google 開發中 Genie 模型,其他「世界模型」還有 World Labs、Decart 和 Odyssey 等,可生成互動多媒體內容如遊戲和電影等,以及逼真模擬、訓練機器人等。
(本文由 Unwire Pro 授權轉載;首圖來源:shutterstock)