
騰訊發表混元 3D 世界模型 1.0,為業界首個開源可沉浸漫遊、可互動、可仿真的世界模型,用戶只需一句話或一張圖片,幾分鐘內即可產生 360 度沉浸式虛擬世界。過去需要專業建模團隊數週才能搭建的 3D 虛擬世界,現在可短時間完成,為遊戲開發、VR、數位創作等突破性模型。
混元 3D 世界模型 1.0 核心在「語意層次化 3D 場景表徵及生成演算法」,複雜 3D 世界解構成不同語意層級,使前景與背景、地面與天空智慧分離,不僅產生視覺效果逼真的場景,還能輸出標準化 3D Mesh 資訊。
模型融合全景視覺生成與分層 3D 重建,支援文字和圖片輸入,產生高品質、風格多樣可漫遊 3D 場景。Mesh 檔兼容 Unity、Unreal Engine、Blender 等主流工具,用戶可對場景元素獨立編輯或物理模擬,無縫銜接 AIGC 與傳統 CG 流程。
對遊戲開發者而言,混元 3D 世界模型簡化 3D 場景構建。開發者只需輸入簡單指令,模型即可快速產生建築、地形、植被等完整 3D 場景。輸出 Mesh 檔案可遊戲原型搭建或關卡設計用,還能調整前景物體、更換天空背景,滿足個人化創作需求。
無建模經驗的普通用戶亦可用混元 3D 創作引擎,僅需一句話或一張圖即可快速產生 360 度沉浸式空間,更可無縫導入 Vision Pro 等虛擬頭顯。
與全球領先開源模型相比,混元 3D 世界模型 1.0 文生世界、圖生世界的美學品質和指令遵循等關鍵均超越 SOTA 開源模型,顯示騰訊從秒級產生單 3D 資訊到一鍵打造可漫遊 3D 世界,逐步構建完整 3D 內容生態。
騰訊混元大模型已開源圖片、影片、3D、文本等,圖片、影片衍生模型數量達 1,400 個和 1,600 個,混元 3D 系列模型社群下載量超過 230 萬,目前為全球最受歡迎 3D 開源模型。