混元3D世界模型1.0开源,开启数字创作新纪元

7月27日,2025世界人工智能大会腾讯论坛上,腾讯正式发布混元3D世界模型1.0并全面开源,这一举措如同一颗重磅炸弹,在游戏开发、VR、数字内容创作等众多领域激起千层浪,为行业带来了全新的发展契机。

腾讯混元3D世界模型1.0堪称业界先锋,它是首个开源的可沉浸漫游、可交互、可仿真的世界生成模型。不仅如此,腾讯混元还公布了一系列开源计划,涵盖端侧混合推理语言模型、多模态理解模型、游戏视觉模型等,展现出强大的技术实力与开放共享的决心。

该模型融合了全景视觉生成与分层3D重建技术,支持文字和图片输入,能快速生成高质量、风格多样的可漫游3D场景。以往,搭建一个3D虚拟世界需要专业建模团队花费数周时间,而现在,只需一句文字或一张图片,几分钟内就能完成,效率得到了质的飞跃。

对于游戏开发者来说,混元3D世界模型是得力助手。它极大简化了3D场景构建流程,开发者只需输入简单指令,就能快速生成包含建筑、地形、植被的完整3D场景。输出的Mesh文件可直接用于游戏原型搭建或关卡设计,还能灵活调整前景物体、更换天空背景,满足多样化的创作需求。

即便是没有建模经验的普通用户,也能借助混元3D创作引擎,通过一句话或一张图快速生成360°沉浸式视觉空间。生成的场景还能无缝导入Vision Pro等虚拟头显,让用户尽享沉浸式体验。

混元3D世界模型1.0的核心优势在于其创新的「语意层次化3D场景表征及生成算法」。该算法将复杂的3D世界解构为不同语意层级,实现前景与背景、地面与天空的智能分离,不仅生成逼真的整体场景,还能输出标准化的3D Mesh资产,兼容Unity、Unreal Engine、Blender等主流工具,方便用户对场景内元素进行独立编辑或物理仿真,无缝衔接AIGC技术与传统CG工作流。

与全球领先的开源模型相比,混元3D世界模型1.0在文生世界、图生世界的美学质量和指令遵循能力等关键维度全面超越当前SOTA开源模型,无疑为数字创作领域树立了新的标杆。