腾讯混元世界模型1.0精简版:开源3D场景AI,加速元宇宙构建

Decoder

腾讯今日发布了“混元世界模型1.0精简版”,这是3D内容创作生成式AI领域的一项重大进展。作为其混元世界模型1.0的精简版本,它旨在提高可访问性,特别优化了在消费级GPU上的高效运行能力,显存需求据称降低了35%,仅需不到17GB显存。这项优化承诺带来更快的性能和更低的整体资源消耗,使复杂的3D场景生成对更广泛的创作者而言更具可行性。

“精简版”模型建立在腾讯于2025年7月26日首次开源的原始混元世界模型1.0的基础之上。这款开创性的AI模型能够根据简单的文本描述或图像提示生成完整的3D虚拟场景或“世界”。与许多专注于创建单个3D对象或资产的现有AI工具不同,混元世界模型1.0旨在生成全面的、可交互的360度全景环境。这些生成的场景虽然提供类似于现代视频游戏的有限自由移动,但允许用户在受限范围内环顾四周并进行导航。

混元世界模型的一项关键创新是其能够将全景图像合成与分层3D重建相结合,并将结果导出为网格文件,无缝集成到标准图形管线中。这种兼容性扩展到流行的游戏引擎,如Unity和Unreal Engine,以及各种虚拟现实(VR)平台和模拟工具。该模型通过创建语义分层的3D网格表示来实现这一点,它能够理解并分离天空、地面和物体等元素,从而增强生成场景内的交互性。

混元世界模型1.0精简版的发布,彰显了腾讯致力于普及3D内容创作的更广泛承诺。腾讯的混元AI生态系统一直硕果累累,早期的模型如混元3D-2.0和2.5分别于2025年1月和6月推出,专注于从文本或图像生成高分辨率3D模型和资产。据报道,这些早期迭代已展示出显著加速工作流程的能力,腾讯游戏的原型制作成本降低了30%。

此类易于访问的3D生成式AI模型影响深远。从游戏和虚拟现实到电影制作、建筑设计、电子商务乃至个性化虚拟形象等行业都将从中受益匪厚。通过使创作者能够快速将概念转化为可探索的3D环境,这些工具大幅削减了传统3D内容开发所需的时间和资源。这一转变不仅使专业艺术家,也使更广泛的受众能够进行复杂的3D创作,从而促进了不同数字领域的创新和效率。随着3D AI市场持续快速扩张,大量新工具不断涌现,预计将有大量投资,腾讯的开源“精简版”模型将成为塑造沉浸式数字体验未来的关键力量。