快科技9月2日讯,今日,腾讯混元官方宣告,HunyuanWorld-Voyager(即混元Voyager)正式推出,此乃业界首个支持原生3D重建的超长漫游世界模型。
该模型在斯坦福大学李飞飞团队发布的世界模型基准测试WorldScore里综合能力拔得头筹,超越现有的开源方法,在视频生成以及3D重建任务中皆有出色表现。
于视频生成和视频3D重建这两项任务上,Voyager同样取得更为优异的成果。



据介绍,混元Voyager专注于AI在空间智能领域的应用拓展,会为虚拟现实、物理仿真、游戏开发等领域给予高保真的3D场景漫游能力。
模型打破传统视频生成在空间一致性和探索范围方面的限制,能够打造长距离、世界一致的漫游场景,支持将视频直接导出为3D格式。
据了解,混元Voyager3D输入-3D输出的特性,与此前已开源的混元世界模型1.0高度契合,可进一步扩大1.0模型的漫游范围,提升复杂场景的生成质量,还能对生成的场景进行风格化控制与编辑。
此外,该模型可支持视频场景重建、3D物体纹理生成、视频风格定制化生成、视频深度估计等多种3D理解与生成应用。
官方称,混元Voyager首次借助空间与特征相结合的方式,支持原生的3D记忆和场景重建,规避了传统后处理造成的延迟和精度损失。
同时,在输入端添加3D条件确保画面视角精确,输出端直接生成3D点云,适配多种应用场景。
额外的深度信息还能支撑视频场景重建、3D物体纹理生成、风格化编辑和深度估计等功能。
(举报)
