9月2日,腾讯混元3D世界模型系列新成员HunyuanWorld-Voyager(简称混元Voyager)正式发布,这是业界首个支持原生3D重建的超长漫游世界模型。
9月2日,腾讯混元3D世界模型系列新成员HunyuanWorld-Voyager(简称混元Voyager)正式发布,这是业界首个支持原生3D重建的超长漫游世界模型。

混元Voyager聚焦AI在空间智能领域的应用,突破传统视频生成局限,能生成长距离、世界一致的漫游场景,还可将视频直接导出为3D格式。其框架创新性地将场景深度预测引入视频生成过程,融合视频生成与3D建模优势,基于相机可控的视频生成技术,合成可自由控制视角、空间连贯的RGB-D视频。

此外,混元Voyager还支持视频场景重建、3D物体纹理生成等多种3D理解与生成应用。该模型在斯坦福大学的WorldScore测试中位居综合能力首位,展现出了强大的性能。目前,混元Voyager已正式上线,源代码在GitHub和Hugging Face上免费开放。