首页 > 业界 > 关键词  > 腾讯混元最新资讯  > 正文

业界首个!腾讯混元Voyager3D世界模型发布:支持原生3D重建

2025-09-02 17:13 · 稿源: 快科技

快科技9月2日讯,今日,腾讯混元官方宣告,HunyuanWorld-Voyager(即混元Voyager)正式推出,此乃业界首个支持原生3D重建的超长漫游世界模型

该模型在斯坦福大学李飞飞团队发布的世界模型基准测试WorldScore里综合能力拔得头筹,超越现有的开源方法,在视频生成以及3D重建任务中皆有出色表现。

于视频生成和视频3D重建这两项任务上,Voyager同样取得更为优异的成果。

业界首个!腾讯混元Voyager3D世界模型发布:支持原生3D重建

业界首个!腾讯混元Voyager3D世界模型发布:支持原生3D重建

业界首个!腾讯混元Voyager3D世界模型发布:支持原生3D重建

据介绍,混元Voyager专注于AI在空间智能领域的应用拓展,会为虚拟现实、物理仿真、游戏开发等领域给予高保真的3D场景漫游能力。

模型打破传统视频生成在空间一致性和探索范围方面的限制,能够打造长距离、世界一致的漫游场景,支持将视频直接导出为3D格式。

据了解,混元Voyager3D输入-3D输出的特性,与此前已开源的混元世界模型1.0高度契合,可进一步扩大1.0模型的漫游范围,提升复杂场景的生成质量,还能对生成的场景进行风格化控制与编辑。

此外,该模型可支持视频场景重建、3D物体纹理生成、视频风格定制化生成、视频深度估计等多种3D理解与生成应用。

官方称,混元Voyager首次借助空间与特征相结合的方式,支持原生的3D记忆和场景重建,规避了传统后处理造成的延迟和精度损失。

同时,在输入端添加3D条件确保画面视角精确,输出端直接生成3D点云,适配多种应用场景。

额外的深度信息还能支撑视频场景重建、3D物体纹理生成、风格化编辑和深度估计等功能。

举报

  • 相关推荐
  • 国际评测夺冠,考拉悠然无界世界模型打造空间智能核心竞争力

    2026年5月29日,WorldArena视频质量赛道最终结果揭晓。考拉悠然联合上海码极客、同济大学空间智能团队打造的悠然无界世界模型,开源版BLM获全球第一,闭源版BWM-Fast获全球第二。该模型以数据增强、智能增广策略提升数据利用效率,基于DiT架构引入首帧引导、动态记忆及双通路动作控制,在时空连贯性、动作可控性与物理一致性上全面领先,大幅降低训练成本。WorldArena从六大

  • 腾讯混元翻译模型Hy-MT2开源:可在手机本地部署 没网也能用

    腾讯混元正式开源新一代多语言翻译模型Hy-MT2,同步上线腾讯Hy翻译小程序,iOS与安卓APP即将推出,支持端侧本地推理。 Hy-MT2包含1.8B、7B、30B-A3B三种规格,均支持33种语言互译及5种民族语言/方言互译,在通用翻译、专业领域、真实场景与指令遵循能力上全面提升。

  • MYSKI发布全球首款3D动捕AI滑雪传感器重构滑雪训练量化分析范式

    MYSKI团队推出全球首款基于3D动捕与AI算法的滑雪智能传感系统,通过高精度传感器与AI深度融合,实时捕捉、三维重现并深度解析滑雪动作,将主观“体感”转化为可量化数据。系统仅重18克,支持-30℃环境10小时续航,提供实时语音陪练、3D姿态回放、多维数据解析等功能,从纠错到肌肉记忆形成完整训练闭环,推动滑雪教学从经验驱动转向数据驱动。

  • 跻身全球第一梯队!京东开源JoyAI-Echo框架:解决长视频生成三大难题

    今日,京东宣布推出JoyAI-Echo长音视频生成框架,号称解决行业长期头疼的长视频生成三大难题:角色易崩、声音乱变、生成缓慢。 目前,JoyAI-Echo代码与权重已全部开源,项目页和GitHub代码仓库均已上线,开发者和创作者可进行体验和二次开发。 京东表示,JoyAI-Echo的推出,标志着京东在长视频生成领域实现重大突破,进入全球第一梯队。 据了解,JoyAI-Echo内置跨模态音视频�

  • 海尔智慧家庭“3D家庭视图”亮相天津智博会

    智能家居交互正从平面列表转向立体空间,通过3D户型还原真实家居,用户可直观操控全屋设备。2026世界智能产业博览会上,海尔展示了3D家庭视图2.0、车家互联及主动提醒服务,支持一键关灯、设备故障预警、耗材更换等,实现所见即所控。车家互联打通出行与居家,车辆驶离自动启动离家模式,归家提前开启空调,生活更便捷。

  • 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计

    腾讯云在2026 AI产业应用大会上发布CodeBuddy+ Security,结合自研AI深度审计引擎与静态分析工具Xcheck,解决AI时代漏洞激增及传统代码审计瓶颈。该产品采用“双引擎协同+工程化约束”策略,通过AI引擎专攻深层逻辑漏洞,Xcheck处理已知特征漏洞,并引入独立二次校验和PoC验证,确保漏洞真实可修复。目前已在NVIDIA、Google等主流项目中发现并协助修复多个有效漏洞,并逐步接入腾讯内部发布流水线,面向企业开放试用。

  • 手机颜值天花板!荣耀600系列行业首发3D星河美学

    荣耀600系列新品发布,推出幸运星、光羽蓝、青苹果、曜石黑四种配色,行业首发3D星河美学设计。采用双重磁吸猫眼双环、42颗钻闪四芒星及渐变星云三重星光协奏,其中猫眼双环灵感源于幸运恒星光晕,工艺精细。机身实现0.98mm极窄等距黑边,一体化冷雕工艺搭配圆润R角和雾面金属中框,兼顾质感与手感。摄像头模组采用黄金比例星光水晶岛Deco设计,汲取不对称美学灵感,呈现新潮之美。

  • 腾讯董志强:AI Agent已成为众多企业“数字员工”,安全防护需要同步跟上

    6月5日腾讯云AI大会上,副总裁董志强指出,AI Agent正成为企业“数字员工”,但现有安全体系难以应对其高度自主性带来的风险,如身份盲区、自治失控、数据泄露和供应链安全。为此,腾讯云推出Agent全栈安全防护方案,覆盖运行时、内容、身份、数据四层面,核心是“实时校验”——在Agent推理和调用过程中实时检测拦截,实现可见、可管、可控。同时发布CodeBuddy+ Security,结合AI深度审计与规则扫描,保障代码安全。该方案已在腾讯内部产品验证,让企业放心拥抱AI。

  • 少年科学家陈佳玉:8年读完本硕博,用因果世界模型让机器人自主思考

    27岁的北大本科、普渡直博、卡内基梅隆博士后、现任港大助理教授陈佳玉,用5年完成本硕博一体化研究,成为具身智能与强化学习领域一流学者。他通过原力无限发布的双臂协作演示,展示了基于因果世界模型的机器人自主执行能力——机器人不仅能完成桌面清扫等长程任务,还能在持续执行中根据实时状态动态调整策略,而非依赖预编程或简单视觉识别。这标志着从“看见未来”到“理解行动后果”的转变,因果世界模型正重新定义机器人的思维方式。

  • OPPO Reno16系列行业首创3D悬浮星球:裸眼3D后盖一眼惊艳

    OPPO Reno16系列将于5月25日正式发布,目前新机已进入预热阶段。 据了解,OPPO Reno16提供怦然星动、梦境蓝、星河紫、月夜黑四款配色,其中怦然星动”为主打配色。 Reno16行业首创3D悬浮星球设计,通过微米级精密结构与上百万个微透镜叠加,在手机后盖上实现裸眼3D视觉效果。

今日大家都在搜的词: