首页 > AI头条  > 正文

腾讯混元3D世界模型正式发布并开源

2025-07-27 11:15 · 来源: AIbase基地

在2025年7月27日举办的2025世界人工智能大会腾讯论坛上,腾讯公司正式发布了混元3D世界模型1.0版本,并宣布该模型将全面开源。这一举措标志着业界首个支持沉浸漫游、交互与仿真的开源世界生成模型诞生,为游戏开发、虚拟现实(VR)及数字内容创作等领域开辟了全新的可能性。

混元3D世界模型1.0融合了全景视觉生成与分层3D重建技术,能够接受文字和图片作为输入,快速生成高质量、风格多样的可漫游3D场景。这一技术突破极大地简化了3D场景的构建流程,过去需要专业建模团队数周才能完成的工作,现在通过简单的文字指令或图片上传,几分钟内即可实现。对于游戏开发者而言,该模型能够迅速生成包含建筑、地形、植被等元素的完整3D场景,输出的Mesh文件可直接用于游戏原型搭建或关卡设计,同时支持前景物体调整和天空背景更换,满足个性化创作需求。即便是没有建模经验的普通用户,也能通过混元3D创作引擎,轻松生成360°沉浸式视觉空间,并无缝导入Vision Pro等虚拟头显设备,享受沉浸式体验。

微信截图_20250727111432.png

混元3D世界模型1.0的核心优势在于其创新的“语意层次化3D场景表征及生成算法”。该算法将复杂的3D世界解构为不同语意层级,实现前景与背景、地面与天空的智能分离,不仅生成视觉效果逼真的整体场景,还能输出标准化的3D Mesh资产,兼容Unity、Unreal Engine、Blender等主流工具,便于用户对场景内元素进行独立编辑或物理仿真,实现了AIGC技术与传统CG工作流的无缝衔接。与全球领先的开源模型相比,混元3D世界模型1.0在文生世界、图生世界的美学质量和指令遵循能力等关键指标上均实现了全面超越。

此外,腾讯混元还披露了包括端侧混合推理语言模型、多模态理解模型、游戏视觉模型等在内的一系列开源计划。其中,混元旗舰模型TurboS自年初发布以来,保持着每月一个版本的快速迭代,在代码生成、理科能力和复杂指令遵循方面均有显著提升,稳居全球大模型权威排行榜前列。基于TurboS基座开发的混元T1进一步提升了推理能力,展现出国内领先的综合能力。同时,端到端语音模型混元Voice、多模态理解模型混元Vision等也基于混元大语言模型基座打造,继承了出色的理解、认知和推理能力,在多模态理解领域屡获佳绩。

腾讯混元在多模态生成方面同样布局全面,3D生成能力全球领先。最新发布的混元3D2.5模型质感大幅提升,在上海人工智能实验室的评测中排名全球第一。除混元3D世界模型1.0外,腾讯还将在月底开源一系列小尺寸模型,包括0.5B、1.8B、4B、7B混合推理模型,更加轻量且易于部署。同时,多模态理解模型混元-large-vision和专为游戏场景优化的交互式游戏视频生成框架混元GameCraft等也将于近期对外开源。

腾讯混元还开放了完整的多模态生成能力及工具集插件,陆续开源了业界领先的文生图、视频生成和3D生成能力,提供了接近商业模型性能的开源基座,方便社区基于业务和使用场景进行定制。目前,混元3D系列模型的社区下载量已超过230万次,成为全球最受欢迎的3D开源模型之一。

腾讯混元 3D 世界模型 1.0:

●项目主页:https://3d-models.hunyuan.tencent.com/world/

●体验地址:https://3d.hunyuan.tencent.com/sceneTo3D

●Hugging Face 模型地址:https://huggingface.co/tencent/HunyuanWorld-1

●Github 项目地址:https://github.com/Tencent-Hunyuan/HunyuanWorld-1.0

  • 相关推荐
  • AI日报:腾讯发布混元3D 3.0模型;昆仑万维上线Agent Studio功能;阿里Qoder推出付费订阅服务

    AI日报汇总最新行业动态:腾讯发布混元3D+3.0模型,建模精度提升3倍;昆仑万维Mureka上线音乐创作功能;阿里Qoder推出付费订阅服务;VEED Fabric 1.0实现图片转视频;OpenAI发布GPT-5-Codex革新编程;全国发布AI安全治理框架2.0;Mini-o3实现超长视觉推理;上海AI Lab推出多模态模型Lumina-DiMOO;腾讯微调技术提升图像美感300%;Meta推出轻量级MobileLLM-R1;腾讯启动AI应用繁荣计划;谷歌DeepMind�

  • AI日报:可灵AI发布数字人新功能;腾讯混元新技术给大模型 “去油”;抖音上线AI求真功能

    AI日报今日聚焦多项技术突破:可灵AI推出图片转视频功能,腾讯混元SRPO技术提升图像真实感,IBM开源文档处理模型Granite-Docling-258M。Meta发布带屏AI眼镜Ray-Ban,DeepSeek论文登《Nature》封面。OpenAI新增GPT-5思考时长调节功能,抖音上线“AI求真”辟谣工具,通用DeepResearch开源模型性能超越国际知名模型。

  • DeepSeek-V3.2-Exp正式发布

    DeepSeek于9月30日正式发布实验性模型DeepSeek-V3.2-Exp,该模型基于V3.1-Terminus升级,引入创新的稀疏注意力机制DSA,首次实现细粒度稀疏注意力,在保持模型输出效果的同时显著提升长文本训练和推理效率。测试显示其表现与V3.1-Terminus基本持平。应用层面,官方App、网页端及小程序均已同步更新。同时宣布API价格大幅调整:输入缓存0.2元、输入未缓存2元、输出3元,开发者调用成本降低50%以上。模型已在HuggingFace和魔搭开源平台上线。

  • AI日报:腾讯重磅发布混元图像3.0;快手发布KAT系列Agentic Coding大模型;苹果悄然研发ChatGPT式应用

    快手发布KAT系列代码大模型,腾讯推出“混元图像3.0”实现多模态突破,苹果研发类ChatGPT应用升级Siri,谷歌更新Gemini 2.5 Flash Lite提升效率。苹果还推出Manzano图像模型,YouTube Music测试AI音乐主播功能,VideoFrom3D框架简化3D视频生成,Moondream 3.0在多项基准测试中超越GPT-5等顶尖模型,展现强大性能。

  • 业界首个!腾讯混元Voyager3D世界模型发布:支持原生3D重建

    今日,腾讯混元官方宣布,HunyuanWorld-Voyager(简称混元Voyager)正式发布,这是业界首个支持原生3D重建的超长漫游世界模型。 该模型在斯坦福大学李飞飞团队发布的世界模型基准测试WorldScore上位居综合能力首位,超越现有开源方法,在视频生成和3D重建任务中均表现出色。 在视频生成和视频3D重建两个任务上,Voyager也均取得更好的结果。

  • 技术经理人慕课课程正式发布

    为加快培育高水平技术经理人队伍,推动科技成果转化和产业化,技术经理人慕课课程近日正式发布。该课程由中国科协科学技术创新部委托、科技部科技评估中心统筹制作,基于我国首套初、中、高级技术经理人培训教材精心打造,为技术转移从业者及相关人员提供科学、系统、便捷的在线学习资源。课程紧扣《职业分类大典》中技术经理人的职业要求及能力评价规范,与教材紧密适配,形成“教材+慕课”协同互补的梯度式学习体系,助力学员循序渐进提升专业水平。授课师资汇聚权威专家和行业精英,通过动画演示、案例模拟等多样化手段,将知识产权证券化、技术并购重组等复杂业务流程可视化,增强学习效果。课程内容聚焦传统产业转型升级、战略性新兴产业培育等方向,深度剖析真实案例,帮助学员精准把握技术发展趋势,提升解决实际问题的能力。目前课程已在“科创中国”和“技术经理人公共服务平台”同步上线,未来还将持续推出实训案例课程,全方位助力技术经理人成长。

  • 苹果iOS 26普通照片秒变3D照上热搜 “空间场景”功能引热议

    苹果正式推送iOS 26系统,支持iPhone 11及以上机型。新系统引发用户吐槽,如LiquidGlass设计被指“丑出新高度”,升级后出现发烫、卡顿等问题。但“空间场景”功能广受好评,可将普通照片转换为裸眼3D效果,操作便捷,还能设为动态壁纸。不过该功能在不同屏幕上的表现存在差异,低刷屏会出现卡顿,高刷屏则效果更流畅逼真。

  • 国内首家AI回答监测判断系统“玄鸟AI监测1.0版本”正式发布

    9月21日,“玄鸟AI监测系统”正式上线,这是国内首个专注于用户端AI交互数据采集与分析的企业级解决方案。该系统通过“数据采集-智能分析-闭环反馈”三层架构,能有效识别行业“AI幻觉”监控难题,实现跨平台实时数据抓取与智能分析。系统依托自然语言处理与机器学习技术,建立双重验证机制,精准识别AI生成内容中的事实偏差,并通过自动化报告生成功能帮助企业快速定位风险。该系统的上线标志着国内在AI内容监测领域实现关键技术突破,为构建可信AI生态提供重要支撑。

  • AI日报:蚂蚁开源高性能思考模型Ring-flash-2.0;通义7款模型屠榜Hugging Face;Veo3视觉能力升级

    蚂蚁百灵团队开源高性能思考模型Ring-flash-2.0,在多项基准测试中表现优异;阿里通义7款模型登顶Hugging Face榜单,Qwen3-Omni凭借多模态能力全球第一。谷歌Veo3突破视频生成局限,可自动完成视觉任务;特斯拉推进人形机器人量产,马斯克称其为最重要产品。马斯克第六次起诉OpenAI窃取商业机密,苹果内部测试聊天机器人Veritas优化Siri,YouTube推出AI音乐主播增强互动,LiquidAI发布轻量级模型Liquid Nanos优化边缘计算。

  • 定了!WIKO Hi MateBook 14明日正式发布,圆键盘+旗舰屏这次全齐了

    WIKO Hi MateBook 14将于9月26日发布,核心亮点包括:配备2.8K OLED高刷触控屏,搭载英特尔酷睿Ultra 7处理器,性能强劲。键盘采用独特的“波点艺术”设计,兼具复古美感与辨识度。官方强调其定价将远低于万元级别,主打高性价比。结合跨端互联、多屏协同等智慧生态功能,这款轻薄本有望成为下半年市场的黑马。

今日大家都在搜的词: