首页 > AI头条  > 正文

腾讯混元3D世界模型正式发布并开源

2025-07-27 11:15 · 来源: AIbase基地

在2025年7月27日举办的2025世界人工智能大会腾讯论坛上,腾讯公司正式发布了混元3D世界模型1.0版本,并宣布该模型将全面开源。这一举措标志着业界首个支持沉浸漫游、交互与仿真的开源世界生成模型诞生,为游戏开发、虚拟现实(VR)及数字内容创作等领域开辟了全新的可能性。

混元3D世界模型1.0融合了全景视觉生成与分层3D重建技术,能够接受文字和图片作为输入,快速生成高质量、风格多样的可漫游3D场景。这一技术突破极大地简化了3D场景的构建流程,过去需要专业建模团队数周才能完成的工作,现在通过简单的文字指令或图片上传,几分钟内即可实现。对于游戏开发者而言,该模型能够迅速生成包含建筑、地形、植被等元素的完整3D场景,输出的Mesh文件可直接用于游戏原型搭建或关卡设计,同时支持前景物体调整和天空背景更换,满足个性化创作需求。即便是没有建模经验的普通用户,也能通过混元3D创作引擎,轻松生成360°沉浸式视觉空间,并无缝导入Vision Pro等虚拟头显设备,享受沉浸式体验。

微信截图_20250727111432.png

混元3D世界模型1.0的核心优势在于其创新的“语意层次化3D场景表征及生成算法”。该算法将复杂的3D世界解构为不同语意层级,实现前景与背景、地面与天空的智能分离,不仅生成视觉效果逼真的整体场景,还能输出标准化的3D Mesh资产,兼容Unity、Unreal Engine、Blender等主流工具,便于用户对场景内元素进行独立编辑或物理仿真,实现了AIGC技术与传统CG工作流的无缝衔接。与全球领先的开源模型相比,混元3D世界模型1.0在文生世界、图生世界的美学质量和指令遵循能力等关键指标上均实现了全面超越。

此外,腾讯混元还披露了包括端侧混合推理语言模型、多模态理解模型、游戏视觉模型等在内的一系列开源计划。其中,混元旗舰模型TurboS自年初发布以来,保持着每月一个版本的快速迭代,在代码生成、理科能力和复杂指令遵循方面均有显著提升,稳居全球大模型权威排行榜前列。基于TurboS基座开发的混元T1进一步提升了推理能力,展现出国内领先的综合能力。同时,端到端语音模型混元Voice、多模态理解模型混元Vision等也基于混元大语言模型基座打造,继承了出色的理解、认知和推理能力,在多模态理解领域屡获佳绩。

腾讯混元在多模态生成方面同样布局全面,3D生成能力全球领先。最新发布的混元3D2.5模型质感大幅提升,在上海人工智能实验室的评测中排名全球第一。除混元3D世界模型1.0外,腾讯还将在月底开源一系列小尺寸模型,包括0.5B、1.8B、4B、7B混合推理模型,更加轻量且易于部署。同时,多模态理解模型混元-large-vision和专为游戏场景优化的交互式游戏视频生成框架混元GameCraft等也将于近期对外开源。

腾讯混元还开放了完整的多模态生成能力及工具集插件,陆续开源了业界领先的文生图、视频生成和3D生成能力,提供了接近商业模型性能的开源基座,方便社区基于业务和使用场景进行定制。目前,混元3D系列模型的社区下载量已超过230万次,成为全球最受欢迎的3D开源模型之一。

腾讯混元 3D 世界模型 1.0:

●项目主页:https://3d-models.hunyuan.tencent.com/world/

●体验地址:https://3d.hunyuan.tencent.com/sceneTo3D

●Hugging Face 模型地址:https://huggingface.co/tencent/HunyuanWorld-1

●Github 项目地址:https://github.com/Tencent-Hunyuan/HunyuanWorld-1.0

  • 相关推荐
  • 腾讯混元3D世界模型在魔搭社区开源首发

    7月27日,腾讯混元3D世界模型1.0在魔搭社区开源首发。这是业界首个开源的沉浸式3D世界生成模型,支持文字/图片输入快速生成完整3D场景,将原本需要数周的建模时间缩短至几分钟。该模型显著提升了游戏开发、VR、数字内容等领域的创作效率,开发者可免费下载体验,还能通过魔搭社区提供的4000+MCP服务和调试工具进行优化训练。作为中国最大AI开源社区,魔搭已汇聚500+机构、7万+模型,覆盖36个国家1600万开发者。此前腾讯开源的混元MoE模型Hunyuan-A13B也在该社区首发。

  • AI日报:智谱AI重磅发布GLM-4.5;阿里开源Wan2.2;阶跃星辰推全新模型Step3

    【AI日报】本期重点内容:1.智谱AI发布开源大模型GLM-4.5,在推理、编码和智能体能力方面达到SOTA水平;2.阿里开源视频生成模型Wan2.2,采用MoE架构提升计算效率;3.阶跃星辰推出AI研究助手"阶跃深研",支持金融医疗等专业领域研究;4.微软Edge浏览器新增Copilot模式,提供智能搜索体验;5.Anthropic对Claude用户实施使用限制引发争议;6.阶跃星辰发布321B参数大模型Step3;7.蚂�

  • 视觉中国战投企业景致三维:启动深圳首家3D数字技术订单班

    视觉中国战略投资企业景致三维联合深圳携创高级技工学校,于2025年7月22日启动深圳首家"3D梦工场订单班"。该项目针对3D数字技术人才缺口,定向培养逆向工程师、动画师、渲染师等紧缺人才。课程引入亚马逊、京东等真实商业项目案例,学生将系统学习3ds Max、Maya等主流工具,并考取职业资格证书。学习期间企业提供奖学金和带薪实习,毕业生考核合格可直接入职景�

  • AI日报:可灵发布灵动画布创意工作台;Coze Studio和Loop正式开源;WPS AI 3.0灵犀版本发布

    【AI日报】汇总了近期AI领域重要动态:1)字节跳动开源Coze两大核心项目,降低AI开发门槛;2)可灵AI发布"灵动画布"创意工作台,创作者突破4500万;3)Runway推出视频编辑模型Aleph,支持自然语言指令操作;4)金山办公发布WPS AI 3.0,实现智能文档创作;5)京东升级大模型品牌JoyAI;6)浦东设立20亿AI种子基金;7)阿里开源WebSailor框架提升信息检索效率;8)我国大模型数量突破1500个,居全球领先;9)蚂蚁数科联合发布金融大模型评测基准;10)腾讯开源混元3D世界模型,支持360°场景生成。

  • 从数字世界迈向物理世界!清华×生数发布最新成果Vidar,基于视频大模型实现机器人物理操作

    清华大学生数科技团队研发的Vidar模型实现具身智能重大突破,首次让通用视频大模型具备"手脚"功能。该模型通过三级数据架构(海量通用视频+中等规模具身视频+少量机器人特定数据),仅需20分钟机器人真机数据即可快速泛化到新机器人本体,数据量仅为行业领先方法的1/80-1/1200。Vidar创新性地将任务解构为上游视频预测和下游动作执行,结合逆动力学模型实现视觉-

  • 荣耀MagicGUI大模型发布并开源!Magic V5首发搭载:跨应用/设备自动化

    该战略是荣耀新任CEO李健在3月的MWC 2025首次揭晓,是荣耀的全新人工智能战略计划,将从智能手机制造商向全球AI终端生态公司全面转型。 李健宣布,未来5年荣耀将投入100亿美元,与全球合作伙手共建AI设备生态。 分为三个实施阶段: 第一阶段是智慧手机,荣耀将与合作伙伴携手突破技术边界,共同创造代理型人工智能时代的新范式; 第二阶段是智慧生态系统,荣耀将打�

  • A日报:Stability AI发布实时重建模型SPAR3D;火山引擎“奇美拉”数字人平台启动封测;京东重磅开源JoyAgent-JDGenie

    AI日报栏目精选了人工智能领域最新动态:1)Stability AI推出0.7秒单图3D重建模型SPAR3D;2)GitHub热门开源AI协作框架CrewAI获3.4万星;3)马斯克发布儿童AI聊天机器人Baby Grok引发安全争议;4)ComfyUI-C opilot工具简化AI工作流创建;5)CNNIC报告显示我国346款生成式AI完成备案;6)提示词管理工具AI Gist上线;7)开源语言学习工具WordPecker支持多语言学习;8)斯坦福推出多工具协作AI Agent OctoTools;9)Ope

  • A日报:Trae 2.0 正式升级 SOLO 模式;通义发布Qwen3新模型;智谱AI重磅推出Zread

    本期AI日报聚焦多项AI领域突破:1)Trae 2.0推出SOLO模式,实现AI全流程自主开发;2)阿里通义发布Qwen3-235B大模型,支持256K文本处理;3)智谱AI推出Zread工具,一键转换GitHub项目为使用手册;4)零一万物发布万智企业大模型平台2.0及定制Agent方案;5)字节跳动推出通用机器人模型GR-3,具备高精度操作能力;6)Pika推出AI视频特效APP,降低创作门槛;7)Dia浏览器将上线AI驱动的"分身鼠标&

  • 华为MatePad Pro 12.2开启预约 预计7月24日正式发布

    华为MatePad Pro 12.2英寸平板7月18日开启预约,将于7月24日正式发布。该产品提供普通版和柔光版两种版本,12GB+256GB/512GB两种存储组合,曜黑、宣白、飞天青三款配色。采用全新PaperMatte显示技术,基于Tandem OLED面板打造,功耗降低30%,支持144Hz高刷、2000尼特峰值亮度,获得德国莱茵TUV与SGS护眼认证。内置10100mAh电池,支持100W快充。后置5000万主摄+800万超广角,前置800万像素。支持Wi-Fi7、蓝牙5.2等连接技术,国行版将搭载HarmonyOS5系统。

  • vivo以Rust语言自研的蓝河操作系统内核正式开源

    7月23日,2025开放原子开源生态大会召开。vivo宣布其自主研发的蓝河操作系统(BlueOS)内核正式开源。该系统采用Rust语言编写,具备智慧、流畅、安全三大特性,是行业首个从内核到框架全栈使用Rust的操作系统。蓝河内核内存占用仅13KB,兼容RISC-V、ARM等架构,支持POSIX接口标准,包含系统调度、内存管理等五大核心能力。vivo表示,此次开源将为国产操作系统发展提供新思路,推动行业迈向新高度。未来vivo将持续推进Rust语言在国内的普及,并举办第三届蓝河操作系统创新大赛。

今日大家都在搜的词: