首页 > AI头条  > 正文

腾讯混元宣布模型矩阵全面升级,新推视觉推理模型T1-Vision和语音通话模型混元Voice

2025-05-21 13:45 · 来源: AIbase基地

今日,腾讯混元正式宣布其模型矩阵的全面升级,包括 旗舰快思考模型混元TurboS、深度思考模型混元T1升级,并基于TurboS基座,新推出视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice。

另外,腾讯混元图像2.0、腾讯混元3D v2.5及混元游戏视觉生成等一系列多模态模型同步“上新”。此次升级不仅增强了混元在 AI 领域的竞争力,也标志着腾讯在多模态技术上的新进展。

在2025腾讯云 AI 产业应用峰会上,腾讯集团高级执行副总裁汤道生表示,混元 TurboS 模型在全球公认的 Chatbot Arena 评测平台上已跻身前八名,成为国内仅次于 DeepSeek 的优秀模型。TurboS 凭借其在代码和数学等理科领域的强大能力,跻身全球前十名。该模型的出色表现归功于其创新的预训练和后训练技术,使得理科推理能力提高了超过10%。

腾讯混元的另一款深度思考模型 T1也在不断迭代中,近期迎来了新升级。T1在竞赛数学和常识问答等多个领域的能力得到了显著提升,其中,竞赛数学成绩提升了8%,而复杂任务的 Agent 能力提升了13%。这种持续的技术进步体现了腾讯在 AI 领域的坚定投入和创新精神。

新发布的 T1-Vision 模型具备原生长思维链,支持多图输入,使得模型在理解图像时更加高效,其整体效果比之前的级联方案提高了5.3%,理解速度也提升了50%。

image.png

而混元 Voice 模型则实现了低延迟语音通话,相比于旧版,响应速度提高了30%,将延迟降低至1.6秒。

image.png

在多模态生成方面,混元图像2.0以超高的准确率和快速的生成能力引领行业,满足了用户对实时交互体验的需求。此外,混元3D v2.5模型在生成能力和可控性方面也取得了突破,使得其在多个生成类目中表现优异。

image.png

为了更好地服务于各行各业,腾讯混元还计划推出大规模可漫游的3D 场景生成模型,助力游戏、智能等行业的创新。同时,混元致力于开源技术的推进,已实现图像、视频、3D 等全模态的开源,并为参与的合作伙伴提供免费的模型资源和技术支持。

划重点:  

🔹 腾讯混元升级模型矩阵,推出视觉深度推理模型 T1-Vision 和端到端语音通话模型混元 Voice。  

🔹 混元 TurboS 在全球评测中排名前八,理科能力显著提升。  

🔹 腾讯混元致力于开源技术,支持多模态模型的持续迭代与行业应用。

  • 相关推荐
  • AI日报:谷歌最强AI家桶Google AI Ultra;腾讯混元宣布模型矩阵全面升级;豆包·语音播客模型发布

    本文汇总了近期AI领域的重要动态:1)谷歌推出249.99美元/月的AI Ultra订阅计划,提供最强AI模型和高级功能;2)腾讯混元模型升级,新增视觉推理T1-Vision和语音对话模型;3)美图获阿里2.5亿美元投资,将在电商和AI领域合作;4)豆包推出语音播客模型,实现文本快速转音频;5)百度文心X1 Turbo获信通院最高评级;6)谷歌发布Flow AI剪辑工具,集成Veo3等三大模型;7)谷歌Veo3支持4K视频生成;8)Imagen4图像模型发布;9)Gemini2.5 Pro新增并行推理功能;10)谷歌推出虚拟试衣工具;11)公测AI编程助手Jules;12)苹果计划在iOS19开放AI模型;13)京东云推五大免费AI营销工具;14)字节开源多模态模型BAGEL;15)英伟达发布物理推理模型Cosmos-Reason1。

  • 腾讯混元T1-Vision上线元宝:一张图片就能分析出产品研发成本

    除此之外,腾讯还介绍了元宝目前可以识别花的品种;可以提示在围棋赛局中下一步如何走;同时,给它一张定期存款利率表,还会帮你出谋划策。

  • 10倍精度升级腾讯混元3D模型v2.5版本发布

    腾讯混元3D模型升级至v2.5版本,建模精度和贴图真实度显著提升。新版本参数体量从1B增至10B,有效面片数增加超10倍,支持1024几何分辨率。纹理系统支持4K高清贴图和凹凸细节,率先支持多视图生成PBR模型。针对动画场景优化骨骼蒙皮系统,支持非标准姿态自动绑定。新增文生/图生3D减面模型、多视图建模模板等专业工作流。混元3D v2.5已全面更新至腾讯AI创作引擎,免费生成额度提升至每日20次,并正式上线腾讯云API面向企业开放。GitHub开源版本累计Star超1.2万。

  • 不要思考过程,推理模型能力能够更强

    UC伯克利和艾伦实验室的最新研究表明,推理模型无需依赖冗长的思考过程也能有效工作。研究人员提出的"无思考(NoThinking)"方法通过简单提示直接生成解决方案,跳过了传统推理模型中的显性思考步骤。实验证明,在低资源(低token数量、少模型参数)或低延迟情况下,NoThinking方法的表现优于传统思考方式,能减少token使用量并提高推理速度。该方法在数学问题解决、编程和形式定理证明等任务中表现优异,尤其在资源受限时优势更明显。研究还发现,结合并行计算扩展后,NoThinking能进一步提升性能,在保持准确性的同时显著降低延迟和计算成本。这一发现挑战了"推理模型必须依赖详细思考过程"的传统认知。

  • 国产六大推理模型激战OpenAI?

    2025年春节前夕,DeepSeek-R1模型发布,标志着中国AI进入推理模型新时代。文章梳理了国产大模型发展历程:从2022年ChatGPT引发国内追赶OpenAI热潮,到2023年"百模大战",再到2024年"AI六小虎"格局形成。重点分析了六大国产推理模型(DeepSeek、百度、阿里、科大讯飞、字节、腾讯)的技术特点与市场表现,指出国产模型在性能上已接近GPT-4水平。特别强调科大讯飞星火X1凭借全国产化技术路线获得政企青睐,以及DeepSeek-R1以560万美元超低成本实现高性能的突破。文章还探讨了英伟达芯片断供危机下,国产全栈技术路径的重要性,认为自主可控将成为对抗国际不确定性的关键。最后指出,随着推理模型成为竞争焦点,国产大模型正从技术追随转向自主创新阶段。

  • 腾讯混元上线“游戏工业级”视觉生成平台:效率最高提升数十倍!

    腾讯5月20日发布混元游戏视觉生成平台,该平台基于混元大模型打造,专为游戏行业内容生产设计。平台能快速生成高质量游戏素材和概念草图,支持多种主流游戏风格,实现创作闭环。通过AI技术,可将整套流程压缩至一个工作页面,用户只需输入提示词即可获得灵感参考图,并直接绘制草图和生成标准三视图及360度旋转演示视频,效率最高提升数十倍。平台还具备角色多视图自动生成能力,上传一张正面图即可自动生成标准三视图和360度展示视频,角色一致性最高达99%。腾讯表示,该平台将显著改善灵感迟滞、多视图缺失等常见问题。

  • AI日报:扣子空间开放测试;腾讯混元开源视频生成工具HunyuanCustom;阿里开源大模型搜索引擎ZeroSearch

    本文汇总了近期AI领域多项重要进展:1)扣子空间开放测试,无需邀请码即可体验AI协作平台;2)腾讯推出HunyuanCustom视频生成工具,实现音视频同步编辑;3)阿里巴巴ZeroSearch技术降低AI训练成本88%;4)OpenAI新增GitHub连接器,强化代码分析功能;5)联想发布天禧个人超级智能体,具备感知交互能力;6)OpenAI在亚洲推出数据驻留计划;7)Multiverse发布全球首款AI生成多人游戏;8)秘塔AI上线"讲题"功能辅助家长辅导;9)Genspark推出智能电子表格工具AI Sheets;10)Google Gemini API新增缓存功能可节省75%成本;11)PixVerse v4视频生成速度质量双提升;12)快手推出内容净化器KuaiMod;13)英伟达开源新一代OCR代码推理模型。这些创新覆盖AI应用、开发工具、成本优化等多个维度,展现了AI技术的快速发展和广泛应用。

  • 腾讯混元视频生成工具新开源:人物不会“变脸” 物体不会“漂移”

    腾讯混元5月9日宣布推出开源的多模态定制化视频生成工具HunyuanCustom。该工具基于混元视频生成大模型打造,支持文本、图像、音频等多模态输入,能生成高质量定制视频。主要功能包括:单/多主体视频生成、视频配音、局部编辑等,在保持主体一致性的同时可灵活调整场景和动作。适用于广告、电商、影视等场景,如快速更换商品背景、制作数字人视频等。目前单主体生成功能已开源,其他功能将于5月陆续开放。用户只需上传图片和文字描述即可生成连贯自然的视频内容。

  • AI日报:美团AI编程工具NoCode将上线;火山引擎发布MCP Servers;腾讯混元上线游戏视觉生成平台

    本文汇总了近期AI领域的重要动态:1)美团将推出对话式编程工具"NoCode";2)火山引擎发布大模型生态平台MCP Servers;3)B站开源动画视频生成模型Index-AniSora;4)字节跳动升级AI耳机Ola Friend的英语学习功能;5)GitHub推出AI编程助手自动修复代码漏洞;6)腾讯混元上线游戏视觉生成平台;7)微软将VS Code转型为开源AI编辑器;8)Windows 11原生支持MCP协议;9)Anthropic发布AI代理开发指南;10)谷歌推出编程AI代理Jules;11)NotebookLM推出iOS版;12)Genspark创3600万美元ARR纪录;13)Bright Data发布开源MCP服务器;14)马斯克宣布Grok模型将登陆Azure平台。这些进展展示了AI技术在编程、内容生成、操作系统等领域的快速发展和应用创新。

  • AI日报:腾讯混元3D生成模型2.5版本发布;海螺推出图像人物参考功能;百度上线移动端超级智能体心响App

    本文介绍了多款AI领域的新产品和技术进展:1)Kortix-AI推出开源通用AI智能体平台Suna;2)腾讯混元3D生成模型升级至2.5版本;3)海螺AI推出基于单张图像生成多角度角色图像功能;4)百度发布"心响"App整合多智能体协作;5)Nari Labs开源媲美真人的对话语音模型Dia;6)Grok新增视觉处理和多语言支持;7)Genspark推出AI幻灯片工具;8)Character.AI发布让静态图片"说话"的AvatarFX模型;9)pad.ws结合白板和代码编辑器;10)OpenBMB开源社区推出长文本生成模型"卷姬";11)腾讯推出AI阅读助手"企鹅读伴";12)OpenAI有意收购Chrome浏览器;13)字节跳动调整AI产品线布局。这些创新展现了AI技术在自动化、3D生成、语音交互、内容创作等领域的快速发展。

今日大家都在搜的词:

热文

  • 3 天
  • 7天