腾讯混元宣布模型矩阵全面升级，新推视觉推理模型T1-Vision和语音通话模型混元Voice

2025-05-21 13:45 · 来源： AIbase基地

今日，腾讯混元正式宣布其模型矩阵的全面升级，包括旗舰快思考模型混元TurboS、深度思考模型混元T1升级，并基于TurboS基座，新推出视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice。

另外，腾讯混元图像2.0、腾讯混元3D v2.5及混元游戏视觉生成等一系列多模态模型同步“上新”。此次升级不仅增强了混元在 AI 领域的竞争力，也标志着腾讯在多模态技术上的新进展。

在2025腾讯云 AI 产业应用峰会上，腾讯集团高级执行副总裁汤道生表示，混元 TurboS 模型在全球公认的 Chatbot Arena 评测平台上已跻身前八名，成为国内仅次于 DeepSeek 的优秀模型。TurboS 凭借其在代码和数学等理科领域的强大能力，跻身全球前十名。该模型的出色表现归功于其创新的预训练和后训练技术，使得理科推理能力提高了超过10%。

腾讯混元的另一款深度思考模型 T1也在不断迭代中，近期迎来了新升级。T1在竞赛数学和常识问答等多个领域的能力得到了显著提升，其中，竞赛数学成绩提升了8%，而复杂任务的 Agent 能力提升了13%。这种持续的技术进步体现了腾讯在 AI 领域的坚定投入和创新精神。

新发布的 T1-Vision 模型具备原生长思维链，支持多图输入，使得模型在理解图像时更加高效，其整体效果比之前的级联方案提高了5.3%，理解速度也提升了50%。

而混元 Voice 模型则实现了低延迟语音通话，相比于旧版，响应速度提高了30%，将延迟降低至1.6秒。

在多模态生成方面，混元图像2.0以超高的准确率和快速的生成能力引领行业，满足了用户对实时交互体验的需求。此外，混元3D v2.5模型在生成能力和可控性方面也取得了突破，使得其在多个生成类目中表现优异。

为了更好地服务于各行各业，腾讯混元还计划推出大规模可漫游的3D 场景生成模型，助力游戏、智能等行业的创新。同时，混元致力于开源技术的推进，已实现图像、视频、3D 等全模态的开源，并为参与的合作伙伴提供免费的模型资源和技术支持。

划重点:
🔹 腾讯混元升级模型矩阵，推出视觉深度推理模型 T1-Vision 和端到端语音通话模型混元 Voice。
🔹 混元 TurboS 在全球评测中排名前八，理科能力显著提升。
🔹 腾讯混元致力于开源技术，支持多模态模型的持续迭代与行业应用。

相关推荐

腾讯混元图像3.0登顶LMArena榜一

腾讯混元图像3.0模型发布仅一周，即在全球26个顶尖大模型中脱颖而出，登顶LMArena权威榜单首位，成为AI生图领域新王者。其成功得益于三大核心优势：能运用知识推理生成有逻辑内涵的图像；精准实现中英文长文本及细节标注的渲染；兼具真实质感与审美把控。作为开源模型，混元系列已构建覆盖多模态的技术生态，社区衍生模型超3000个，其中混元3D模型下载量超260万次，是全球最受欢迎的3D开源模型。未来腾讯将持续拓展其应用边界。

腾讯混元图像3.0 AI文生图开源生图模型
荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

本期AI日报聚焦多项技术突破：DeepSeek发布V3.2-exp模型，通过稀疏注意力机制降低API成本50%；Anthropic推出Claude Sonnet 4.5，在编码任务表现卓越；ChatGPT新增即时结账功能，实现对话界面直接购物；OpenAI将推出AI版TikTok，所有内容由Sora2模型生成；百度地图升级小度想想2.0，提供智能出行服务；蚂蚁集团开源万亿参数模型Ring-1T-preview；DeepMind提出“帧链”概念，推动视频模型实现全面�

AI DeepSeek 稀疏注意力
荐AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Coding大模型；苹果悄然研发ChatGPT式应用

快手发布KAT系列代码大模型，腾讯推出“混元图像3.0”实现多模态突破，苹果研发类ChatGPT应用升级Siri，谷歌更新Gemini 2.5 Flash Lite提升效率。苹果还推出Manzano图像模型，YouTube Music测试AI音乐主播功能，VideoFrom3D框架简化3D视频生成，Moondream 3.0在多项基准测试中超越GPT-5等顶尖模型，展现强大性能。

AI日报快手KAT系列大模型
破解海外旅游语言困境，时空壶新T1以端侧模型开启全球畅行

国庆假期临近，海外旅游热度攀升，语言沟通成为游客面临的主要障碍。网络不稳定更使依赖在线翻译工具的旅行者陷入困境。时空壶新T1翻译机通过端侧AI模型，实现无网或弱网环境下的流畅翻译，支持31种语言互译，覆盖全球98%主流旅游地。其离线翻译准确率达90%，响应迅速，并具备拍照翻译和降噪功能，有效解决机场、餐厅等嘈杂场所的沟通难题。新T1助力游客跨越语言壁垒，尽享无忧旅程，真正实现“无网也能畅行全球”。

海外旅游语言沟通翻译机
荐AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠榜Hugging Face；Veo3视觉能力升级

蚂蚁百灵团队开源高性能思考模型Ring-flash-2.0，在多项基准测试中表现优异；阿里通义7款模型登顶Hugging Face榜单，Qwen3-Omni凭借多模态能力全球第一。谷歌Veo3突破视频生成局限，可自动完成视觉任务；特斯拉推进人形机器人量产，马斯克称其为最重要产品。马斯克第六次起诉OpenAI窃取商业机密，苹果内部测试聊天机器人Veritas优化Siri，YouTube推出AI音乐主播增强互动，LiquidAI发布轻量级模型Liquid Nanos优化边缘计算。

AI 开源模型高性能思考模型
荐AI日报：可灵AI发布数字人新功能；腾讯混元新技术给大模型 “去油”；抖音上线AI求真功能

AI日报今日聚焦多项技术突破：可灵AI推出图片转视频功能，腾讯混元SRPO技术提升图像真实感，IBM开源文档处理模型Granite-Docling-258M。Meta发布带屏AI眼镜Ray-Ban，DeepSeek论文登《Nature》封面。OpenAI新增GPT-5思考时长调节功能，抖音上线“AI求真”辟谣工具，通用DeepResearch开源模型性能超越国际知名模型。

AI日报数字人视频生成
云天励飞“算力积木”联手OISA，突破万亿级MoE大模型推理集群的Scale up瓶颈

云天励飞近日加入OISA生态，携手产业伙伴共建国产AI芯片互联体系，为中国算力生态注入新动力。OISA是中国移动提出的开放互联标准体系，旨在打造全向、对等、智能的互联新范式，解决智算集群内存互访难题，为大规模并行计算提供技术基石。云天励飞凭借在AI芯片与算力架构的长期积累，将依托“算力积木”架构的模块化优势，在大规模推理集群中实现高效互联，助力突破万级MoE大模型推理瓶颈，推动国产算力生态发展。

云天励飞 OISA生态 AI芯片互联
易鑫发布Agentic大模型，破解汽车金融风控与效率痛点

9月12日，易鑫集团在“IT Value Summit数字价值年会”上入选“2025创新场景年度AI应用TOP榜”，成为汽车金融科技领域唯一上榜企业。首席科技官贾志峰指出，易鑫以AI为核心驱动力，通过自研大模型“智鑫多维”等技术，显著提升风控水平与融资通过率，推动行业智能化转型。平台已连接全国4.2万家经销商及上百家金融机构，服务覆盖牧民、基层员工等多元群体，体现技术普惠价值。未来将持续加大科技创新投入，深化国内普惠金融服务，并探索技术出海，助力全球汽车金融行业迈向更高水平智能化。此次上榜不仅是对其技术实力的认可，更反映出行业正加速拥抱智能化变革。

AI应用汽车金融金融科技
美团发布高效推理模型LongCat-Flash-Thinking：部分性能接近GPT5

9月23日，美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型在保持极致速度的同时，性能更强大、更专业，在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平（SOTA），部分任务性能接近闭源模型GPT5-Thinking。它增强了智能体自主调用工具能力，扩展了形式化定理证明能力，成为国内首个结合深度思考、工具调用与非形式化、形式化推理的大语言模型。在数学、代码、智能体等高复杂度任务上表现尤为突出，多项基准测试成绩领先开源及闭源顶尖模型，已在HuggingFace、Github全面开源。

高效推理模型 LongCat-Flash-Thinking 开源模型
荐没想到，音频大模型开源最彻底的，居然是小红书

不难发现，近几个月，开源频频成为 AI 社区热议的焦点。尤其是对于国内科技公司来说，开源成为主旋律。根据 Hugging Face 中文 AI 模型与资源社区的数据显示，国内厂商在七八月接连开源33款、31款各类型大模型。这些开源成果大多落在了文本、图像、视频、推理、智能体以及世界模型领域，而音频生成占比很小。

开源 AI社区音频生成

腾讯混元宣布模型矩阵全面升级，新推视觉推理模型T1-Vision和语音通话模型混元Voice

腾讯混元图像3.0登顶LMArena榜一

荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

荐AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Coding大模型；苹果悄然研发ChatGPT式应用

破解海外旅游语言困境，时空壶新T1以端侧模型开启全球畅行

荐AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠榜Hugging Face；Veo3视觉能力升级

荐AI日报：可灵AI发布数字人新功能；腾讯混元新技术给大模型 “去油”；抖音上线AI求真功能

云天励飞“算力积木”联手OISA，突破万亿级MoE大模型推理集群的Scale up瓶颈

易鑫发布Agentic大模型，破解汽车金融风控与效率痛点

美团发布高效推理模型LongCat-Flash-Thinking：部分性能接近GPT5

荐没想到，音频大模型开源最彻底的，居然是小红书

今日大家都在搜的词：

热文

雷军：小米17系列开售仅5天销量破100万台

理想汽车推出焕新版L系限时优惠 10 月 8 日前享1.5万置换补贴

小米回应“小米汽车突然自己开走”：排除车辆质量问题

比特币价格突破12.5万美元刷新历史最高纪录

小米17 1TB版明日开售售价5299元

乔布斯逝世14周年库克发文缅怀：我们深切怀念你

腾讯混元图像3.0登顶LMArena榜一

小米 17 标准版1TB版本 5299 元开售全系列销量同比增超20%

雷军：小米17系列开售仅5天销量破100万台

站长商机