首页 > AI头条  > 正文

腾讯混元开源并发布 0.5B、1.8B、4B、7B模型

2025-08-04 15:15 · 来源: AIbase基地

腾讯混元团队宣布推出四款开源的小尺寸模型,参数分别为0.5B、1.8B、4B和7B。这些模型专为消费级显卡设计,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,并支持垂直领域的低成本微调。这一举措进一步丰富了混元开源模型体系,为开发者和企业提供了更多尺寸的模型选择。

这四款模型的推出是腾讯混元大模型持续开源的一部分,旨在为开发者和企业提供更多选择,以满足不同场景下的需求。目前,这些模型已在Github和HuggingFace等开源社区上线,并得到了Arm、高通、Intel、联发科技等多个消费级终端芯片平台的支持。

新开源的四个模型属于融合推理模型,具备推理速度快、性价比高的特点。用户可以根据使用场景灵活选择模型的思考模式:快思考模式提供简洁、高效的输出,适合简单任务;慢思考模式则涉及解决复杂问题,具备更全面的推理步骤。在效果上,这些模型在语言理解、数学、推理等领域表现出色,在多个公开测试集上得分达到了领先水平。

微信截图_20250804151331.png

这四个模型的亮点在于其agent能力和长文处理能力。通过精心的数据构建和强化学习奖励信号设计,这些模型在任务规划、工具调用和复杂决策以及反思等agent能力上表现出色,能够轻松胜任深度搜索、Excel操作、旅行攻略规划等任务。此外,模型原生长上下文窗口达到了256k,意味着模型可以一次性记住并处理相当于40万中文汉字或50万英文单词的超长内容,相当于一口气读完3本《哈利波特》小说,并且能记住所有人物关系和剧情细节,还能根据这些内容讨论后续故事发展。

在部署方面,这四个模型均只需单卡即可部署,部分PC、手机、平板等设备可直接接入。模型具有较强的开放性,主流推理框架(例如,SGLang,vLLM和TensorRT-LLM)和多种量化格式均能够支持。

应用层面,这四款小尺寸模型能够满足从端侧到云端、从通用到专业的多样化需求,并且已经在腾讯多个业务中应用,其可用性和实用性经过了实践的检验。例如,依托模型原生的超长上下文能力,腾讯会议AI小助手、微信读书AI问书AI助手均实现对完整会议内容、整本书籍的一次性理解和处理。在端侧应用上,腾讯手机管家利用小尺寸模型提升垃圾短信识别准确率,实现毫秒级拦截,隐私零上传;腾讯智能座舱助手通过双模型协作架构解决车载环境痛点,充分发挥模型低功耗、高效推理的特性。

官网体验地址:https://hunyuan.tencent.com/modelSquare/home/list

【Github】

Hunyuan-0.5B:GitHub - Tencent-Hunyuan/Hunyuan-0.5B

Hunyuan-1.8B:https://github.com/Tencent-Hunyuan/Hunyuan-1.8B

Hunyuan-4B:https://github.com/Tencent-Hunyuan/Hunyuan-4B

Hunyuan-7B:https://github.com/Tencent-Hunyuan/Hunyuan-7B

【HuggingFace】

Hunyuan-0.5B:https://huggingface.co/tencent/Hunyuan-0.5B-Instruct

Hunyuan-1.8B:https://huggingface.co/tencent/Hunyuan-1.8B-Instruct

Hunyuan-4B:https://huggingface.co/tencent/Hunyuan-4B-Instruct

Hunyuan-7B:https://huggingface.co/tencent/Hunyuan-7B-Instruct

  • 相关推荐
  • AI日报:Wan 2.2-S2V模型即将发布;​字节跳动内测3D Model Generator;微软开源 VibeVoice-1.5B 模型

    本期AI日报聚焦多项技术突破:阿里通义万相发布Wan 2.2-S2V模型,实现视频音频同步生成;字节跳动研发3D模型生成工具,降低建模门槛;面壁智能推出MiniCPM-V4.5端侧多模态模型;苹果提出RLCF训练法提升模型性能;微软开源VibeVoice-1.5B支持超长语音合成;谷歌Imagen 4正式上线;英伟达发布Jetson Thor机器人计算平台;Genspark推出AI Designer一键生成品牌方案;豆包上线未成年人保护模式。

  • AI日报:腾讯混元开源Hunyuan-GameCraft;最强图像编辑器nano-banana发布;字节开源Agent专用模型 M3-Agent-Control

    本文介绍了AI领域最新动态:1)腾讯开源Hunyuan-GameCraft框架,可快速生成高质量游戏视频;2)Nano-Banana模型在图像编辑领域超越FLUX+Kontext;3)字节开源基于Qwen 3 32B的328亿参数M3-Agent-Control模型;4)Kimi将推出PPT生成功能;5)阿里1688将上线"诚信通AI版"会员服务;6)苹果智能家居中心推迟至2026年发布;7)万兴科技接入GPT-5;8)全球AI独角兽达498家,总估值2.7万亿美元;9)谷歌为Slides和

  • OpenAI的开源模型现已在IBM watsonx.ai上提供

    OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B,允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台,采用专家混合架构,支持本地或云端部署,不受商业用途限制。模型具备高透明度,输出完整推理链,在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态,IBM强调其开放战略,为企业提供灵活、安全的AI开发选择。

  • 泡泡玛特不止一个LABUBU

    不可否认,在本周举办的泡泡玛特中期业绩发布会上,LABUBU依然是最引人瞩目的话题中心。THE MONSTERS系列2025H1收入达到48.1亿元,同比增长668%,新品MINI LABUBU即将发售的消息也在海内外社媒引发巨大反响。 尽管位列所有IP第一,THE MONSTERS系列在总收入中的占比也刚刚接近35%。2025年H1,泡泡玛特自有IP中有5个收入超10亿,收入过亿的IP更是达到13个,这其中有MOLLY这样历经十数年的�

  • B站要变成AI站

    互联网平台都在跟AI结合,B站没有成为例外。从新一季度财报来看,B站的AI味儿也越来越浓了。 8月21日,B站公布第二季度业绩,总营收达73.4亿元人民币,同比增长20%。其中,游戏业务收入为16.1亿元,同比增长60%,广告业务收入为24.5亿元,同比增长20%。由此推动B站毛利率从去年同期的29.9%提升至36.5%,调整后净利润达到5.6亿元,创下历史最好成绩。 从整体来看,B站生态集聚

  • 腾讯Kuikly框架进一步开源,新增支持Web,开启一码五端新体验!

    腾讯开源的跨端开发框架Kuikly基于Kotlin Multiplatform技术,新增Web版支持H5和微信小程序。相比主流跨端方案,Kuikly Web版采用DOM渲染,包体积仅463KB,加载速度快,兼容性好,支持SEO优化。已在腾讯多款业务中应用,日活用户超5亿。未来将持续优化性能,探索WASM技术,并计划开源Electron适配版本。

  • 泡泡玛特王宁:本周将发布迷你版LABUBU

    昨日,泡泡玛特公布了其2025年中期业绩报告,数据显示,报告期内公司收益高达138.76亿元,与去年同期相比增长了204.4%,业绩表现十分亮眼。 在今日举行的泡泡玛特2025年中期业绩会上,创始人兼CEO王宁对公司未来发展充满信心。他透露,原本公司希望今年营收能够达到200亿,但就目前情况来看,实现300亿的营收目标也颇为轻松。

  • AI日报:钉钉十周年发布8.0版本;微信悄悄上线AI播客;阿里开源 Mobile-Agent 3

    AI日报栏目聚焦人工智能领域最新动态。钉钉发布8.0版本推出AI办公应用钉钉ONE,通过自然语言交互简化工作流程;阿里开源Mobile-Agent-v3跨平台代理框架;微信测试AI播客功能,实现双人对话式新闻播报;钉钉推出首款AI硬件录音笔DingTalk A1;苹果拟为Siri引入谷歌Gemini大模型;苹果发布适配版SlowFast-LLaVA模型提升长视频分析性能;Meta获得Midjourney技术授权加强AI图像生成竞争力;谷歌Drive新增Vids视频编辑功能降低制作门槛;夸克发布健康大模型通过12学科主治医师测评;AI小游戏Draw A Fish凭借极简设计引发全球热潮。

  • 王宁掏出迷你版LABUBU

    “这周就要发布Mini版LABUBU,以前可能大家是挂在包上,可能从下周开始,大家甚至可以挂在手机上,它的使用场景会更多,相信它会是一个超级受欢迎的爆款。” 8月20日,在泡泡玛特2025年中期业绩发布会上,泡泡玛特董事长兼CEO王宁化身“带货博主”,从胸前西装口袋中拿出了一个Mini版LABUBU介绍道。 这款即将登场的 Mini 版 LABUBU 仅有掌心大小,延续了LABUBU标志性的搪胶毛�

  • 中国UP主成为不了MrBeast

    影视飓风创始人Tim刚刚结束的“100小时荒岛直播挑战”,无疑是一次B站在这个夏天难得的现象级事件——B站累计超过四千万观众进入直播间,全平台总观看量超过两亿,弹幕数以百万计,甚至带动了直播带货的即时转化。 从数据到热搜,此次直播堪称完美演绎了“爆款”的逻辑。 质疑声同样随之而来:这场直播与其说是“荒岛生存”,不如说是“带电度假”;也评论认为,它

今日大家都在搜的词:

热文

  • 3 天
  • 7天