首页 > 业界 > 关键词  > ChatGLM最新资讯  > 正文

ChatGLM2-6B 发布 相比初代推理提速42%

2023-06-27 09:22 · 稿源:站长之家

站长之家(ChinaZ.com)6月27日 消息:GLM技术团队宣布升级ChatGLM-6B,并发布了ChatGLM2-6B。之前发布的ChatGLM-6B在3月14日上线,截至6月24日,其在Hugging Face的下载量已经超过了300万次。

截至6月25日,ChatGLM2模型在主要评估LLM模型中文能力的C-Eval榜单中以71.1的分数位居 Rank0;而ChatGLM2-6B模型则以51.7的分数排名第六,是榜单上开源模型的排名最高的。

人机大脑 人工智能 AI

项目地址:https://github.com/THUDM/ChatGLM-6B

ChatGLM2-6B是ChatGLM-6B的第二代开源中英双语对话模型。在保留初代模型对话流畅、部署门槛较低等优秀特性的基础上,ChatGLM2-6B引入了以下新特性:

1.更强大的性能:基于ChatGLM初代模型的开发经验,ChatGLM2-6B全面升级了基座模型。采用GLM混合目标函数,利用1.4T中英文字符预先训练和人类偏好对齐的训练,ChatGLM2-6B相较初代模型在多项数据集上展现出的性能提升:在MMLU(+23%)、CEval(+33%)、GSM8K(+571%)、BBH(+60%)等数据集上有大幅度提升,使其在同一大小的开源模型中具有竞争力。

2.更长的上下文:基于FlashAttention技术,项目团队将基座模型的上下文长度(Context Length)从ChatGLM-6B的2K扩展到32K,并在对话阶段使用8K的上下文长度训练,以便进行更多轮次的对话。但是目前ChatGLM2-6B对于单轮超长文档的理解能力尚有限,团队将在后续升级中对其进行优化。

3.更高效的推理:基于Multi-Query Attention技术,ChatGLM2-6B有更高效的推理速度和更低的显存占用,官方模型实现下,推理速度相比初代提升了42%,在INT4量化下,6G显存支持的对话长度提高到了8K。

4.更开放的协议:ChatGLM2-6B模型权重对学术研究完全开放,在官方的书面许可下,也允许商业使用。

评测结果

以下为 ChatGLM2-6B 模型在 MMLU (英文)、C-Eval(中文)、GSM8K(数学)、BBH(英文) 上的测评结果。

推理性能

ChatGLM2-6B 使用了 Multi-Query Attention,提高了生成速度。生成2000个字符的平均速度对比如下

Multi-Query Attention 同时也降低了生成过程中 KV Cache 的显存占用,此外,ChatGLM2-6B 采用 Causal Mask 进行对话训练,连续对话时可复用前面轮次的 KV Cache,进一步优化了显存占用。因此,使用6GB 显存的显卡进行 INT4量化的推理时,初代的 ChatGLM-6B 模型最多能够生成1119个字符就会提示显存耗尽,而 ChatGLM2-6B 能够生成至少8192个字符。

项目团队也测试了量化对模型性能的影响。结果表明,量化对模型性能的影响在可接受范围内。

示例对比

相比于初代模型,ChatGLM2-6B 多个维度的能力都取得了提升,以下是一些对比示例。

数理逻辑

知识推理

长文档理解

举报

  • 相关推荐
  • 迄今最先进的AI模型!ChatGPT-5具备博士级别的认知能力

    ChatGPT-5在多个领域表现出色,包括编程、数学、写作、健康和视觉感知等。 它具备增强的推理能力,能够根据对话类型选择最佳模型,并通过深度推理模型解决更具挑战性的问题。 OpenAI 表示,ChatGPT-5在知识工作方面表现卓越,其知识水平在40多种职业中均达到或超过专家水平,涵盖法律、物流、销售和工程等领域。 在基准测试中,ChatGPT-5 展现了出色的认知能力。 例如,�

  • Custouch市场易AI技术入选Topdigital2025全球AI营销图谱

    《TopDigital2025全球AI营销图谱》近日发布,Custouch市场易入选"内容智能生成"板块。该图谱为AI技术重构营销提供全链路产业地图,整合企业官网、学术报告、专利库等多维度信息。Custouch凭借AI技术在B2B营销领域的创新应用入选,其智能解决方案能有效满足企业实际需求。作为数字营销技术服务商,Custouch已为300+国际头部企业提供一站式营销管理体系,涵盖内容、活动、线索等全流程,助力企业实现高质量增长。此次入选既是对其AI成果的肯定,也是对其未来发展的激励。

  • 首款自研玄戒T1手表!REDMI Watch 5手表微信内测招募

    小米官方账号@玩转小米澎湃OS 发布了REDMI Watch 5内测特邀用户招募”。 据介绍,此次招募主要为了测试表端微信应用,可以实现手表端就能轻松回复消息,无需频繁拿出手机。 简洁界面适配手表屏幕,操作简单直观,支持在手表上回复文字、表情。 报名时间:2025年8月8日-8月10日 体验时间:2025年8月11日-8月15日

  • 谷歌Pixel Watch 4外观揭晓:41/45mm双尺寸、5款配色

    谷歌Pixel Watch 4智能手表的官方渲染图目前已提前曝光,此次Pixel Watch 4提供了41mm和45mm两种尺寸,以满足不同用户的需求。 其中,41mm版本拥有黑曜石、瓷器白、柠檬绿和鸢尾紫四种颜色,而45mm版本则提供黑曜石、瓷器白和月光石三种颜色。 从曝光的渲染图来看,Pixel Watch 4的设计延续了谷歌一贯的简约风格,同时在色彩搭配上更加大胆和时尚。

  • Checkout.com携手Visa推出发卡业务 (Card Issuing)

    Checkout.com与Visa达成战略合作,在英国及欧洲地区推出全方位发卡业务。通过Visa全球支付网络,商户可即时获取收款资金用于支付供应商款项,显著提升资金使用效率。该合作特别针对旅游业企业,解决其支付流程分散、资金周转慢的痛点。Checkout.com每年处理数千亿交易的技术能力与Visa网络结合,帮助商户消除预存资金需求,优化现金流管理。双方表示这将大幅提升欧洲商户运营效率,释放增长潜力。

  • 钛动科技亮相ChinaJoy2025,全球营销AI Agent赋能游戏出海新范式

    2025年ChinaJoy盛大开幕,铼动科技携全球首款营销AI+Agent产品Navos强势亮相。Navos通过AI技术覆盖营销全链路,提供出海营销解决方案。展会现场设置"星光奇遇展"和"出海加速站",展示智能营销云、创意生成引擎等创新产品。铼动还联合多家品牌推出互动打卡活动,吸引大量观众参与。线上直播同步进行,2.5小时获5.4万点赞。此次参展重点呈现AI赋能游戏出海的精细化、全球化服务能力,为行业带来"出海新曙光"。(140字)

  • 手机eSIM开放前兆!vivo WATCH 5全面恢复移动/联通eSIM

    种种迹象表明,国内的eSIM真要开放了。 前不久,OPPO Watch X2系列中国移动eSIM一号双终端业务正式上线,现在vivo也来了。 vivo官微今天发文宣布,vivo WATCH 5 eSIM版已全面恢复开通移动eSIM一号双终端,联通eSIM一号双终端、独立终端。

  • AI日报:阿里新发布Qwen3-4B模型;小红书发布开源模型dots.vlm1;MiniMax Speech 2.5语音生成模型上线

    AI日报栏目聚焦人工智能领域最新动态:1)阿里发布Qwen3-4B轻量级模型,手机端可运行;2)小红书开源多模态大模型dots.vlm1,在图表推理方面表现突出;3)MiniMax推出语音生成模型Speech2.5,多语种表现提升;4)Midjourney推出HD视频模式,提升专业影像质量;5)Cursor1.4版本增强异步任务处理能力;6)谷歌否认AI搜索影响网站流量,但数据显示用户行为改变;7)MiniCPM-V4.0开源发布,号称"手机上的GPT-4V";8)AMD与高通宣布支持OpenAI的gpt-oss系列模型;9)腾讯开源WeKnora文档智能解析工具;11)疑似GPT-5信息在GitHub泄露;12)FlowSpeech实现书面语转口语的TTS技术突破。

  • Razer(雷蛇)在新加坡设立AI CENTER OF EXCELLENCE,加速人工智能投资布局

    雷蛇宣布在新加坡设立全球AI卓越中心,并计划在欧洲和美国建立类似机构,推动游戏与开发者工具领域的创新。新加坡中心将招聘150名AI工程师,专注于下一代AI游戏技术研发。雷蛇还推出AI工具套件,包括Game Co-AI和QA Co-AI,帮助开发者提升游戏质量和开发效率。该战略布局正值全球游戏市场快速增长期,预计2033年AI游戏市场规模将达280亿美元。新加坡数字产业发展局表示,此举将巩固该国作为区域AI创新中心的地位。

  • 用三星Galaxy Watch8系列提升跑步水平 开启训练新体验

    文章介绍三星Galaxy Watch8系列智能手表如何帮助跑步爱好者科学训练。手表通过12分钟测试将用户跑步水平分为10个等级,并基于160多项个性化训练计划生成3-5周定制方案。它能实时监测配速、步频、摄氧量等数据,分析跑步姿势平衡性,提供配速提醒和姿势指导。升级的双频GPS系统精准记录跑步轨迹,间歇训练功能可设置高低强度交替锻炼。手表如同私人教练,帮助用户循序渐进提升耐力与速度,让跑步训练更科学高效。