首页 > AI头条  > 正文

智谱开源32B/9B 系列 GLM 模型,32B参数媲美DeepSeek R1,速度快8倍

2025-04-15 10:52 · 来源: AIbase基地

备受瞩目的国内人工智能企业智谱华章(以下简称“智谱”)近日正式宣布,开源其新一代 GLM 系列大语言模型

此次开源力度空前,不仅包含 32B 和9B 两种参数规模的模型,更涵盖了 基座模型、推理模型以及代表未来探索方向的沉思模型。所有开源模型均遵循 宽松的 MIT 许可协议,为开发者提供了极大的自由度和商业应用的可能性。

与此同时,该系列模型已通过智谱全新平台 Z.ai 免费开放体验,并同步上线 智谱 MaaS 平台 (bigmodel.cn)

开源赋能:技术普惠与创新加速

本次智谱开源的 GLM 模型系列,最引人注目的便是其开放的态度。所有模型均采用 MIT 许可协议,允许免费用于商业用途和自由分发。这意味着开发者可以更便捷地获取和使用先进的大语言模型技术,无需担心授权问题,从而极大地降低了 AI 应用的门槛,有望加速各行各业的智能化进程。

智谱此次开源了 9B 和32B 两种尺寸的模型,包括各自的 基座模型、推理模型和沉思模型。不同规模的模型可以满足开发者在不同资源和应用场景下的需求,提供了更灵活的选择。

QQ_1744685328694.png

性能跃升:小参数迸发大能量

本次发布的核心亮点之一,便是 32B 参数的推理模型 GLM-Z1-32B-0414 的卓越性能。据官方数据,该模型在部分任务上 性能媲美 DeepSeek-R1等拥有671B 参数的顶尖模型。更令人惊喜的是,其 实测推理速度可达200Tokens/秒 (在 MaaS 平台 bigmodel.cn),堪称 目前国内商业模型中最快。此外,其 价格仅为 DeepSeek-R1的1/30,展现了极高的性价比。

QQ_1744685346654.png

基座模型方面,GLM-4-32B-0414拥有320亿参数,其性能也足以 与国内外更大参数量的主流模型相媲美。该模型利用 15T 高质量数据进行预训练,特别融入了丰富的推理类合成数据,为后续的强化学习打下了坚实基础。在后训练阶段,模型还通过人类偏好对齐、拒绝采样和强化学习等技术,重点提升了在 指令遵循、工程代码生成、函数调用 等智能体任务关键能力。

实际应用中,GLM-4-32B-0414在工程代码、Artifacts 生成、函数调用、搜索问答及报告撰写等任务上均表现出色,部分 Benchmark 指标甚至 接近甚至超越 GPT-4o、DeepSeek-V3-0324(671B) 等更大模型 的水平。值得一提的是,Z.ai 平台的对话模式还内建了 预览功能,支持对生成的 HTML 和 SVG 进行可视化查看,方便用户评估和迭代优化。

推理模型 GLM-Z1-32B-0414 在 GLM-4-32B-0414的基础上,采用了 冷启动与扩展强化学习策略,并针对 数学、代码、逻辑等关键任务进行了深度优化训练

因此,其 数理能力和复杂问题解决能力得到显著增强。通过在 AIME24/25、LiveCodeBench、GPQA 等基准测试中的评估,GLM-Z1-32B-0414展示了 较强的数理推理能力,能够支持解决更广泛的复杂任务。

QQ_1744685369487.png

令人惊喜的是,智谱还推出了 9B 参数的推理模型 GLM-Z1-9B-0414。尽管参数量较小,但得益于相同的技术和训练方法,该模型在 数学推理及通用任务上依然表现出色,整体性能已跻身同尺寸开源模型的领先水平。这为需要在 资源受限场景下进行轻量化部署 的用户提供了强有力的选择。

前沿探索:沉思模型引领未来

本次发布的另一亮点是 沉思模型 GLM-Z1-Rumination-32B-0414。智谱将其定位为对 AGI 未来形态的下一步探索。与一般推理模型不同,沉思模型通过 更多步骤的深度思考来解决高度开放与复杂的问题

其关键创新在于,它能在深度思考过程中 整合搜索工具处理复杂任务,并运用多种规则型奖励机制来指导和扩展端到端的强化学习训练。该模型支持 “自主提出问题—搜索信息—构建分析—完成任务”的完整研究闭环,从而在 研究型写作和复杂检索任务 上的能力得到了显著提升。用户现在可以通过 Z.ai 平台体验其强大的深度调研能力。

全新平台与 API 服务:便捷易用触手可及

为了方便用户体验和使用这些全新的模型,智谱启用了 全新域名 Z.ai。该平台 整合了32B 基座、推理、沉思三类 GLM 模型,作为智谱最新模型的交互体验入口。

QQ_1744685294243.png

除了免费体验平台,智谱 MaaS 开放平台 (bigmodel.cn) 也 同步上线了基座和推理两类模型的 API 服务,面向企业与开发者提供支持。上线的基座模型提供 GLM-4-Air-250414(免费) 和 GLM-4-Flash-250414两个版本。推理模型则提供 GLM-Z1-AirX (极速版,200tokens/秒)、GLM-Z1-Air (高性价比版,价格仅为 DeepSeek-R1的1/30) 和 GLM-Z1-Flash (免费版) 三个版本,以满足不同场景的需求。

QQ_1744685410268.png

  • 相关推荐
  • AI日报:智谱开源32B/9B系列GLM模型并启用Z.ai域名;OpenAI发布GPT-4.1系列模型;阿里魔搭上线MCP广场

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱AI启用全新域名Z.ai 并开源32B/9B 系列 GLM 模型智谱技术团队近期宣布开源32B和9B系列的GLM模型,并推出全新交互体验平台Z.ai。这些模型遵循MIT许可协议,支持商业用途,提升了

  • DeepSeek上新!开源发布DeepSeek-Prover-V2-671B模型

    快科技4月30日消息,今日,DeepSeek 今日在 AI 开源社区 Hugging Face 发布了一个名为 DeepSeek-Prover-V2-671B 的新模型。据介绍,DeepSeek-Prover-V2-671B 其参数量达到6710亿,使用了更高效的 safetensors 文件格式,并支持 BF16、FP8、F32 等多种计算精度,方便模型更快、更省资源地训练和部署。在模型架构上,该模型使用了DeepSeek-V3架构,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。同时支持超长上下文,最大位置嵌入达163840,使其能处理复杂的数学证明,并且采用了FP8量化,可通过量化技术减小模型大小,提

  • 《流浪地球3》自研AI问答应用WEi:基于DeepSeek R1开发

    快科技4月15日消息,今日,电影《流浪地球 3》官宣开机,导演郭帆,吴京、沈腾等主演参加开机仪式。在开机仪式上,吴京表示,希望自己在戏里能多演喜剧,沈腾多演动作戏。据新浪电影官微,《流浪地球3》开机现场还介绍了一位新同事”自主研发的专属AI问答应用WEi。WEi基于国产大模型DeepSeek R1开发,通过整合多元化知识库资源,包括在线信息源的专业资料、图像和影视�

  • 实锤了,Llama 4重测排名掉至32名!远不及DeepSeek和Qwen

    LMArena更新了Meta最新发布的开源大模型Llama-4-Maverick的排名,从此前的第2名,直线掉到了第32名!这也实锤了此前开发者对Meta为刷榜排名向LMArena提供了“特供版”的Llama4大模型的质疑。开源版同款Llama-4-Maverick-17B-128E-Instruct在LMArena的排名为32名,远低于Gemini2.5Pro、GPT4o、DeepSeek-V3-0324、DeepSeek-R1、Qwen2.5-Max,甚至连英伟达基于上一代Llama3.3改造的Llama-3.3-Nemotron-Super-49B-v1都不如。

  • 科大讯飞星火X1“火箭”升级:性能对标OpenAI o1DeepSeek R1

    今日,科大讯飞高级副总裁于继栋在上海AI无界智营全球”2025科大讯飞全球智能营销产品发布会上透露,讯飞星火X1将于近期再次升级。升级后的讯飞星火X1在保持原有数学任务国内领先优势的基础上,推理能力、文本生成和语言理解等通用任务方面的效果将对标业界领先的OpenAIo1和DeepSeekR1模型。科大讯飞曾宣称:这一新版本的发布,预期就可以实现数学答题和过程思维链能力全面对标甚至超过OpenAIo1。

  • 深度deepin 23.1正式发布!AI默认引擎切换至DeepSeek、修复超百项问题

    快科技4月16日消息,今天,深度操作系统宣布,deepin 23.1版本已正式发布。此版本聚焦于解决基础组件更新后的安装效率问题,大幅提升新用户安装体验,同时集成多项功能优化与问题修复,进一步优化系统使用。本次版本的重点改进包括内核优化、AI 默认引擎切换至DeepSeek、修复超百项用户反馈问题等,具体重点改进如下:硬件兼容性与内核优化:集成6.6/6.12内核更新、NVIDIA显卡驱动升级、Intel/AMD CPU微码更新,全面提升硬件支持与底层性能;核心功能增强:DDE新增智能镜像源管理、紧凑模式入口,全局搜索支持离线自然语言与AI处理能力;?

  • DeepSeek带飞寒武纪

    寒武纪凭借AI芯片业务实现扭亏为盈,2024年首次实现上市后盈利,2025年Q1营收11.11亿元同比暴增4230%,净利润3.55亿元。这家曾连亏8年、累计亏损54亿元的"中国版英伟达",因美国对H20芯片出口管制获得市场红利,但客户集中度过高(前五大客户贡献94.63%营收)和现金流波动仍是隐忧。当前国产芯片迎来发展机遇,华为昇腾、壁仞等企业纷纷抢占市场,行业竞争日趋激烈。

  • DeepSeek红利耗尽后,元宝拿什么和豆包斗?

    短短60天内,中国AI原生应用下载排行榜的位次排名,就三易其主。最新情况是,截至4月15日中午,中国区苹果应用商店免费APP下载排行榜上,豆包再次超越DeepSeek,位列第二,紧随其后的DeepSeek被挤到了第三的位置,腾讯元宝则滑落到了第七名。2月13日,作为首家在C端主力产品中接入DeepSeek-R1满血版的元宝,一度趁着DeepSeek东风崛起:3月3日力压DeepSeek和豆包,首度登顶。但好景�

  • DeepSeek的极致谄媚,正在摧毁我们的判断力。

    昨天别人给我发了一个很好玩的帖子。就是如果你问DeepSeek一个问题:“北京大学和清华大学哪个更好,二选一,不需要说明理由”DeepSeek在思考了15秒之后,会给出答案。

  • DeepSeek领航大模型普惠化浪潮,xAI/微美全息加速开源AI布局打造新格局

    DeepSeek 作为当前最受关注的大模型之一,凭借其技术创新正在加速 AI 普惠化进程。根据机构新报告显示,DeepSeek已经成为全球增长最快的AI工具,其每月新增网站访问量已经超过OpenAI的ChatGPT。DeepSeek市场份额全球第三目前,DeepSeek市场份额6.58%,仅次于ChatGPT和Canva。DeepSeek是继ChatGPT之后的又一现象级AI产品,它的市场份额从2.34%快速增长至6.58%,展现出强劲的增长态势。全球著名�

今日大家都在搜的词:

热文

  • 3 天
  • 7天