2月22日,春节假期期间,国内多家科技公司相继发布了新一代大型语言模型。其中,智谱公司推出的GLM-5模型引发了广泛关注。
根据官方介绍,GLM-5的核心升级方向聚焦于编程与智能体能力的强化。该模型参数量达到7440亿,约为上一代GLM-4.X系列的两倍,整体性能提升显著。
有海外技术评测显示,该模型在代理编程任务中表现突出,综合编程能力也位居全球前列。其发布后,由于访问需求激增,一度对计算资源造成压力,影响了部分用户体验。为此,智谱公司已公开致歉并公布了相应的补偿措施。
近日,智谱公司进一步公开了GLM-5的技术报告,详细阐述了驱动性能跃升的四大关键技术突破:
- 采用新型稀疏注意力机制: 该机制能够依据信息的重要性动态分配计算资源,从而在保持长文本理解与深度推理能力的同时,显著降低了模型训练与运行过程中的计算成本。这使得模型参数规模得以扩展至7440亿,并完成了28.5万亿标记(Token)的训练。
- 构建异步强化学习基础设施: 新基础设施实现了生成与训练过程的深度解耦,极大提升了硬件计算资源的利用率。该系统支持模型进行大规模的智能体轨迹探索,有效解决了以往制约迭代效率的同步瓶颈,让强化学习训练流程更加高效。
- 提出异步智能体强化学习算法: 新算法旨在全面提升模型的自主决策质量。与上一代技术相比,该算法使模型能够从更复杂、更长期的任务交互中持续学习,特别优化了在动态环境中的规划与自我修正能力,这被认为是其在实际编程应用中表现优异的技术基础。
- 全面适配国产计算生态: GLM-5从设计之初便致力于兼容国产硬件平台。智谱公司已完成从底层计算内核到上层推理框架的全栈优化,目前全面支持包括华为昇腾、摩尔线程、海光、寒武纪、昆仑芯、天数智芯与燧原在内的七大主流国产芯片平台。报告指出,在单台国产计算节点上,GLM-5的性能已可比肩由两台国际主流GPU组成的集群,且在处理长序列任务时,部署成本可降低约50%。
- 相关推荐
-
国产AI大模型GLM-5.1登顶开源第一:可独立编程8小时
3月底智谱正式推出了GLM-5.1大模型,编程能力评分45.3分,号称比全球最强的Opus 4.6只低了2.6分。 前两天GLM-5.1大模型也正式开源,也深受开发者喜爱,现在最新的排名也来了全球权威AI评测平台LMArena(百万用户参与盲测)更新Code Arena专项榜单,GLM-5.1登顶全球开源模型第一,位列全球模型第三。 除了榜单表现优秀,根据智谱的说法,GLM-5.1不仅继承了上一代模型的开源SOTA编码能
-
智谱发布GLM-5V-Turbo模型:编程告别纯文本 一张图片就能生成代码
智谱AI于4月2日发布GLM-5V-Turbo多模态编程模型,专为视觉编程打造。该模型深度融合视觉与文本能力,能看懂设计稿、截图、网页界面并生成可运行代码,实现“看得懂画面、写得出代码”。其三大核心特性包括:原生多模态编程基座,支持图片、视频、设计稿等多模态输入;兼顾视觉与编程能力,在多模态编程、GUI+Agent等基准上表现领先;深度适配Claude Code与龙蜥场景,可实现环境规划与动作执行的完整闭环。实测显示,该模型在设计稿还原、视觉代码生成等任务中表现优异,在AndroidWorld、WebVoyager等GUI操控测试中同样突出,纯文本编程能力稳定。目前已落地图像即代码、龙蜥视觉赋能等典型场景。
-
上线华为云!智谱最新模型GLM-5.1:支持8小时自主长程任务 多产品体验
智谱AI近日发布新一代旗舰模型GLM-5.1,其Day0”版本在发布当天即正式上线华为云平台。 模型在长程任务处理上实现重大突破,单次自主持续工作长达8小时,并交付完整工程级成果。 智谱GLM-5.1在华为昇腾算力上通过Layer级MOE绝对均衡、框架优化专家Token产出均衡,并结合昇腾Attention算子与推理框架硬件协同优化,大幅提升算力均衡和HBM访存能力,经华为云系统级加速后整体推
-
荐智谱,大力出AI
智谱和MiniMax的两份财报共同说明了一个问题:国产大模型上市是起点,而非终点。 一向以对标OpenAI为荣的智谱,在昨晚业绩会上180度大转弯,重新给自己贴上了标签——“中国的Anthropic”。 原因无他,一张资产报表揭露了智谱上市的真相。截至2025年末,智谱负债净额高达81.1亿元,已经陷入了资不抵债的境况,若无上市注资,生存都可能成为问题。从这个意义上来说,年初的
-
讯飞智能臂筒式血压计发布:AI大模型赋能,家庭血压监测迈入智慧时代
4月2日,科大讯飞旗下讯飞医疗发布首款搭载讯飞医疗星火大模型的智能血压计——讯飞智能臂筒式血压计。产品包含X3、X5、X7三款型号,主打双模精准测量、AI语音交互、远程数据同步等核心功能。这标志着家庭血压监测行业正从“单点测量”迈入“智慧管理”新阶段。该产品以星火医疗大模型为核心,依托语音交互、数据解读、趋势分析、健康指导的全链路能力,重构家用血压管理体验,让居家测量也能拥有与医院同等专业、可信的结果。讯飞智能臂筒式血压计预售首发优惠价格:X3首发价349元,X5首发价699元,X7首发价999元。
-
GLM-5.1之后Minimax 2.7正式开源:顶级国产AI就等DeepSeek V4了
稀宇科技旗下Minimax 2.7大模型已开源,编程能力大幅提升,性能接近Claude Opus和GPT-4 Pro,但价格更低。国产开源大模型已占据全球主要份额,头部包括阿里Qwen、智谱GLM、稀宇Minimax及备受关注的DeepSeek。目前GLM-5.1和Minimax 2.7均已开源,而DeepSeek V4预计4月下旬发布,将全面支持国产AI硬件系统,原生支持多模态,并有望在AI编程方面带来惊喜。
-
荐AI日报:智谱发布GLM-5V-Turbo多模态Coding大模型;Seedance 2.0 API正式全量开放;美团 LongCat-AudioDiT 开源
本期AI日报聚焦多领域进展:智谱发布GLM-5V-Turbo多模态编程模型,实现视觉与编程深度融合;字节跳动火山引擎开放Seedance 2.0视频生成API;美团开源LongCat-AudioDiT,刷新语音克隆SOTA;字节豆包大模型日消耗Token破120万亿,国产模型调用量持续增长;蚂蚁数科推出专业级AI智能体DTClaw;Anthropic测试常驻代理Conway,支持独立UI与Webhook;谷歌即将开源120B参数Gemma 4模型;通义实验室发布Qwen3.6-Plus,提升编程智能体稳定性。
-
国产编程模型新王诞生!阿里Qwen3.6-Plus正式发布
阿里千问今天正式发布新一代大语言模型Qwen3.6-Plus,这也是当下编程能力最强的国产模型。 在核心能力上,千问3.6较上一代进步明显,在系列编程能力权威评测中,编程表现超越GLM-5、Kimi-K2.5等参数量达其2至3倍的国产模型,接近全球最强编程模型Claude系列水平。 在SWE-bench真实编程任务、Terminal-Bench2.0终端编程、NL2Repo长程编程任务,以及Claw-Eval、QwenClawBench等Agent能力评测中,
-
千问3.6正式发布:最强编程国产模型 接近Claude
今天,千问发布新一代大语言模型Qwen3.6-Plus。 千问3.6整体性能较3.5进步显著,具备极强的智能体编程能力,在系列编程能力权威评测中,千问3.6成为当下编程能力最强的国产模型,接近全球最强编程模型Claude系列。 在前端网页开发、仓库级复杂任务等实测场景中,千问3.6可自主拆解任务、规划路径、测试修改直至任务完成。 Qwen3.6-Plus展现出卓越的工程落地能力,不仅能实�
-
小龙虾有更便宜的Token了 国产大模型MiniMax 2.7确认本周开源
最近小龙虾OpenClaw大热,大部分人主要的消耗还是Token词元费用,这也导致国产大模型异军突起,MiniMax 2.7就长期占据调用量前列。 MiniMax 2.7大模型发布有段时间了,但是一直没有开源的消息,现在官方在Huggingface社区终于透露了具体的计划,对OOS开发者表示歉意,称他们低估了开源所需的工作量,目前还在执行一些基础设施的适配工作,预计本周末发布MiniMax 2.7开源。
