2月23日,备受瞩目的科技企业智谱公司正式发布了其新一代基础模型GLM-5的详细技术报告。此举被视为对近期行业内部分质疑声音的正面回应,旨在全面展示其技术独立性与创新成果。
报告指出,GLM-5的研发目标,是推动软件开发模式从传统的“氛围编程”向更为系统化的“智能体工程”演进。该模型在多项关键技术上实现了突破。

报告详细阐述了支撑GLM-5性能跃升的四大核心技术:
首先,是全新的稀疏注意力机制(DSA)。该机制能够根据信息的重要性动态分配计算资源,从而在保持强大长上下文理解和深度推理能力的同时,显著降低了训练与推理过程的算力成本。基于此,模型参数规模得以扩展至7440亿,训练数据量也达到了28.5万亿标记。
其次,是构建了全新的异步强化学习基础设施。该设施在原有架构基础上,进一步实现了生成与训练过程的深度解耦,极大提升了硬件利用率。该系统支持模型进行大规模的轨迹探索,有效解决了以往制约迭代效率的同步瓶颈,使得强化学习训练流程更加高效。
第三,提出了创新的异步智能体强化学习算法。该算法使模型能够从多样化的长周期交互中持续学习,并针对动态环境下的任务规划与自我纠错能力进行了深度优化。这被认为是GLM-5在复杂实际编程场景中表现出色的关键原因。
第四,实现了对国产算力生态的全面兼容。智谱表示,GLM-5从设计之初便致力于适配中国本土的GPU生态。目前已完成从底层内核到上层推理框架的深度优化,全面支持华为昇腾、摩尔线程、海光、寒武纪、昆仑芯、天数智芯与燧原等七大主流国产芯片平台。通过与各芯片厂商的紧密合作,成功克服了硬件异构性带来的高性能部署挑战。
得益于上述软硬件协同优化,GLM-5在单台国产算力节点上的性能,已可比肩由两台国际主流GPU组成的计算集群。在长序列处理任务中,其部署成本更是降低了约50%。
报告中还特别提及了一次代号为“PonyAlpha”的匿名测试。智谱将GLM-5隐去品牌信息后,发布于国际开发者社区平台。测试结果显示,该模型在处理复杂代码、智能体任务链等方面展现出的能力引发了社区广泛讨论。根据社区用户的猜测统计,有相当一部分用户将其误认为是其他国际知名模型,最终其真实身份才得以揭晓。智谱认为,这次测试以纯粹的技术能力获得了社区的客观评价,是对其模型水平的一次有力证明。


报告援引行业观点指出,当前基础模型的发展正从辅助代码编写,迈向能够端到端完成大型复杂工程任务的阶段。GLM-5正是这一趋势下的产物,其定位更接近于“系统架构师”,旨在稳定交付生产级结果,而不仅仅是生成演示原型。
根据多项主流基准测试结果,GLM-5在编程能力上已达到行业领先水平,在部分开源模型评估榜单中位列第一。在内部评估中,其在前后端开发、长程任务规划与执行等系统工程任务上的表现,较前代模型有显著提升。
(举报)
