首页 > AI头条  > 正文

智谱发布GLM-5.1:SWE-bench评分全球领跑,模型单价上调10%

2026-04-08 10:44 · 来源: AIbase基地

近日,智谱正式发布全新大模型GLM-5.1。伴随新品上线,模型聚合平台OpenRouter监测显示,智谱GLM全线提价10%。此次调价后,GLM-5.1在Coding(编程)等核心场景的缓存命中Token价格已基本锚定Anthropic旗下Claude3.5Sonnet。这是国产大模型在经历早期“价格战”后,首次在主流应用场景实现与全球顶尖厂商的价格对齐,标志着行业竞争重心已从成本倾销转向性能溢价。

技术表现上,GLM-5.1在衡量专业软件开发能力的SWE-bench Pro基准测试中刷新世界纪录,超越了此前领先的Claude4.6Opus,位居国产及开源模型首位。不同于当前主流的分钟级交互逻辑,GLM-5.1具备极强的自主工程能力,能够在单次任务中持续工作长达8小时。在长时作业过程中,该模型可独立完成规划、执行与测试,并具备主动切换策略与自行修复错误的能力,能够直接交付完整的工程级成果。

受此消息影响,智谱股价于8日上午一度大涨14.12%,报890元/股,公司总市值攀升至3964亿元。从一年前降价90%争夺份额,到如今凭借技术优势对标国际基准,智谱的战略转型反映出头部国产厂商正试图通过解决复杂任务的“长航时”能力,重塑全球AI市场的价值分配格局。

  • 相关推荐
  • 上线华为云!智谱最新模型GLM-5.1:支持8小时自主长程任务 多产品体验

    智谱AI近日发布新一代旗舰模型GLM-5.1,其Day0”版本在发布当天即正式上线华为云平台。 模型在长程任务处理上实现重大突破,单次自主持续工作长达8小时,并交付完整工程级成果。 智谱GLM-5.1在华为昇腾算力上通过Layer级MOE绝对均衡、框架优化专家Token产出均衡,并结合昇腾Attention算子与推理框架硬件协同优化,大幅提升算力均衡和HBM访存能力,经华为云系统级加速后整体推

  • 国产AI大模型GLM-5.1登顶开源第一:可独立编程8小时

    3月底智谱正式推出了GLM-5.1大模型,编程能力评分45.3分,号称比全球最强的Opus 4.6只低了2.6分。 前两天GLM-5.1大模型也正式开源,也深受开发者喜爱,现在最新的排名也来了全球权威AI评测平台LMArena(百万用户参与盲测)更新Code Arena专项榜单,GLM-5.1登顶全球开源模型第一,位列全球模型第三。 除了榜单表现优秀,根据智谱的说法,GLM-5.1不仅继承了上一代模型的开源SOTA编码能

  • GLM-5.1之后Minimax 2.7正式开源:顶级国产AI就等DeepSeek V4了

    稀宇科技旗下Minimax 2.7大模型已开源,编程能力大幅提升,性能接近Claude Opus和GPT-4 Pro,但价格更低。国产开源大模型已占据全球主要份额,头部包括阿里Qwen、智谱GLM、稀宇Minimax及备受关注的DeepSeek。目前GLM-5.1和Minimax 2.7均已开源,而DeepSeek V4预计4月下旬发布,将全面支持国产AI硬件系统,原生支持多模态,并有望在AI编程方面带来惊喜。

  • 再夺全球第一!百度伐谋Agent 2.0登顶MLE-Bench

    百度智能云的伐谋Agent 2.0又拿下一个世界级第一,在机器学习工程权威基准MLE-Bench上登顶,还刷新了最好成绩。 这个评测是OpenAI主导设立的,里面有75个来自Kaggle的真实工程难题,专门考验AI在数据准备、模型训练、实验运行等全流程的实战能力。 最新结果显示,在统一标准下,伐谋Agent 2.0在高难度任务上表现突出,综合得分超过了搭载Claude-Opus-4.6等主流大模型的同类智能体

  • 百度百舸 x 昆仑芯助力GLM-5.1规模化应用 百度智能云打造国产算力基础设施

    4月8日,智谱开源新一代大模型GLM-5.1,整体能力全面提升。在代码能力上,GLM-5.1在SWE-bench Pro基准测试中超越GPT-4o、Claude 3 Opus,刷新全球最佳成绩。此外,GLM-5.1在长程任务处理能力上实现显著突破,可在单次任务中持续、自主工作长达8小时,交付完整的工程级成果。百度百舸基于昆仑芯硬件平台第一时间完成GLM-5.1的模型适配与集群部署,助力最新开源大模型快速投入生产环境的大规模应用。

  • 智谱发布GLM-5V-Turbo模型:编程告别纯文本 一张图片就能生成代码

    智谱AI于4月2日发布GLM-5V-Turbo多模态编程模型,专为视觉编程打造。该模型深度融合视觉与文本能力,能看懂设计稿、截图、网页界面并生成可运行代码,实现“看得懂画面、写得出代码”。其三大核心特性包括:原生多模态编程基座,支持图片、视频、设计稿等多模态输入;兼顾视觉与编程能力,在多模态编程、GUI+Agent等基准上表现领先;深度适配Claude Code与龙蜥场景,可实现环境规划与动作执行的完整闭环。实测显示,该模型在设计稿还原、视觉代码生成等任务中表现优异,在AndroidWorld、WebVoyager等GUI操控测试中同样突出,纯文本编程能力稳定。目前已落地图像即代码、龙蜥视觉赋能等典型场景。

  • 智谱,大力出AI

    智谱和MiniMax的两份财报共同说明了一个问题:国产大模型上市是起点,而非终点。 一向以对标OpenAI为荣的智谱,在昨晚业绩会上180度大转弯,重新给自己贴上了标签——“中国的Anthropic”。 原因无他,一张资产报表揭露了智谱上市的真相。截至2025年末,智谱负债净额高达81.1亿元,已经陷入了资不抵债的境况,若无上市注资,生存都可能成为问题。从这个意义上来说,年初的

  • 全球首个影视行业大模型!PixVerse C1发布:最高1080P、15秒直出

    爱诗科技正式推出PixVerse C1,这是全球首个影视行业大模型,主打专业级视频生成,最高可直接输出1080P、15秒视频,还能做到音画同步、自动分镜,普通人也能快速做出影视级短片。 C1支持文生、图生、参考生成、首尾帧控制多种方式,不用复杂操作,按提示词就能自动完成分镜和剪辑,把创意一步变成成片。 多宫格分镜图可以直接转成连贯视频,自带专业镜头感,省去大�

  • AI日报:智谱发布GLM-5V-Turbo多模态Coding大模型;Seedance 2.0 API正式全量开放;美团 LongCat-AudioDiT 开源

    本期AI日报聚焦多领域进展:智谱发布GLM-5V-Turbo多模态编程模型,实现视觉与编程深度融合;字节跳动火山引擎开放Seedance 2.0视频生成API;美团开源LongCat-AudioDiT,刷新语音克隆SOTA;字节豆包大模型日消耗Token破120万亿,国产模型调用量持续增长;蚂蚁数科推出专业级AI智能体DTClaw;Anthropic测试常驻代理Conway,支持独立UI与Webhook;谷歌即将开源120B参数Gemma 4模型;通义实验室发布Qwen3.6-Plus,提升编程智能体稳定性。

  • 高管亲自放风 何刚暗示华为 WATCH FIT 5 Pro即将发布

    华为终端BG首席执行官何刚发布了一条微博:和新搭子骑车打个卡,配图中出现了HUAWEI WATCH FIT 5 Pro的名称,暗示新品即将发布。 目前华为官方尚未公布HUAWEI WATCH FIT 5 Pro的任何具体参数,不过前代产品的配置可以提供参考: 华为WATCH FIT 4 Pro智能手表发布于2025年5月,起售价2099元。 华为Watch Fit 4 Pro智能手表具备IP68防护等级和Class III安全标准,主打户外进阶运动场景,采用蓝宝

今日大家都在搜的词: