首页 > 热点 > 关键词  > 正文

智谱AI发布MathGLM数学模型 算术任务性能优于GPT-4

2023-09-25 08:22 · 稿源:站长之家

站长之家(ChinaZ.com)9月25日 消息:近日,智谱AI发布MathGLM数学模型,旨在增强大模型在数学推理方面的性能。它能够精确计算算术运算,包括基础算术运算和复杂混合运算,并提升模型的中文数学解决能力。

研究表明,20亿参数的 MathGLM 模型在算术任务上表现出卓越的性能,准确率几乎可以达到100%,优于 GPT-4。

微信截图_20230925082352.png

此外,以 GLM-10B 为基座模型训练得到的 MathGLM-10B 模型在解决中文数学应用题方面也取得了接近 GPT-4的性能。

MathGLM 还在解决不同年级数学问题和数学应用题上进行了实验,取得了较好的结果。

论文链接:https://arxiv.org/abs/2309.03241

Github链接:https://github.com/THUDM/MathGLM

模型下载:https://modelscope.cn/models/ZhipuAI/MathGLM

举报

  • 相关推荐
  • 智谱,大力出AI

    智谱和MiniMax的两份财报共同说明了一个问题:国产大模型上市是起点,而非终点。 一向以对标OpenAI为荣的智谱,在昨晚业绩会上180度大转弯,重新给自己贴上了标签——“中国的Anthropic”。 原因无他,一张资产报表揭露了智谱上市的真相。截至2025年末,智谱负债净额高达81.1亿元,已经陷入了资不抵债的境况,若无上市注资,生存都可能成为问题。从这个意义上来说,年初的

  • ATH变阵两周,阿里AI体系化开启“日更”节奏

    半个月前,阿里巴巴成立Alibaba Token Hub(ATH)事业群,外界的关注还停留在组织调整、人员变动、战略磨合这类问题上。没人会想到,这个新生的事业群已在本周以“日更”的方式三连发新模型。 3月30日,阿里发布千问新一代全模态大模型Qwen3.5-Omni,新模型在音视频理解、识别、交互等215项任务中取得SOTA表现。两天之后,又发布了图像生成与编辑统一模型Wan2.7-Image,此次更新

  • 阿里ATH推出AI开发工具秒悟Meoo

    4月15日,阿里ATH事业群推出首款AI开发工具“Meoo”(秒悟)。该工具集成千问、Kimi、GLM、MiniMax四大国内顶尖模型,用户仅需用自然语言描述想法,即可快速生成包含前后端完整代码的网站或H5页面,并支持在阿里云一键部署上线。Meoo内置数据库、存储等核心产品,无需繁琐配置,极大提升开发效率。其创新的蜂群Agent模式支持多任务并行处理,简单应用生成时间低至1分钟。即

  • AI日报:阿里推开放世界模型Happy Oyster;Claude Opus 4.7即将发布;腾讯开源混元3D 世界模型2.0

    本期AI日报聚焦多领域进展:阿里巴巴推出开放世界模型Happy Oyster,支持实时交互;腾讯开源混元3D世界模型2.0,可一键生成可编辑3D资产;谷歌发布Gemini-TTS模型,支持近70种语言,语音更自然;蚂蚁灵波科技开源LingBot-Map,实现单摄像头实时三维重建。同时关注Anthropic即将发布Claude Opus 4.7及AI设计工具,以及湖南广电AI转型成果。安全方面,报告揭示MCP协议漏洞或致超20万台AI服务器面临风险,而OpenAI更新Agents SDK,引入沙箱功能以提升智能代理安全性。

  • 上线华为云!智谱最新模型GLM-5.1:支持8小时自主长程任务 多产品体验

    智谱AI近日发布新一代旗舰模型GLM-5.1,其Day0”版本在发布当天即正式上线华为云平台。 模型在长程任务处理上实现重大突破,单次自主持续工作长达8小时,并交付完整工程级成果。 智谱GLM-5.1在华为昇腾算力上通过Layer级MOE绝对均衡、框架优化专家Token产出均衡,并结合昇腾Attention算子与推理框架硬件协同优化,大幅提升算力均衡和HBM访存能力,经华为云系统级加速后整体推

  • 腾讯云发布 Token 防刷解决方案,精准狙击大模型黑产

    随着AI编程助手普及,开发者效率提升,但免费Token成为黑产套利目标。黑产通过批量注册、虚拟环境等手段薅取Token,用于倒卖或生成内容牟利。腾讯云天御Token防刷方案从入口验证到全链路风控,通过设备指纹识别批量注册和伪装行为,并对Token发放、流转、消耗全环节布控,确保补贴流向真实用户。该方案支持极简接入,规则秒级热更新,有效打击规模化黑产作业,保护企业营销预算与利润。

  • 智谱让微信支付宝躺赢了

    ​最近几天,X上的一些AI博主,突然开始提及一个与AI不相关的问题:怎么注册支付宝/微信支付等中国支付工具。 这个看似和AI不相关的讨论,起源于一个智谱GLM Coding Plan用户的吐槽:同样的Max套餐,中国用户的费用是469元每月,约合68美元每月,而海外用户则要160美元每月,贵了一倍还多。

  • 与谷歌Genie 3竞争!阿里发布世界模型HappyOyster

    今日,阿里发布可实时构建和交互的世界模型产品HappyOyster(快乐生蚝),该模型基于原生多模态架构而建,支持多模态理解与音视频联合生成。 目前,HappyOyster可实现漫游(Wander)和导演(Direct)两大核心能力,用户可实时构建可互动、可演绎、可探索的AI数字世界。 用户生成的数字世界不仅能被完整保存,还能开放给其他用户进行二次创作。 据悉,该产品由阿里ATH创新�

  • AI日报:Claude Opus 4. 7发布;阿里开源 Qwen3.6-35B-A3B;Perplexity推出Mac端AI助手

    本期AI日报聚焦多领域技术进展:Anthropic发布Claude Opus 4.7,强调模型可靠性与任务执行稳定性;阿里开源MoE模型Qwen3.6-35B-A3B,以300亿激活参数实现高效编程能力;OpenAI升级Codex,增强Mac桌面操控与多智能体并行;Opera推出“浏览器连接器”,集成多款AI助手;英伟达Lyra2.0实现单图生成90米3D环境;谷歌Gemini接入个人相册推动图像生成个性化;Perplexity发布Mac端AI助手,支持系统级操作;iOS 27 Beta曝光多项Apple Intelligence功能,涵盖营养标签解析与智能照片管理。

  • 腾讯混元3D世界模型2.0发布 一句话生成3D资产

    今日,腾讯正式发布并开源混元3D世界模型2.0(HY-World 2.0)。 官方表示,该模型一句话就能生成3D资产,并直接导入到游戏制作或具身仿真引擎,实现真正的可玩、可用。 具体来说,用户完全不需要懂任何复杂的3D软件,只要像平时说话一样输入一句文字描述,或者直接上传一张图片,模型就能精准解析复杂的语义。 随后,它会一键生成混合了3D高斯泼溅(3DGS)与Mesh表征的�

今日大家都在搜的词: