6个AI大模型大战2025年高考数学新一卷：数学题推理能力均显著提升

2025-06-09 13:56 · 稿源：站长之家用户

近日，随着高考的圆满结束，一场别开生面的“数学擂台赛”在各大AI大模型间悄然展开。多家知名科技公司的大模型被邀请参与2025年数学新课标Ⅰ卷中的14道客观题测试，以此检验它们在逻辑推理和数学能力上的实力。此次测试题目包含8道单选题、3道多选题以及3道填空题，满分设定为73分，且测试过程严格遵循高考判分原则，确保结果的公正性与准确性。

测试成绩揭晓后，字节跳动的豆包和腾讯的元宝（T1）以68分的总成绩脱颖而出，并列第一，仅在第6道单选题上稍有失分。深度求索的DeepSeek和阿里的通义也表现不俗，分别获得63分和62分。然而，百度的文心X1Turbo在多选题和填空题上频繁失误，仅获得51分。尤为引人注目的是，OpenAI的o3在此次测试中表现欠佳，仅获得34分，正确率仅为47%，远低于其他模型。

微信截图_20250609135217.png

在单选题环节，豆包、通义、元宝和文心X1Turbo表现相当，均斩获35分。不过，DeepSeek因图片识别问题在两道单选题上失分，而o3更是在多道单选题上出现错误，甚至在“送分题”上栽了跟头。多选题部分，豆包、DeepSeek和元宝展现出了稳定的发挥，三道题全部答对。通义虽然解题速度快，但因步骤分析简略，导致在一道题上失误。文心X1Turbo在多选题上表现不佳，两道题答错，一道题未响应。o3则因不适应多选题规则，一道题都没能全对。填空题部分，豆包、DeepSeek、通义和元宝四家大模型均斩获满分，而文心X1Turbo因最后一步处理不当而失分。

尽管如此，与去年相比，今年大模型的数学推理能力有了显著提升。去年，大模型在高考数学题上的表现普遍不佳，甚至出现基础计算错误。而今年，除o3外，其他五款模型均突破及格线，豆包和元宝更是保持了93%的正确率。此外，大模型在反思能力和推理步骤上也展现出进步，遇到问题时不再固执己见，而是会推倒重来，进行验证。同时，除了通义外，其他大模型都能系统性地展示完整的推理链路，帮助用户深入理解问题本质。

对于想要了解更多AI大模型相关信息，或是寻找最适合自己的AI产品的用户，推荐访问AIbase产品库网站（https://top.aibase.com）。该网站致力于智能匹配最适合用户的AI产品和网站，帮助用户轻松找到满足需求的AI解决方案。网友们也对此次测试表示高度关注，纷纷留言讨论各大模型的表现，并对未来大模型的发展充满期待。

（举报）

相关推荐

关键词：

2025年高考数学新一卷上热搜：6个AI大模型宣布挑战谁更强？

近日，随着高考的落幕，一场别样的“高考”也在各大AI大模型之间展开。此次测试邀请了多家知名科技公司的大模型，参与2025年数学新课标Ⅰ卷中的14道客观题测试，以此检验它们在逻辑推理和数学能力上的表现。测试题目包括8道单选题、3道多选题和3道填空题，满分73分，测试过程严格遵循高考判分原则。测试结果显示，字节跳动的豆包和腾讯的元宝（T1）以68分的总成绩�

高考 AI大模型数学能力
高考数学霸榜热搜！男生第一个走出考场：数学题目太难了不会

今天下午，有关高考数学的微博话题霸占了热搜榜，引发热议。在海南某考点，一名男生第一个走出考场，还简单接受了媒体采访，称数学太难了，不会”。对于高考数学题目，有的学生答得非常不错，有的学生则表示太难。据了解，2025年高考数学命题遵循高校人才选拔要求和高中数学课程标准，依据高考评价体系，持续推进考试内容改革。更新设计理念，深化基础性考查

高考数学考试学生压力
2025年国补结束时间已确定！统一截止时间为2025年12月31日

国家发改委、财政部最新文件明确，2025年家电、手机数码、汽车三大领域的国家补贴（国补）全国统一结束时间为2025年12月31日。但需注意：河南、湖南等省份因补贴额度紧张，可能提前至12月中旬截止。消费者需抓住最后6个月红利期，避免错过"真金白银"福利。补贴细则：家电类最高补贴20%，手机数码类按售价15%补贴（最高500元），新能源汽车报废旧车最高补2万元。领取方式：京东APP搜索"家电省2000"或"数码省2000"直接立减。部分省份叠加地方券后综合补贴比例可达20%。建议尽早申请，尤其汽车置换补贴额度竞争激烈。

国家补贴家电补贴手机数码补贴
2025年京东618满减是哪天开始？2025年淘宝京东618红包领取口令是什么？

2025年618购物节攻略：京东淘宝两大平台推出"好运红包7788"通用口令，每日可领3次，最高免单25618元。京东活动分预热期（5.13-5.28）和正式期（5.31-6.20），数码家电享30天价保，iPhone16预计直降800-1500元。淘宝分两波活动，5.16-5.26现货直降15%，6.15-6.20跨店满减叠加直播红包。省钱技巧：1）优先领取平台红包；2）关注6.18当天0点/12点/20点的半价秒杀；3）满减券与品类券叠加使用；4）价保期内可申请补差价。建议消费者提前收藏商品，锁定核心优惠时段。

618购物狂欢京东活动淘宝规则
2025年京东淘宝天猫618红包口令是什么2025年618红包活动开始时间

2025年淘宝天猫618活动期间（5月15日-6月18日），用户每天可通过APP搜索口令"好运红包7700"领取红包，最高可得25888元超级红包及官方立减等优惠。京东618活动（5月13日-6月18日）则需搜索"红包到手755"领取京享红包和满减优惠。两大平台优惠券可叠加使用，通过安装【词令】APP输入口令"888"查询商品优惠券，享受更大折扣力度。活动期间各平台优惠力度将更大，建议用户及时领取使用。

淘宝618 天猫618 京东618
2025年国补结束时间已确定，国家补贴全国统一结束截止时间为2025年12月31日

2025年国家补贴政策进入倒计时，家电、手机、汽车等领域补贴将于12月31日截止。家电补贴覆盖12类产品，一级能效产品可享20%补贴；手机数码类最高补贴500元；新能源汽车最高补贴2万元。部分资金紧张地区可能提前结束，建议尽早申领。领取方式：京东APP搜索"数码2000"或"家电2000"直达补贴页面。江苏、广东等地叠加地方消费券后综合补贴可达20%。最佳购买时机为38节、618等大促节点，高端机型补贴力度更大。提醒消费者关注地方政策变动，优先选择官方渠道购买。

国家补贴家电补贴手机补贴
2025年淘宝京东天猫618红包领取活动入口口令及2025年618活动时间

2025年淘宝天猫618活动时间为5月15日至6月18日，用户可通过搜索口令"好运红包7700"领取红包，最高可得25888元超级红包。京东618活动时间为5月13日至6月18日，搜索"红包到手755"可领取红包，最高25618元京享红包。此外，用户可通过"草柴APP"领取优惠券和返利，在618期间购物可叠加跨店满减、官方立减等优惠。注意：红包与返利存在冲突，建议有返利的商品不使用红包，否则可能无法获得返利。

淘宝618 天猫活动红包领取
他趣发布《2025年中国青年彩礼研究报告》

《2025年中国青年彩礼调研报告》显示，当代青年对彩礼的认知呈现显著性别差异：女性对彩礼和嫁妆的预期普遍高于男性，其中彩礼平均比嫁妆高出3.4万元。67%男性认为10万元以内彩礼较合适，而42%女性预期11-20万元。外貌因素对女性收彩礼影响较大，漂亮女性被认为应多得3.8-4.2万元彩礼。33岁和36岁男性被普遍认为需支付更高彩礼。值得注意的是，34.3%青年认为5年内收入可覆盖结婚开支，但男性通过借贷筹备婚礼的比例是女性的2.5倍，折射出传统婚俗与现代价值观的碰撞及男性更大的经济压力。

彩礼调查青年婚恋观婚俗变迁
2025年海外购机推荐：高性价比、入门、中高端等

如今，选择一部合适的手机早已不再是“安卓 VS iPhone”的简单选择题。果粉也还、安卓发烧友也罢，每个细分领域都有值得推荐的机型……

iPhone16e 一加13r 三星GalaxyS25
极光公布2025年第一季度财报

极光公司2025年第一季度财报显示：总收入8900万元人民币，同比增长38%；毛利润5880万元，增长27%。金融风控业务表现突出，收入同比增长64%至2220万元。EngageLab业务签约额超6300万元，累计签约额突破1.1亿元。公司现金储备达1.136亿元，预计第二季度收入将在8750万至9050万元之间，同比增长10%-14%。CEO罗伟东表示将持续投入AI Agent平台开发及全球扩张。

极光财报 2025年

热文

3 天
7天

6个AI大模型大战2025年高考数学新一卷：数学题推理能力均显著提升

2025年高考数学新一卷上热搜：6个AI大模型宣布挑战谁更强？

高考数学霸榜热搜！男生第一个走出考场：数学题目太难了不会

2025年国补结束时间已确定！统一截止时间为2025年12月31日

2025年京东618满减是哪天开始？2025年淘宝京东618红包领取口令是什么？

2025年京东淘宝天猫618红包口令是什么2025年618红包活动开始时间

2025年国补结束时间已确定，国家补贴全国统一结束截止时间为2025年12月31日

2025年淘宝京东天猫618红包领取活动入口口令及2025年618活动时间

他趣发布《2025年中国青年彩礼研究报告》

2025年海外购机推荐：高性价比、入门、中高端等

极光公布2025年第一季度财报

热文

华为Pura 80 Pro/Pro+在华为官方商城上架

迅雷完成对虎扑的收购斥资5个亿

小鹏宣布将联手华为打造“世界上最好”的AR-HUD

站长商机