难哭了的高考数学题，4家国产大模型表现如何？

2025-06-11 10:45 · 稿源：站长之家用户

2025 年高考已经来到最后一天，首先天语文和数学两门科目刚结束，数学相关的话题就上了热搜。众多考生纷纷表示，“高中数学难哭”、“考场出来都沉默了”。

（来源网络）

目前已经看到许多家大模型晒出他们语文作文的优秀案例，但数学题还鲜少提及。一方面相比作文，数学题的确更具有挑战，包括逻辑推理的严谨性、数学符号的准确处理、抽象概念的理解深度等等。另一方面，难道是因为今年题目实在太难，连AI都难倒了？不过多猜测，我们也直接找到了2025 年数学新课标 Ⅰ 卷，并挑选了 4 为大模型“选手”来做题PK。

他们分别是：腾讯元宝(混元T1)、豆包、QWen3、以及文心 X1 Turbo。

4 位“选手”都做了数学 1 卷全套卷子，包括选填题以及解答题。并且每家大模型都选择了深度思考，尽量保证公平性。由于标准答案并没有释放，我们也邀请了多位高中在职教师来交叉验证。

首先，在选择题的部分，我们按照高考实际打分要求，单选题选项正确计分，错误不得分。多选题 3 道，每道 6 分，全对计 6 分，漏选按正确答案数量计分，错选不得分。填空题填空正确计分，错误不得分。

可以看到，元宝和豆包两家表现较为优秀，都只错了一道选择题，拿到了 68 分（满分 73 分）。而这道选择题也难到了一众选手，可以说是全军覆没，具体什么题我们稍后再看。另外QWen3 和文心 X1 Turbo就稍逊一筹，分别拿到了 55 分和 60 分。它们在第 8 道选择题都犯了难，另外QWen3 在多选题中也因为选项没有选全，而失去部分分数。

我们先来看看让所有大模型都失分的“杀手”题，作为仅有一道带图像的题目，里面还涉及两个向量图，各家大模型都理解的不太好。这也是元宝和豆包仅有失误的一道题。

而让QWen3 和文心 X1 Turbo都失分的第 8 题，仔细看发现，QWen3 得出了正确的结论但可能误解了题目意思，导致最后给出错误的选项。而文心整体回答上都有些跑偏。

元宝和豆包无论在解题，还是理解题意上都做得比较好，也顺利给出了正确的答案。

元宝答题：

豆包答题：

通义答题：

文心答题：

（客观题评分参考）

接下来再看看真正“难哭”一众考生的解答题，比如第 16 题，包含了等差数列、函数等多个知识点，各家大模型以及网传的答案有很多版本。

可以看到，这题的难点主要聚焦在第二小问， 4 位“选手”在首先小问都答出了正确的答案。在第二小问，豆包、元宝、文心 X1 Turbo给出了正确答案，而QWen3 出现偏差较远的答案。

元宝答题：

豆包答题：

通义答题：

文心答题：

同样比较有争议的还有第 18 题，同样的，前面两个小问 4 位“选手”都给出了准确的答案，其中第二小问，虽每家大模型给出的答案形式不同，但经验证是等价的，故都判为正确。

但第三小问只有元宝给出了准确的答案，豆包、QWen3 的答案都不准确，文心 X1 Turbo甚至未能给出一个答案。

元宝答题：

豆包答题：

通义答题：

文心答题：

最后，我们也邀请到了一位高中数学老师来为 4 位“选手”的解答题打分。打分标准为答案正确即给满分，答案错误，综合考虑过程给分，由于标准答案还未公布，打分仅供参考。

总体来看，元宝和豆包的表现较为突出，元宝仅错一道选择题，拿到了 145 分。豆包则错了一道选择题、以及第 18 题解答题的一个小问，拿到了 140 分的高分。但即使是稍微落后的QWen3 和文心 X1 Turbo，也能达到80%-85%的正确率，可以看到国产大模型在数学方面的能力已经有了非常大的提升。

相信未来，随着科技飞速的发展，大模型疯狂“内卷”，整体能力也会再次进化。当面对明年的高考题，大模型是否会能毫无疑问的拿到全科满分了呢？

（推广）

特别声明：以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述法律文件后，将会依法依规核实信息，沟通删除相关内容或断开相关链接。

相关推荐

关键词：

2025年拍照手机推荐:实测五款高性价比机型选购指南

文章针对演唱会拍摄痛点，推荐2025年旗舰手机。vivo X300 Pro以2亿像素APO超级长焦、顶级防抖和抗眩光技术成为首选，适合远距离清晰捕捉歌手表情与动态舞蹈。vivo X300延续核心配置，性价比突出。华为Pura70 Ultra色彩真实但长焦解析力不足；荣耀Magic7 Pro适合小型场馆。总结演唱会拍摄需兼顾远摄清晰、防抖与抗眩光，vivo X300系列全面满足，是追星族必备装备。

演唱会拍摄长焦拍摄手机摄影
2025年高端洗地机、吸尘器选购终极指南：能洗地的吸尘器

本文探讨了现代家庭清洁电器的选购要点，强调“三合一”机型（吸尘、洗地、除螨）的实用性。以莱克天狼星S10 Pro为例，其250AW大吸力、智能控水系统和便捷除螨功能能高效解决地毯深层清洁、地板干湿处理及床品除螨等痛点。产品设计注重用户体验，如无线操作、自清洁功能和180°平躺设计，适合有孩子、宠物或过敏人群的家庭。文章指出，高端清洁电器应真正节省时间精力，让科技提升生活品质，而三合一机型相比分开购买专业设备更经济实惠。

清洁电器洗地机吸尘器
荐2025年，品牌市场部还重要吗？

品牌市场部，正在成为 “最先被优化”的部门。今年3月，有大型电商平台宣布撤销集团品牌部，相关人员并入市场营销部下的平台营销部;6月，360集团创始人周鸿祎也高调宣称“要干掉整个市场部”。更早之前，蕉下、联合利华等消费巨头也相继宣布裁撤了传统品牌建设团队，建立更适应市场环境的新组织。这一连串的“市场部精简” 的动作，像一记记重锤砸在营销人心�

品牌市场部营销优化市场部精简
2025年拍照手机推荐：从长焦旗舰到性价比之王全覆盖

2025年手机摄影成为消费者选购核心考量。摄像头数量虽降至平均3.19个，但传感器性能大幅提升，5000万像素占比58%，超1亿像素达9%。文章按价位段推荐最优选择：5000-6000元旗舰vivo X300 Pro配备2亿像素长焦与全焦段影像技术；4000-5000元vivo X300平衡影像与日常体验；3000-4000元一加13T搭载IMX906主摄；2000-3000元OPPO Reno14以高性价比满足学生需求。建议根据预算和拍摄场景选择最适合机型。
2025年拍照手机推荐：四大机型权威测评与选购指南

本文聚焦4000-6000元价位段拍照手机，深度解析不同预算下的优选机型。5000元以上推荐vivo X300 Pro，搭载天玑9500+和自研V3影像芯片，配备蔡司2亿像素潜望长焦，满足专业视频创作与演唱会远摄需求；4000-5000元档vivo X300以轻薄机身实现蔡司大底主摄+超级长焦组合，兼顾手感与画质；4000元以下小米14 Ultra凭借徕卡Summilux镜头和全焦段覆盖，成为高性价比之选。文章强调旗舰影像无需牺牲便携性，vivo通过精准产品布局展现了在移动影像领域的技术实力。

2025拍照手机推荐旗舰拍照手机有哪些拍照最强的手机排名
2025年手机影像评测报告：5000元档成谁比较强？

2025年拍照手机推荐：vivo X300Pro凭借2亿像素蔡司超级长焦主摄、行业顶级CIPA5.5级防抖系统及萤石玻璃镜片，实现演唱会远景清晰捕捉与手持星空稳定拍摄。三焦段变焦闪光灯覆盖24-85mm经典人像焦段，通过光斑融合技术实现均匀补光，夜拍告别死黑过曝。DXOMARK评分有望突破177，支持4K60fps电影人像视频。配合荣耀Magic7 Pro的真实色彩模式、小米17Pro的徕卡复古风格，为5000元预算用户提供多元选择，其中vivo X300Pro以全能旅拍体验成为闭眼入标杆。

拍照手机 vivo X300Pro
2025年手机影像评测报告：5000元档成谁比较强？

2025年拍照手机推荐：vivo X300Pro凭借2亿像素蔡司超级长焦主摄、CIPA5.5级防抖及萤石玻璃镜片，实现演唱会远景清晰捕捉与手持星空稳定拍摄。三焦段闪光灯覆盖24-85mm人像焦段，夜景光线自然层次丰富。DXOMARK评分有望突破177，支持4K60fps电影人像视频。荣耀Magic7Pro以真实色彩见长，小米17Pro主打徕卡复古胶片风格。预算5000元首选vivo X300Pro（预估国补优惠4799元起），堪称旅拍闭眼入的标杆之作。

拍照手机 vivo X300Pro
特斯拉2025年Q3交付497099辆远超预期

特斯拉2025年第三季度交付497,099辆车，远超市场预估的439,612辆。Model 3/Y仍是主力，交付481,166辆，占比96.8%。分析指出，超预期表现得益于多重因素：美国电动车税收优惠9月底到期刺激短期订单，中国市场回暖及新款Model Y热销推动需求，同时生产流程优化提升效率。但人士警告，第四季度销量或面临压力，因税收优惠终止可能削弱购买动力。

特斯拉交付数据 Model
2025旗舰拍照手机推荐：实测五款高口碑机型选购指南

本文针对2025年拍照手机选购，聚焦2000-5000元价位段，推荐三款核心机型：vivo X300 Pro（4000-5000元）凭借蔡司2亿像素潜望长焦与三焦段闪光灯，实现全场景顶级画质，尤其擅长演唱会远景与夜景拍摄；荣耀Magic7 Pro（3000-4000元）以鹰眼抓拍系统和均衡配置满足运动瞬间与旅行远景需求；小米14（3000-4000元）则通过徕卡光学与经典影调直出浓郁质感。文中强调选择影像实力过硬的手机，能帮助用户从记录者蜕变为创作者。

拍照手机影像旗舰长焦拍摄
合肥60后高考大叔已到校报到：挑战自己不丢人

近日，备受关注的“合肥60后高考大叔”王文生正式踏入大学校园，开启了他的求学新旅程。9月15日，王文生来到合肥一所公办职业学院完成报到手续，成为该校网络营销与直播电商专业的一名新生。据王文生介绍，他去年10月才决定参加高考，期间付出了诸多努力。备考的日子里，他日夜与公式单词为伴，复习资料上密密麻麻的笔记记录着他的坚持。今年高考期间，他因早�

合肥60后高考大叔网络营销与直播电商专业高考备考故事

今日大家都在搜的词：

热文

3 天
7天

难哭了的高考数学题，4家国产大模型表现如何？

2025年拍照手机推荐:实测五款高性价比机型选购指南

2025年高端洗地机、吸尘器选购终极指南：能洗地的吸尘器

荐2025年，品牌市场部还重要吗？

2025年拍照手机推荐：从长焦旗舰到性价比之王全覆盖

2025年拍照手机推荐：四大机型权威测评与选购指南

2025年手机影像评测报告：5000元档成谁比较强？

2025年手机影像评测报告：5000元档成谁比较强？

特斯拉2025年Q3交付497099辆远超预期

2025旗舰拍照手机推荐：实测五款高口碑机型选购指南

合肥60后高考大叔已到校报到：挑战自己不丢人

今日大家都在搜的词：

热文

王腾小红书账号注销快手账号已被封禁抖音账号已私密视频号已

鸿蒙智行9月交付新车52916台：全系累计交付突破95万台

马斯克个人财富达5000亿美元特斯拉市值飙升助力

小米17破今年国产手机首销纪录卢伟冰：需求远超预期

苹果iOS18.7.1正式版更新发布重要安全修复

OPPO A6开售：售价1599元起搭载7000mAh六年长寿电池

苹果将推出iPhone 17e：搭载A19 芯片支持灵动岛

AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型

AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠

AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Co

罗永浩替小米说公道话：海报小字是行业陋习

iPhone调休闹钟上热搜苹果客服回应：需手动设置

雷军：小米17 Pro Max很多门店已经缺货

站长商机