大模型都能冲清北了？首个AI高考总分评测结果出炉

2025-06-13 15:01 · 稿源：站长之家用户

大模型参加高考，能上什么学校？

高考结束不到 5 天，各家大模型纷纷在语文作文、数学题上PK，有的文采飞扬，作文能接近满分；有的数学能力领先，直接满分交卷。如果让大模型直接做完整套试卷，总分又能拿多少？

以辽宁 2025 年高考真题为例（题目源自网络），记者邀请了 7 位国产大模型“选手”参赛。他们分别是：DeepSeek、豆包、腾讯元宝（混元T1）、讯飞星火、Kimi、千问和文心。

辽宁卷的语数英采用全国二卷，副科自主命题，据了解，黑、吉、辽、蒙共用九科试卷。整个评测方式采用3（语数外）+3（理综/文综）的形式对大模型进行了全科目测试。评测过程中，优先将试卷题目截图上传作答，少量图片解析失败的用OCR文本代替。最后，邀请了多位在职高中老师，评判各个科目的主观题分数。

从总成绩来看，元宝在文科考试中拿下首先，获得667. 5 分的高分，以 2024 年辽宁省高考录取分数线为参考，已经可以冲刺“清北”。紧随其后的豆包、讯飞星火拿下来 655 分和 652 分的高分，也可以轻松就读 985 先进院校。

而在理科考试中，和往年一样，理科成绩会整体会弱于文科。拿到首先的豆包获得了 635 分，紧随其后元宝和kimi拿到了632. 5 分和 629 分，都可以冲刺985。但对比文科，无缘先进大学。

具体来看，语数英三门主科中，豆包拿下了语文首先，紧随其后元宝、kimi拿下了并列第二。各家在语文主观题上都表现比较平均，而豆包、元宝、kimi在作文上都拿到了50+的高分，使整体成绩更佳。数学测试则是由元宝拿下了首先，获得了 149 分的高分。只在最后一道解答题中，因答题过程稍不完整，遗憾丢失 1 分。在英语测试中，各家大模型在主观题都表现的比较平均，都能拿到满分，差异主要出现在英语作文。

大模型在文综方面也都表现不错。对于文综的客观题，表现好一些的大模型，如元宝、豆包能拿到接近满分，这也体现了大模型在知识理解和覆盖上较为出色。但在主观题中，文综对于解答题的“得分点”有比较高的要求，而大模型似乎对此不那么熟悉。比如地理解答题对知识点和推导过程要求严格，大模型可以给出最终答案，但会缺少1- 2 个知识点的推导。而在政治题上，则更加要求知识点的完整性，在阅读题的部分，大模型经常会遗漏部分知识点导致失分。阅卷老师也特别提到，元宝正是对这些“得分点”把握的比较准确，拿到了更好的成绩。

而在理综方面，大模型在数学逻辑推理上还存在一定短板，另外理科试题存在比较多图像、符号，大模型对这部分内容理解不足，也会导致整体偏弱。阅卷老师提到，比如物理答卷中，针对解答题，大模型大多能匹配到正确的公式，但在计算过程中也会出现不同程度的问题，导致答案偏离。而在化学考试的填空题中，往往一道大题会包含5- 6 个小题，各家大模型都没法在这类题型中拿到满分。生物题也同样出现这样的状况。

但总体来看，对比去年大模型比较严重的“偏科”情况，成绩只能达到“文科能上一本，理科只能上二本”的水平。今年大模型整体的能力有很大的提升，不仅在文科上能冲刺清北，理科上 985 也不是问题。这也源于过去一年人工智能领域、以及国产大模型的飞速发展。

相信在未来，发展速度会越来越快，也期待看到模型不仅不再“偏科”、在分数上有跨跃性的进步，还能实际运用到各个学科发展上，攻克更多挑战。

（推广）

特别声明：以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述法律文件后，将会依法依规核实信息，沟通删除相关内容或断开相关链接。

相关推荐

关键词：

7款AI大模型写高考作文，语文名师点评，豆包、GPT等斩获前三

刚刚， 2025 年高考作文题目出炉，再次成为亿万网友关注的话题。越来越“聪明”的人工智能大模型写高考作文真题，会带给我们怎样的惊喜?阅卷老师又会给出怎样的分数呢?今年湖北高考语文采用全国一卷，作文题为根据给定的材料进行写作。根据阅卷老师的打分，豆包、通义千问、GPT-4o的作品斩获前三名。全国一卷阅读下面的材料，根据要求写作。( 60 分)他想要给孩子们唱

高考作文人工智能阅卷评分
六大国产大模型高考作文实测：讯飞星火夺冠

2025年高考全国一卷作文题引发热议，题目以老舍、艾青、穆旦三位作家的作品为素材，要求考生探讨个体在困境中的表达方式。

高考作文老舍艾青
难哭了的高考数学题，4家国产大模型表现如何？

2025年高考数学考试引发热议，多家AI大模型参与测试。腾讯元宝和豆包表现最优，分别获得145分和140分（满分150分），仅错1-2道题。文心一言和QWen3稍逊，得分在120分左右。测试显示，AI在选择题和基础解答题表现良好，但在涉及图像理解、向量分析等复杂题目时仍存在困难。特别是一道包含向量图的"杀手题"让所有AI失分。专家指出，国产大模型数学能力已有显著提升�

高考数学语文
荐AI日报：夸克发布首个高考志愿大模型；Trae月活跃用户破100万；Manus推出免费无限聊天模式

【AI日报】今日AI领域热点速览： 1. 夸克APP推出高考志愿大模型，免费提供个性化填报指导 2. Manus AI开放免费无限聊天模式，挑战行业巨头 3. Trae开发者平台月活破百万，累计交付60亿行代码 4. 迪士尼环球起诉Midjourney侵犯影视版权 5. 维基百科暂停AI生成摘要实验 6. 360发布"纳米AI超级搜索智能体"，内置80多款大模型 7. PartCrafter项目实现单张图片生成高精度3D模型 8. Meta推出AI视频编辑工具，支持50多种预设效果 9. 阿里工程师放弃春节假期全力追赶DeepSeek技术 10. 火山引擎发布PromptPilot智能提示优化平台 11. OpenAI洽谈400亿美元融资，拓展AI生态系统 12. 新一代o3-pro推理模型发布并调整API定价策略

人工智能高考志愿 AI应用
2025年高考数学新一卷上热搜：6个AI大模型宣布挑战谁更强？

近日，随着高考的落幕，一场别样的“高考”也在各大AI大模型之间展开。此次测试邀请了多家知名科技公司的大模型，参与2025年数学新课标Ⅰ卷中的14道客观题测试，以此检验它们在逻辑推理和数学能力上的表现。测试题目包括8道单选题、3道多选题和3道填空题，满分73分，测试过程严格遵循高考判分原则。测试结果显示，字节跳动的豆包和腾讯的元宝（T1）以68分的总成绩�

高考 AI大模型数学能力
真学霸！豆包大模型1.6正式发布：高考数学卷获144分全国第一

今日，字节跳动旗下火山引擎举办FORCE原动力大会，正式发布豆包大模型1.6。新系列包括三个大模型，分别是Doubao-Seed-1.6-thinking、Doubao-Seed-1.6、Doubao-Seed-1.6-flash。火山引擎总裁谭待表示，Doubao-Seed-1.6是首个支持256k长上下文的大模型。以thinking模型为例，其思考能力强化，支持多模态，Doubao-Seed-1.6则支持on/off/auto三种思考模式。在高考全国新一卷数学单科测试中，豆包大模�

豆包大模型火山引擎 FORCE原动力大会
6个AI大模型大战2025年高考数学新一卷：数学题推理能力均显著提升

近日，随着高考的圆满结束，一场别开生面的“数学擂台赛”在各大AI大模型间悄然展开。多家知名科技公司的大模型被邀请参与2025年数学新课标Ⅰ卷中的14道客观题测试，以此检验它们在逻辑推理和数学能力上的实力。此次测试题目包含8道单选题、3道多选题以及3道填空题，满分设定为73分，且测试过程严格遵循高考判分原则，确保结果的公正性与准确性。测试成绩揭晓�

高考数学擂台赛 AI大模型
“恭迎大小姐高考归来”：高考落幕考场外创意迎接成焦点

2025年6月9日18时，伴随着最后一科考试结束铃声的清脆响起，陕西全省28.15万名考生陆续走出考场，这场承载着无数梦想与希望的高考正式画上句号。考场外，早已等候多时的亲友们用各种创意与温情交织的方式迎接考生，现场洋溢着喜悦与感动的氛围。在众多迎接场景中，一些细节格外引人注目，成为社交媒体热议的焦点。

高考陕西考生考试结束
护航高考懂你所需三星AI神冰箱以AI之名保障饮食健康

三星AI神冰9系及5系冰箱为高考季提供智能解决方案：配备9英寸AI智控大屏，集成食材管理、天气查询、日程提醒等功能；搭载Bixby语音助手实现声控操作；AI食材识别功能可智能更新库存清单并推荐食谱；采用立体环绕制冷技术确保食材新鲜；容量达631L/615L，优化存储空间。帮助家长科学安排考生饮食起居，减轻备考压力。

高考饮食人工智能冰箱学生健康
荐AI日报：Anthropic推最强编码AI模型Claude4；苹果计划推AI智能眼镜；QQ浏览器上线首个高考Agent

【AI日报】今日AI领域重要动态：1)Anthropic发布Claude4系列AI模型，编程能力超越竞争对手；2)苹果计划2026年推出集成AI技术的智能眼镜；3)字节跳动与清华合作推出时序多模态大模型ChatTS；4)3DTown框架实现单张照片生成逼真3D场景；5)OpenAI秘密开发无屏幕AI设备；6)商汤科技推出儿童AI下棋机器人；7)微软记事本新增AI写作功能；8)深圳设立70亿元基金支持AI硬件初创企业；9)谷歌发布3D视频通信平台Beam；10)阿联酋推出"星际之门"计划，免费提供ChatGPT服务；11)法国Mistral推出开源模型Devstral；12)Anthropic API新增四大功能；13)美国众议院通过法案限制各州监管AI；14)QQ浏览器推出高考AI助手。

Claude4 人工智能 AI模型

热文

3 天
7天

大模型都能冲清北了？首个AI高考总分评测结果出炉

7款AI大模型写高考作文，语文名师点评，豆包、GPT等斩获前三

六大国产大模型高考作文实测：讯飞星火夺冠

难哭了的高考数学题，4家国产大模型表现如何？

荐AI日报：夸克发布首个高考志愿大模型；Trae月活跃用户破100万；Manus推出免费无限聊天模式

2025年高考数学新一卷上热搜：6个AI大模型宣布挑战谁更强？

真学霸！豆包大模型1.6正式发布：高考数学卷获144分全国第一

6个AI大模型大战2025年高考数学新一卷：数学题推理能力均显著提升

“恭迎大小姐高考归来”：高考落幕考场外创意迎接成焦点

护航高考懂你所需三星AI神冰箱以AI之名保障饮食健康

荐AI日报：Anthropic推最强编码AI模型Claude4；苹果计划推AI智能眼镜；QQ浏览器上线首个高考Agent

热文

点击已死？“AI引用”才是流量未来，SEO正在被SAO、AEO取代

李世石：AI不会“解读”……直觉依然属于人类！

前OpenAI研究员：有时，ChatGPT为了“自救”，会选择牺牲用户

iOS26的这五大“新功能”，我在安卓机上已经用了好几年！

从心脏、到血管……3D打印开启“器官替换”时代

无缝且安全的密钥导入、导出功能将登陆苹果系统

站长商机