首页 > 业界 > 关键词  > 正文

七大模型全部高考分数出炉:文科能上一本、理科是二本

2024-07-18 21:27 · 稿源: 快科技
AI大模型高考成绩出炉

AI大模型高考成绩出炉

由上海人工智能实验室旗下的司南评测体系OpenCompass近日对7个AI大模型进行了高考9个科目的全科目测试,以全面评估大模型的实际应用能力。

参与测试的模型来自阿里巴巴、零一万物、智谱AI、上海人工智能实验室商汤、法国Mistral开源模型以及OpenAI闭源模型GPT-4o。

七大模型高考分数

根据河南省高考分数线,文科成绩最高的AI模型达到一本线,而理科成绩最高的模型只能达到二本线。

七大模型高考分数

文科状元由阿里通义千问大模型获得,分数为546分。理科状元由上海人工智能实验室商汤联合研发的浦语文曲星获得,分数为468.5分。

在文科科目中,AI模型表现出了较好的知识储备和理解能力。然而,在理科科目中,AI模型的数理推理能力普遍较弱。

特别是在涉及图表题目的问题上,AI模型的得分率仅为37.64%,表明所有大模型在图片理解和运用方面还有很大的提升空间。

阅卷老师指出,尽管大模型在基础知识掌握上表现不错,但在逻辑推理和知识灵活应用方面仍存在差距。

例如,在回答主观题时,大模型常常无法完全理解题干,导致答非所问。在解答数学题时,大模型的解题过程较为机械,逻辑性较差。

举报

  • 相关推荐
  • 高考分数公布|小艺高考Agent助力考生快准稳填报目标院校和专业

    小艺联合华为浏览器推出"小艺高考Agent"智能助手,覆盖移动端和网页端三大入口,为考生提供一站式高考服务。该产品基于盘古大模型和DeepSeek双模型能力,可快速查询各省分数线、录取位次等权威信息,支持模拟志愿填报功能,根据分数智能生成"冲稳保"院校推荐名单,并提供录取概率分析。考生还能通过自然对话咨询专业前景、院校信息等,实现个性化志愿规划。依托华为云算力,该服务整合了中国教育在线等权威数据源,帮助考生跨越信息鸿沟,科学利用高考每一分。

  • 35岁再考清华男子高考分数超640 称学医目标未改

    6月25日,清华毕业生李龙公布了自己第三次高考的查分结果。今年高考,他的分数超过640分,在黑龙江省内的位次处于1000-1500名。不过,他坦言成绩与预期差距较大,且确定清华大学协和医学院和北京大学医学部基本无望。 李龙是黑龙江哈尔滨人,今年36岁。2008年,19岁的他参加高考,取得了695分的优异成绩,本怀揣学医梦想,但考虑到学医就业较晚,为减轻家中负担,他放�

  • 大模型都能冲清北了?首个AI高考总分评测结果出炉

    7家国产大模型参加2025年辽宁高考模拟测试,结果显示:腾讯元宝在文科考试中以667.5分夺冠,接近清北录取线;豆包、讯飞星火分别以655分和652分紧随其后,均达985高校水平。理科方面,豆包以635分领先,元宝和Kimi分别获得632.5分和629分。测试发现大模型在文科表现优于理科,尤其在语文作文和数学解题能力突出,元宝数学获得149分高分。但在理科综合科目存在短板,物理化学的解题过程和知识点推导不够完整,图像符号理解不足。相比去年,今年大模型整体能力显著提升,已从"文科一本、理科二本"水平进步到冲击顶尖高校的水平,展现了国产AI的快速发展。

  • 高考数学全卷重赛!一道题难倒所有大模型,新选手Gemini夺冠,豆包DeepSeek并列第二

    本次AI高考数学测试评估了7个大模型的表现,包括Doubao、DeepSeek、Qwen3等。测试包含14道客观题和5道解答题,总分150分。结果显示:1)客观题各模型差距不大,最大分差仅3分;2)解答题成为主要失分区,仅Gemini2.5Pro获得满分;3)图像识别题(第6题)难倒所有多模态模型,暴露AI图文理解短板。最终Gemini2.5Pro以145分居首,Doubao和DeepSeek R1以144分并列第二。测试表明大模型在数学推理能力上有进步,但在复杂论证和多步骤计算方面仍需提升。

  • 难哭了的高考数学题,4家国产大模型表现如何?

    2025年高考数学考试引发热议,多家AI大模型参与测试。腾讯元宝和豆包表现最优,分别获得145分和140分(满分150分),仅错1-2道题。文心一言和QWen3稍逊,得分在120分左右。测试显示,AI在选择题和基础解答题表现良好,但在涉及图像理解、向量分析等复杂题目时仍存在困难。特别是一道包含向量图的"杀手题"让所有AI失分。专家指出,国产大模型数学能力已有显著提升�

  • 真学霸!豆包大模型1.6正式发布:高考数学卷获144分 全国第一

    今日,字节跳动旗下火山引擎举办FORCE原动力大会,正式发布豆包大模型1.6。 新系列包括三个大模型,分别是Doubao-Seed-1.6-thinking、Doubao-Seed-1.6、Doubao-Seed-1.6-flash。 火山引擎总裁谭待表示,Doubao-Seed-1.6是首个支持256k长上下文的大模型。 以thinking模型为例,其思考能力强化,支持多模态,Doubao-Seed-1.6则支持on/off/auto三种思考模式。 在高考全国新一卷数学单科测试中,豆包大模�

  • 男生高考697分用播音腔淡定报分数 网友:这孩子能成事

    ​近日,在河北石家庄发生了一件令人印象深刻的事。一名男生收到高考分数短信后,没有丝毫慌乱与激动,而是以沉稳的姿态,用播音腔开始逐科播报自己的高考成绩:“语文129,数学138,英语142,物理98,化学生物都是95,总分697!” 整个播报过程中,男生语气平稳、吐字清晰,仿佛在播报一则普通的新闻资讯。而

  • 俩好友高考查分一个626一个627 网友:缘分考成了分数

    6月24日,内蒙古集宁一中霸王河校区高考成绩揭晓现场,两名同班女生在查询分数后相继报出626分和627分的成绩,随后激动相拥,被网友戏称为“把缘分考成了分数”。 据现场师生描述,两人在查分前曾互相调侃“考得差不多就抱一下”,成绩揭晓后,两人先是愣住片刻,随即同时跳起拥抱,现场爆发出掌声与欢呼声。

  • NBA总决赛时隔九年再迎抢七大战 步行者和雷霆你看好谁?

    NBA2024-2025赛季总决赛持续激烈进行,在系列赛第六场较量中,坐镇主场的印第安纳步行者以108比91的比分大胜俄克拉荷马雷霆,成功将系列赛大比分扳成3比3平,双方即将迎来“抢七大战”。 这是自2015-2016赛季总决赛“骑勇大战”后,联盟时隔九年再度出现总决赛“抢七”的历史盛况。 ​系列赛第六战,哈利伯顿决定带伤出战。最终,步行者主场108比91大胜雷霆,将大比分改�

  • 7款AI大模型写高考作文,语文名师点评,豆包、GPT等斩获前三

    刚刚, 2025 年高考作文题目出炉,再次成为亿万网友关注的话题。越来越“聪明”的人工智能大模型写高考作文真题,会带给我们怎样的惊喜?阅卷老师又会给出怎样的分数呢?今年湖北高考语文采用全国一卷,作文题为根据给定的材料进行写作。根据阅卷老师的打分,豆包、通义千问、GPT-4o的作品斩获前三名。全国一卷阅读下面的材料,根据要求写作。( 60 分)他想要给孩子们唱