首页 > 业界 > 关键词  > 正文

七大模型全部高考分数出炉:文科能上一本、理科是二本

2024-07-18 21:27 · 稿源: 快科技
AI大模型高考成绩出炉

AI大模型高考成绩出炉

由上海人工智能实验室旗下的司南评测体系OpenCompass近日对7个AI大模型进行了高考9个科目的全科目测试,以全面评估大模型的实际应用能力。

参与测试的模型来自阿里巴巴、零一万物、智谱AI、上海人工智能实验室商汤、法国Mistral开源模型以及OpenAI闭源模型GPT-4o。

七大模型高考分数

根据河南省高考分数线,文科成绩最高的AI模型达到一本线,而理科成绩最高的模型只能达到二本线。

七大模型高考分数

文科状元由阿里通义千问大模型获得,分数为546分。理科状元由上海人工智能实验室商汤联合研发的浦语文曲星获得,分数为468.5分。

在文科科目中,AI模型表现出了较好的知识储备和理解能力。然而,在理科科目中,AI模型的数理推理能力普遍较弱。

特别是在涉及图表题目的问题上,AI模型的得分率仅为37.64%,表明所有大模型在图片理解和运用方面还有很大的提升空间。

阅卷老师指出,尽管大模型在基础知识掌握上表现不错,但在逻辑推理和知识灵活应用方面仍存在差距。

例如,在回答主观题时,大模型常常无法完全理解题干,导致答非所问。在解答数学题时,大模型的解题过程较为机械,逻辑性较差。

举报

  • 相关推荐
  • 如何精准计算AI大模型调用成本?复杂参数太多,预算总超支怎么办?

    文章探讨了AI模型调用成本管理的痛点,包括GPT-4等模型复杂的计费规则(如Token分级、上下文溢价、多模态叠加收费)导致实际成本常超预算40%。提出AIbase计算器三步解决方案:自动匹配场景参数、实时联动报价、明细成本拆解。通过跨境电商客服和高校实验室案例验证工具有效性,强调数据溯源、用量预警和预算缓冲功能,帮助开发者实现精准成本控制,告别手动制表与定�

  • 学魁榜《母题清单》升级版震撼发布,引领新高考学习新风向!

    《学魁母题清单》升级版针对新高考数学推出,以“母题学习法”为核心,精选历年高考真题及创新题型,帮助学生精准把握考点。采用“学-练-查”三位一体模式,结合视频讲解和二维码技术,提升学习效率。适配不同教材版本,实现高效提分,助力学生冲刺理想大学。

  • 昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

    中国科学技术大学张燕咏团队在昇腾算力支持下,成功研发出基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。该框架通过“三步走”策略,有效解决了MoE稀疏大模型推理中的专家负载不均和通信开销大两大难题,显著提升推理性能。实验显示,该方案在多项指标上较主流方案提升超30%,为昇腾技术优化MoE模型推理提供了宝贵借鉴,将加速其在各领域的落地应用。

  • 如何用3分钟精准计算AI大模型成本?避免生成一篇万字文章就超支?

    AI大模型成本控制指南:实测三步预算法+企业级避坑方案。文章揭露行业痛点:1)价格迷雾:各厂商计费规则差异大,长文本/多模态存在隐藏溢价;2)团队实测GPT-4生成20篇行业分析(50万字)实际账单超预算4倍。解决方案:通过AIbase计算器实现精准预测:①场景化选择自动加载计费规则;②输入需求实时生成动态成本矩阵;③智能规避四大隐性成本(长文本衰减补偿/区域差价预警等)。跨境电商案例显示,使用工具后成本降低60%。核心观点:在AI时代,成本控制能力已成为企业核心竞争力。

  • 百川开源最新医疗大模型,中国力量领跑医疗AI赛道

    专注医疗后,百川智能交出第一份答卷! 8月11日,百川智能发布第二款开源医疗增强推理大模型Baichuan-M2,其以32B的参数量,在OpenAI的Healthbench评测集上,超越其刚刚发布5天的开源模型gpt-oss-120b。

  • AI应用太烧钱?我们用一款精准的AI大模型费用计算器做出了清晰预算

    初创团队“智询未来”在开发AI问答应用时面临核心模型选择困境:GPT-4-turbo能力强但价高,Claude-3长文本处理优,Llama-3成本低但性能稍弱。通过AIbase成本计算器精准测算,发现Claude-3-Sonnet性价比最优,每月可省近4000元,还能通过优化提示词进一步降本15%。数据驱动的决策让团队将节省预算投入数据安全和提示词优化,凸显成本测算对初创企业技术选型的重要性。

  • 百度第一!百度智能云一见领跑视觉大模型赛道

    IDC最新报告显示,百度智能云凭借"文心一言4.5"多模态大模型和"文心X1"深度思考模型,在视觉大模型领域综合实力排名第一。其智能云平台在算法模型、工程化落地、行业覆盖等方面优势显著,已服务餐饮、钢铁、电力等20多个行业,帮助数百家企业实现生产全环节的数字化管理。典型案例包括:为风电集团构建安全管控系统,巡检效率提升6-10倍;与中钢研合作金相分析模型,检测准确率达95%;助力连锁餐饮实现全国1000+门店服务质量量化管理,订单覆盖率从5%提升至95%。通过"云端大模型+边缘小模型"的协同架构,在保障精度的同时大幅降低应用成本,推动专业级视觉AI应用普及。

  • 常德二院全栈国产化信创打造医疗新质生产力

    常德市第二人民医院于2025年4月30日上线全国首个地方三级医院全栈国产化医疗信创项目,覆盖HIS、EMR等核心系统,实现医疗信息化自主可控。项目显著提升效率,患者候诊时间缩短20%,影像调阅速度大幅提升。通过电科金仓数据库等国产技术支撑,打破对国外技术依赖,形成可复制样板,为医疗行业数字化转型提供经验。

  • 荣耀Magic V Flip2详细参数出炉:骁龙8 Gen3+荣耀自研C1/E2芯片

    荣耀Magic V Flip2折叠屏手机将于8月21日发布,采用6.82英寸LTPO内屏(2868*1232p/120Hz/4320Hz PWM)和4英寸LTPO外屏(1200*1092p/120Hz/3840Hz PWM)。搭载骁龙8Gen3处理器,配备5000万像素前置+2亿主摄+5000万超广角后置三摄,内置5500mAh电池支持80W有线+50W无线快充。整机重204g,厚度6.9/15.5mm,创新搭载自研HONOR C1射频增强芯片(提升弱信号场景通信能力)和HONOR E2能效管理芯片(优化续航表现)。

  • 性价比最高的苹果手机!iPhone 17e外观配置出炉

    依据博主数码闲聊站曝光的信息,有博主绘制了iPhone 17e外观渲染图,并汇总了该机的详细配置。 对比上代16e,iPhone 17e最大变化是屏幕升级为灵动岛,这意味着从17e开始,苹果手机彻底抛弃刘海屏形态。 不过iPhone 17e的屏幕尺寸、刷新率均没有变化,依然是6.1英寸OLED,支持60Hz标准刷新率,数码闲聊站爆料称iPhone 17e采用的是16标准版同款屏幕。

今日大家都在搜的词: