首页 > 业界 > 关键词  > MathGPT最新资讯  > 正文

实测学而思MathGPT大模型:中小学数学解题正确率有望在全球范围内创造新 SOTA

2023-08-30 17:55 · 稿源: 量子位公众号

国内首个数学大模型MathGPT开放内测了,不上手试试怎么行?第一印象上,最明显的就是:啪的一下,很快啊~题目识别到对话框,结果不光答案准确,还就给出了具体的公式步骤、详细解析。并且支持公式输入和修改。这着实是数理爱好者福音了!要知道市面上GPT-4在内的通用大模型,都无法实

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 《Whiteout Survival》跻身全球TOP2 世纪华通双游星会师全球榜单

    世纪华通旗下点点互动两款手游《Whiteout Survival》和《Kingshot》在全球市场表现亮眼。5月数据显示,《Whiteout Survival》跃居全球手游收入榜第二,成为中国出海手游收入冠军;《Kingshot》则位列全球收入增长榜第四,较上月上升36位至第29名。两款产品分别以冰雪生存策略和4X策略玩法获得市场认可,其中《Whiteout Survival》通过丰富活动提升用户粘性,《Kingshot》在欧美市场表现突�

  • 2025MWC | 途鸽科技发布全球eSIM IoT解决方案,助力中国IoT企业扬帆全球

    途鸽科技在2025 MWC大会上发布全球一站式eSIM IoT解决方案,助力中国企业全球化布局。该方案无需实体SIM卡,支持全球350+运营商资源覆盖200+国家,实现智能选网、远程管理和统一平台运维。CEO张衡表示,eSIM技术将重构物联网连接生态,预计2026年60%物联网设备将采用eSIM。方案已应用于智能穿戴、车载通信等领域,推动中国制造企业出海。途鸽将持续深化eSIM技术投入,构建全球�

  • 直击企业痛点 全球制造链+科技巨头聚焦GPTBots.ai

    在2025深圳国际人工智能展上,极光旗下企业级AI Agent平台GPTBots成为焦点。该平台展示了在制造业智能化升级中的解决方案,包括构建企业知识搜索引擎、自动化办公流程及跨境商务沟通等应用场景。展会期间,平台吸引了苹果等科技巨头及多国企业代表关注,探讨了AI在供应链管理、项目监控等领域的落地实践。GPTBots凭借模块化架构和安全部署能力,已服务金融、制造等十余个行业客户,助力企业实现降本增效和智能化转型。

  • 高考数学全卷重赛!一道题难倒所有大模型,新选手Gemini夺冠,豆包DeepSeek并列第二

    本次AI高考数学测试评估了7个大模型的表现,包括Doubao、DeepSeek、Qwen3等。测试包含14道客观题和5道解答题,总分150分。结果显示:1)客观题各模型差距不大,最大分差仅3分;2)解答题成为主要失分区,仅Gemini2.5Pro获得满分;3)图像识别题(第6题)难倒所有多模态模型,暴露AI图文理解短板。最终Gemini2.5Pro以145分居首,Doubao和DeepSeek R1以144分并列第二。测试表明大模型在数学推理能力上有进步,但在复杂论证和多步骤计算方面仍需提升。

  • 阿里巴巴发布全球首个胃癌影像筛查AI模型:CT就能识别早期胃癌

    浙江省肿瘤医院联合阿里巴巴达摩院,发布了全球首个胃癌影像筛查AI模型DAMO GRAPE。 该模型首次利用平扫CT影像识别早期胃癌病灶,并联合全国20家医院,在近10万人的大规模临床研究中大幅提升胃癌检出率。 相关论文在24日登上了国际顶级期刊《自然医学》(Nature Medicine)。 据国家癌症中心统计,我国每年新发胃癌约36万例,死亡26万例,死亡人数在所有恶性肿瘤中位列第�

  • 华为云盘古预测大模型首创 Triplet Transformer 统一预训练架构

    6月20日,华为发布盘古大模型5.5,五大基础模型全面升级。该模型采用业界首创的Triplet+Transformer统一预训练架构,能跨行业处理表格数据、时间序列数据和图片数据,显著提升预测精度和泛化能力。已在水泥、钢铁、电解铝、供热等多个工业场景落地应用:海螺水泥实现熟料强度预测,宝武钢铁高炉出铁温度合格率超90%,云南铝业年省电2600万度,天津供热能耗降低10%。模型聚焦工业领域,通过工艺优化和系统寻优,助力企业降本增效,推动行业智能化转型。

  • 6个AI大模型大战2025年高考数学新一卷:数学题推理能力均显著提升

    ​近日,随着高考的圆满结束,一场别开生面的“数学擂台赛”在各大AI大模型间悄然展开。多家知名科技公司的大模型被邀请参与2025年数学新课标Ⅰ卷中的14道客观题测试,以此检验它们在逻辑推理和数学能力上的实力。此次测试题目包含8道单选题、3道多选题以及3道填空题,满分设定为73分,且测试过程严格遵循高考判分原则,确保结果的公正性与准确性。 测试成绩揭晓�

  • 又增3000套!浙江舟山37所中小学装上海尔空调,能撼动TOP3格局么?

    浙江省舟山市计划为全市37所中小学教室安装3000套海尔空调,充分考虑实际需求,根据不同教室特点配备壁挂式、柜式及小型中央空调等多种机型。小学教室优先选用壁挂式空调,并适当调高外机安装高度保障低龄学生安全。安装工作安排在周末或放学后进行,需电路改造的利用暑假完成,确保9月开学前全部到位。近期全国校园空调采购密集推进,除舟山外,海尔空调还接连斩获齐鲁工业大学4600套、华北理工大学8000套、青岛大学7217套等大额订单。中怡康最新数据显示,海尔空调市场份额达27.2%,位居行业第二。这一系列大单的持续落地,将对空调头部品牌格局产生冲击。

  • 思必驰RTOS大模型解决方案丨当玩具遇上AI,陪伴更有温度

    文章介绍了多款AI陪伴机器人产品,如LOVOT、Moflin、FoloToy等,它们通过创新交互方式引领消费新潮流。针对不同场景需求,思必驰推出RTOS大模型解决方案,融合智能对话技术与DFM-2大模型,整合第三方内容资源,赋予产品情感陪伴与寓教于乐功能。该方案具备智能打断、上下文记忆、多轮对话等能力,实现自然流畅的人机交互。在儿童教育领域,AI玩具可成为智慧伙伴,提供个性化学习支持。未来,AI赋能玩具将解锁更多应用场景,持续优化用户体验。

  • 豆包大模型1.6发布:全球第一梯队!可生成1080p高品质视频

    字节跳动旗下豆包大模型正式升级为1.6版,在推理、数学、指令遵循、Agent等方面的能力均有较大提升,同时豆包视频生成模型Seedance 1.0 pro、豆包语音播客模型也正式发布。 豆包大模型1.6包括三部分,分别是豆包1.6、豆包1.6-thinking、豆包1.6-flash。 其中,豆包1.6支持on/off/auto三种思考模式,豆包1.6-thinking强化了思考能力,支持多模态,在多个权威测评集上达到了全球第一梯队�