首页 > 业界 > 关键词  > DeepMind最新资讯  > 正文

​DeepMind AI数学奥林匹克突破银牌标准,数学推理能力再提升

2024-07-26 15:23 · 稿源:站长之家

谷歌旗下的DeepMind团队近期在国际数学奥林匹克(IMO)中取得了令人瞩目的成绩。DeepMind的两款人工智能模型——AlphaProofAlphaGeometry2,成功解决了本年度比赛中的四个难题,达到了银牌水平。这一突破标志着AI在数学推理方面迈出了重要的一步。

image.png

国际数学奥林匹克是全球最具挑战性的数学比赛之一,自1959年起每年举办,吸引了来自百余个国家的参赛者。今年的比赛中,DeepMind的AI系统表现不俗,成功解决了四道题目,这一成绩相当于银牌水平,这也是AI系统首次在如此高水平的数学竞赛中取得类似成绩。

AlphaProof是一个基于强化学习的新系统,专注于形式化数学推理;而AlphaGeometry2则是其改进版,专门用于解决几何问题。此次AI的表现不仅展示了其在复杂数学问题上的强大能力,还为未来AI在高级数学领域的应用提供了新方向。

数学一直被认为是AI发展的关键标准之一。复杂的几何学问题需要直观和创造性的解决方案以及高级推理能力,这对于AI系统来说是一大挑战。Google表示,这些突破显示了AI在数学推理领域的巨大潜力,同时也反映了AI系统在处理实际复杂问题时的进步。

此外,Google在AI研究方面的投入也显著增加。2024年第二季度,Alphabet在AI研究和开发上的支出达到23亿美元,几乎是去年同期的两倍。这一支出反映了公司对AI技术持续的重视和投入。

目前,AI领域的竞争日益激烈。OpenAI正在开发名为“Strawberry”的新型AI模型,以显著提升AI的推理能力;而Meta公司也推出了最新的AI模型Llama3.1,推动开源AI的发展。

划重点:

📊 DeepMind的AlphaProof和AlphaGeometry2在国际数学奥林匹克中取得银牌标准成绩,展示了AI在数学推理上的新突破。

🔍 AlphaProof和AlphaGeometry2分别解决了四道数学题目,首次在高水平数学竞赛中达到银牌水平。

💰 Google母公司Alphabet在AI研发上的支出大幅增加,显示了对AI技术的持续重视和投入。

举报

  • 相关推荐
  • 科龙云朵猫Ultra上手:星闪雷达+DeepSeek语音,智能柜机选它就对了

    买空调最易踩的坑不是匹数选小,而是花大几千买回家却发现风只往一个方向吹、角落的人感受不到凉意、调温还得满屋找遥控器。科龙云朵猫Ultra在3000-5000元价位,用星闪雷达和双语音大模型给出了够聪明、够舒适的答案:星闪雷达2.0能精准感知6米内多人位置,实现风避人、风随人、人近柔风、人离节能四大模式;内置DeepSeek与星海大模型,支持6种方言识别和离线语音控制;170°超广角送风搭配216种风感组合,APF值高达5.30,远超新一级能效标准26%,AI懒人省电模式再省35%。对比美的酷省电PRO和TCL智炫风,它在人体感知、复杂语音指令和柔风技术上优势明显,全生命周期性价比极高,尤其适合有孩有宠或多代同堂家庭。

  • 收费才是DeepSeek的“成人礼”

    DeepSeek首次融资的“金主”名单,逐渐浮出水面。 6月3日,媒体报道称,DeepSeek计划募集约500亿元人民币,投后估值达3500亿至4000亿元。相比上月底传闻的700亿元,最新传出的融资规模略有收缩。 除了DeepSeek创始人梁文锋承诺投入200亿元外,腾讯考虑投资100亿元,宁德时代也可能投资50亿元。综合多方消息,其他潜在投资方包括国家集成电路产业投资基金、网易、京东、砺思资�

  • 流量变天了!如何用“GEO搜索优化品牌监控”锁死豆包、DeepSeek的红利入口?

    2026年,AI搜索(如豆包、DeepSeek)正取代传统SEO,成为流量新战场。企业需通过GEO(生成式引擎优化)抢占大模型推荐位。AIBase推出GEO排名监控工具,以多轮重复查询消除AI随机性,支持批量场景监控、竞品对标和实时预警,帮助企业高效管理品牌在AI中的曝光率,避免被边缘化。

  • 卓世科技亮相 2026海南(三亚)人工智能科技大会,具身智能通用大脑赋能自贸港产业升级

    5月19日-25日,2026海南(三亚)人工智能科技大会以“睿见未来”为主题举办。卓世科技作为国家级专精特新“小巨人”企业受邀参展,创始人李伟伟发表主题演讲,展示自研“璇玑玉衡”大模型与具身智能通用大脑技术体系,深度对接海南自贸港AI产业生态。大会聚焦物理AI、智能制造、医疗康养等前沿赛道,搭建政产学研资用一体化平台。卓世科技针对行业痛点,提出分层赋能、即插即用的通用大脑解决方案,涵盖AI数字员工、陪伴交互大脑、非人形协同大脑及人形自主作业大脑等,并公布“数据资产、模型能力、场景方案、适配服务、验证认证”五大货架体系,助力海南打造全球人工智能“自贸高地”。

  • DeepSeek首轮募资500亿元 腾讯、宁德时代拟战略参投

    DeepSeek即将完成规模约500亿元人民币(约合74亿美元)的首轮融资,腾讯控股与宁德时代有望成为本轮最大的外部投资方。 据知情人士透露,本轮融资完成后,DeepSeek的整体估值将攀升至3500亿至4000亿元人民币(约合520亿至590亿美元)。 在资金募集构成方面,DeepSeek创始人梁文锋个人已承诺出资200亿元。作为外部财务与战略支持方,腾讯正考虑注资100亿元,而电池行业龙头宁德

  • 腾讯云加入价格战!DeepSeek-V4系列明起降价:最高降97.5%

    腾讯云宣布自6月3日起下调旗下DeepSeek-V4系列两款大模型调用价格,覆盖推理输入、输出及缓存命中三类计费项。其中Pro版三项费用统一下降75%,缓存命中费用降幅达97.5%;Flash版仅下调缓存命中费用,降幅90%。该系列于4月24日上线,采用混合专家架构,支持百万级上下文输入。此次调价为平台接入后的成本优化,企业及个人开发者使用成本同步降低。

  • 苹果满血AI大模型仅支持iPhone 17 Pro/Air:iPhone 17用户无缘

    苹果今天凌晨在WWDC2026开发者大会上正式发布了全新的Siri AI,这是一套完全由Apple Intelligence驱动的智能助理,相当于把过去几代的Siri完成了彻底重构。 据悉,Siri AI搭载了个人情境深度理解能力、覆盖海量信息的广泛世界知识库,还有实时屏幕感知能力,能随时协助用户找到自己需要的所有内容,不管是解答各类问题,还是从用户短信、电子邮件、照片等不同应用里精准提取�

  • 小米MiMo要蹭着DeepSeek蹦上牌桌

    ​5月27日,小米把 MiMo-V2.5系列 API 永久降价。 MiMo-V2.5-Pro 的输入缓存命中价格降到0.025元/百万 tokens,输入未命中价格3元/百万 tokens,输出价格6元/百万 tokens。普通版 MiMo-V2.5更低:缓存命中0.02元,输入未命中1元,输出2元。 这不是一次常规促销。 因为把价格横向一比就会发现,小米这次不是随便降价,而是直接对标 DeepSeek。 MiMo-V2.5-Pro 对 DeepSeek V4-Pro,MiMo-V2.5对 DeepSeek V4-Flash�

  • 京东云率先上线MiniMax M3:显著提升模型推理吞吐

    MiniMax M3正式上线,京东云JoyBuilder模型开发平台已第一时间接入MiniMax M3模型并同步开放服务。 依托京东云自研推理框架,JoyBuilder采用了PD分离部署、KV Cache缓存、投机采样等先进推理优化技术,显著提升了模型推理吞吐量与响应效率。 MiniMax M3在编程、智能体等专业任务上达到了前沿水平。其采用全新的MiniMax稀疏注意力架构(MSA),最高支持100万token的超长上下文。作为一款�

  • 稳住基本盘的小米,紧追DeepSeek

    ​小米一季度财报发布后第二天,MiMo先有了新动作。 就在刚刚,小米宣布MiMo-V2.5系列API永久降价,最高降幅99%,Token Plan同价位用量提升至5至8倍。几天前,DeepSeek刚把V4-Pro的2.5折优惠改成永久价。小米这次跟进,意味着MiMo正在以更低门槛加速参与大模型竞争。 “从短期来看,我们面对成本周期、需求周期和竞争周期三重周期叠加的挑战;长期来看,我们正进入AI重构人车家全

今日大家都在搜的词: