首页 > 业界 > 关键词  > DeepMind最新资讯  > 正文

​DeepMind AI数学奥林匹克突破银牌标准,数学推理能力再提升

2024-07-26 15:23 · 稿源:站长之家

谷歌旗下的DeepMind团队近期在国际数学奥林匹克(IMO)中取得了令人瞩目的成绩。DeepMind的两款人工智能模型——AlphaProofAlphaGeometry2,成功解决了本年度比赛中的四个难题,达到了银牌水平。这一突破标志着AI在数学推理方面迈出了重要的一步。

image.png

国际数学奥林匹克是全球最具挑战性的数学比赛之一,自1959年起每年举办,吸引了来自百余个国家的参赛者。今年的比赛中,DeepMind的AI系统表现不俗,成功解决了四道题目,这一成绩相当于银牌水平,这也是AI系统首次在如此高水平的数学竞赛中取得类似成绩。

AlphaProof是一个基于强化学习的新系统,专注于形式化数学推理;而AlphaGeometry2则是其改进版,专门用于解决几何问题。此次AI的表现不仅展示了其在复杂数学问题上的强大能力,还为未来AI在高级数学领域的应用提供了新方向。

数学一直被认为是AI发展的关键标准之一。复杂的几何学问题需要直观和创造性的解决方案以及高级推理能力,这对于AI系统来说是一大挑战。Google表示,这些突破显示了AI在数学推理领域的巨大潜力,同时也反映了AI系统在处理实际复杂问题时的进步。

此外,Google在AI研究方面的投入也显著增加。2024年第二季度,Alphabet在AI研究和开发上的支出达到23亿美元,几乎是去年同期的两倍。这一支出反映了公司对AI技术持续的重视和投入。

目前,AI领域的竞争日益激烈。OpenAI正在开发名为“Strawberry”的新型AI模型,以显著提升AI的推理能力;而Meta公司也推出了最新的AI模型Llama3.1,推动开源AI的发展。

划重点:

📊 DeepMind的AlphaProof和AlphaGeometry2在国际数学奥林匹克中取得银牌标准成绩,展示了AI在数学推理上的新突破。

🔍 AlphaProof和AlphaGeometry2分别解决了四道数学题目,首次在高水平数学竞赛中达到银牌水平。

💰 Google母公司Alphabet在AI研发上的支出大幅增加,显示了对AI技术的持续重视和投入。

举报

  • 相关推荐
  • “人工智能+”时代,企业做对什么才能抢占先机?

    国务院8月26日发布《关于深入实施“人工智能+”行动的意见》,提出加快AI技术与实体经济深度融合,推动产业智能化升级。到2035年,我国将全面步入智能经济和社会新阶段。金蝶集团作为企业数字化服务商,以“AI优先”为战略,将AI技术深度融入SaaS产品与服务,推出金蝶云·星空EMA平台及多款智能产品,覆盖财务、供应链、差旅等场景,助力企业构建“AI+业务”新能力,实现高效管理与创新发展。

  • Qwen3-Max成阿里通义“地表最强”:性能超GPT5 数学推理直接满分

    9月24日,2025云栖大会开幕,阿里通义千问旗舰模型Qwen3-Max重磅亮相,性能超越GPT-5、Claude+Opus 4等,跻身全球前三。该模型包含指令和推理两大版本,预训练数据量达36T tokens,总参数超万亿,具备极强编程和工具调用能力。在SWE-Bench测试中,指令版斩获69.6分全球第一;Tau2-Bench工具调用测试达74.8分,超越同类模型。推理增强版Qwen3-Max-Thinking在数学推理测试中获满分,国内首次突破。通义千问系列已实现全尺寸覆盖,包含三百多个模型。即日起,用户可在QwenChat免费体验Qwen3-Max,或通过阿里云百炼平台调用API服务。

  • 腾讯云安全发布人工智能风险评估框架,助企业构建可信智能体

    9月17日,腾讯云在2025全球数字生态大会上发布人工智能风险控制框架及多款安全产品。该框架涵盖六大风险模块、七层级、130余项措施,系统性应对AI应用全生命周期的安全挑战,包括数据泄露、供应链隐患及权限滥用等核心问题。同时推出LLM-WAF防火墙、AI-SPM态势管理等产品,构建覆盖研发、部署、运维的全链路防护体系,助力企业建立可信、稳定的AI服务生态。

  • 市值一日暴增近3000亿港元,阿里迈向超级人工智能之路

    9月24日,阿里巴巴股价创下四年新高,单日涨超9%,市值达到约3.32万亿港元,一日增加近3000亿港元。 引爆股价的,是阿里集团每年一度的云栖大会。在会上,阿里释放多条重磅消息,尤其是在阿里集团CEO、阿里云智能集团董事长兼CEO吴泳铭的演讲结束后,阿里的股价表现就出现了明显的拉升。

  • 马斯克:Grok 5模型有望实现通用人工智能的突破

    马斯克旗下xAI公司正研发Grok 5模型,有望实现通用人工智能(AGI)重大突破。该模型采用全新架构设计,预计未来几周启动训练。若成功将代表AI从专用领域向通用认知能力的质的飞跃,被视为人工智能发展的终极目标。科技界密切关注xAI能否在激烈竞争的大模型赛道实现突破。

  • iPhone 17 Pro被吐槽闪光灯离镜头太远:拍视频有影子

    日前,苹果发布了iPhone 17 Pro系列,但由于采用新的大尺寸镜头模组,于是将闪光灯从镜头旁边移动到了机身另一侧。 但近日一位网友吐槽,在使用iPhone 17 Pro系列的相机闪光灯时,会在录制视频对象附近产生阴影。 他表示:看起来像是有人从角落里拿着灯,老实说,这真的超级烦人。”

  • DeepSeek-V3.2-Exp正式发布

    DeepSeek于9月30日正式发布实验性模型DeepSeek-V3.2-Exp,该模型基于V3.1-Terminus升级,引入创新的稀疏注意力机制DSA,首次实现细粒度稀疏注意力,在保持模型输出效果的同时显著提升长文本训练和推理效率。测试显示其表现与V3.1-Terminus基本持平。应用层面,官方App、网页端及小程序均已同步更新。同时宣布API价格大幅调整:输入缓存0.2元、输入未缓存2元、输出3元,开发者调用成本降低50%以上。模型已在HuggingFace和魔搭开源平台上线。

  • 2025 世界设计之都大会“创意可计算性:设计人工智能”,特赞升级五大内容+AI解决方案

    2025年9月25日至28日,上海将举办世界设计之都大会(WDCC2025),主题为“设计无界,生生不息”。大会聚焦人工智能赋能设计创新,探讨设计如何驱动产业与城市可持续发展。特赞科技作为内容与AI领域代表企业,将展示“计算×创意”如何拓展设计生命力,包括跨行业赋能、产教融合及人机协作三大板块,呈现AI在打破学科边界、推动产业创新中的实践。WDCC2025旨在为全球设计领域注入新动能,构建“设计×科技×可持续”的新想象空间。

  • AI日报:京东物流推出超脑大模型2.0;DeepSeek V3.1终结版发布;Kimi 推出全新 Agent 模式

    本期AI日报聚焦多领域技术突破:京东物流发布“超脑大模型2.0”与“异狼具身智能机械臂系统”,推动物流行业迈向自主执行;DeepSeek推出V3.1终结版,修复漏洞并为V4架构铺路;Kimi上线Agent模式“OK Computer”,支持智能网站开发等复杂任务;ChatGPT新增个性化资讯功能,定制用户专属新闻;Exa Code发布代码索引工具,助力AI代理精准生成代码;Meta推出AI视频创作平台Vibes,简化短视频制作;蚂蚁数科发布隐私保护AI框架Gibbon,推理速度提升超百倍;OpenAI新基准测试显示GPT-5在多个行业逼近人类专家水平,覆盖九大行业44种职业。

  • 华为MatePad mini劲敌!苹果iPad mini 8要来了:A19 Pro+OLED屏

    苹果iPad mini系列称霸了多年的小平板,这两年迎来了很多新玩家的挑战,前不久发布的华为MatePad mini就是最具竞争力的一款,凭借着超轻薄、SIM卡等配置收到很多用户青睐。 现在苹果的新一代应战者iPad mini 8也要来了,新品将会在明年上半年发布,起售价维持在499美元。 根据泄露的代码显示,iPad Mini 8(代号J510/J511)预计搭载A19 Pro芯片,大概率是与iPhone Air同款的阉割版

今日大家都在搜的词: