DeepMind AI数学奥林匹克突破银牌标准，数学推理能力再提升

2024-07-26 15:23 · 稿源：站长之家

谷歌旗下的DeepMind团队近期在国际数学奥林匹克（IMO）中取得了令人瞩目的成绩。DeepMind的两款人工智能模型——AlphaProof和AlphaGeometry2，成功解决了本年度比赛中的四个难题，达到了银牌水平。这一突破标志着AI在数学推理方面迈出了重要的一步。

国际数学奥林匹克是全球最具挑战性的数学比赛之一，自1959年起每年举办，吸引了来自百余个国家的参赛者。今年的比赛中，DeepMind的AI系统表现不俗，成功解决了四道题目，这一成绩相当于银牌水平，这也是AI系统首次在如此高水平的数学竞赛中取得类似成绩。

AlphaProof是一个基于强化学习的新系统，专注于形式化数学推理;而AlphaGeometry2则是其改进版，专门用于解决几何问题。此次AI的表现不仅展示了其在复杂数学问题上的强大能力，还为未来AI在高级数学领域的应用提供了新方向。

数学一直被认为是AI发展的关键标准之一。复杂的几何学问题需要直观和创造性的解决方案以及高级推理能力，这对于AI系统来说是一大挑战。Google表示，这些突破显示了AI在数学推理领域的巨大潜力，同时也反映了AI系统在处理实际复杂问题时的进步。

此外，Google在AI研究方面的投入也显著增加。2024年第二季度，Alphabet在AI研究和开发上的支出达到23亿美元，几乎是去年同期的两倍。这一支出反映了公司对AI技术持续的重视和投入。

目前，AI领域的竞争日益激烈。OpenAI正在开发名为“Strawberry”的新型AI模型，以显著提升AI的推理能力;而Meta公司也推出了最新的AI模型Llama3.1，推动开源AI的发展。

划重点:
📊 DeepMind的AlphaProof和AlphaGeometry2在国际数学奥林匹克中取得银牌标准成绩，展示了AI在数学推理上的新突破。
🔍 AlphaProof和AlphaGeometry2分别解决了四道数学题目，首次在高水平数学竞赛中达到银牌水平。
💰 Google母公司Alphabet在AI研发上的支出大幅增加，显示了对AI技术的持续重视和投入。

（举报）

相关推荐

关键词：

“人工智能+”时代，企业做对什么才能抢占先机？

国务院8月26日发布《关于深入实施“人工智能+”行动的意见》，提出加快AI技术与实体经济深度融合，推动产业智能化升级。到2035年，我国将全面步入智能经济和社会新阶段。金蝶集团作为企业数字化服务商，以“AI优先”为战略，将AI技术深度融入SaaS产品与服务，推出金蝶云·星空EMA平台及多款智能产品，覆盖财务、供应链、差旅等场景，助力企业构建“AI+业务”新能力，实现高效管理与创新发展。

人工智能数字化转型产业智能化
Qwen3-Max成阿里通义“地表最强”：性能超GPT5 数学推理直接满分

9月24日，2025云栖大会开幕，阿里通义千问旗舰模型Qwen3-Max重磅亮相，性能超越GPT-5、Claude+Opus 4等，跻身全球前三。该模型包含指令和推理两大版本，预训练数据量达36T tokens，总参数超万亿，具备极强编程和工具调用能力。在SWE-Bench测试中，指令版斩获69.6分全球第一；Tau2-Bench工具调用测试达74.8分，超越同类模型。推理增强版Qwen3-Max-Thinking在数学推理测试中获满分，国内首次突破。通义千问系列已实现全尺寸覆盖，包含三百多个模型。即日起，用户可在QwenChat免费体验Qwen3-Max，或通过阿里云百炼平台调用API服务。

云栖大会 Qwen3-Max 通义千问
腾讯云安全发布人工智能风险评估框架，助企业构建可信智能体

9月17日，腾讯云在2025全球数字生态大会上发布人工智能风险控制框架及多款安全产品。该框架涵盖六大风险模块、七层级、130余项措施，系统性应对AI应用全生命周期的安全挑战，包括数据泄露、供应链隐患及权限滥用等核心问题。同时推出LLM-WAF防火墙、AI-SPM态势管理等产品，构建覆盖研发、部署、运维的全链路防护体系，助力企业建立可信、稳定的AI服务生态。

AI安全智能体安全风险评估
市值一日暴增近3000亿港元，阿里迈向超级人工智能之路

9月24日，阿里巴巴股价创下四年新高，单日涨超9%，市值达到约3.32万亿港元，一日增加近3000亿港元。引爆股价的，是阿里集团每年一度的云栖大会。在会上，阿里释放多条重磅消息，尤其是在阿里集团CEO、阿里云智能集团董事长兼CEO吴泳铭的演讲结束后，阿里的股价表现就出现了明显的拉升。

阿里巴巴云栖大会股价
马斯克：Grok 5模型有望实现通用人工智能的突破

马斯克旗下xAI公司正研发Grok 5模型，有望实现通用人工智能（AGI）重大突破。该模型采用全新架构设计，预计未来几周启动训练。若成功将代表AI从专用领域向通用认知能力的质的飞跃，被视为人工智能发展的终极目标。科技界密切关注xAI能否在激烈竞争的大模型赛道实现突破。

Grok 5 AGI
iPhone 17 Pro被吐槽闪光灯离镜头太远：拍视频有影子

日前，苹果发布了iPhone 17 Pro系列，但由于采用新的大尺寸镜头模组，于是将闪光灯从镜头旁边移动到了机身另一侧。但近日一位网友吐槽，在使用iPhone 17 Pro系列的相机闪光灯时，会在录制视频对象附近产生阴影。他表示：看起来像是有人从角落里拿着灯，老实说，这真的超级烦人。”

iPhone 17 Pro
DeepSeek-V3.2-Exp正式发布

DeepSeek于9月30日正式发布实验性模型DeepSeek-V3.2-Exp，该模型基于V3.1-Terminus升级，引入创新的稀疏注意力机制DSA，首次实现细粒度稀疏注意力，在保持模型输出效果的同时显著提升长文本训练和推理效率。测试显示其表现与V3.1-Terminus基本持平。应用层面，官方App、网页端及小程序均已同步更新。同时宣布API价格大幅调整：输入缓存0.2元、输入未缓存2元、输出3元，开发者调用成本降低50%以上。模型已在HuggingFace和魔搭开源平台上线。

DeepSeek-V3.2-Exp 稀疏注意力机制 DSA
2025 世界设计之都大会“创意可计算性：设计人工智能”，特赞升级五大内容+AI解决方案

2025年9月25日至28日，上海将举办世界设计之都大会（WDCC2025），主题为“设计无界，生生不息”。大会聚焦人工智能赋能设计创新，探讨设计如何驱动产业与城市可持续发展。特赞科技作为内容与AI领域代表企业，将展示“计算×创意”如何拓展设计生命力，包括跨行业赋能、产教融合及人机协作三大板块，呈现AI在打破学科边界、推动产业创新中的实践。WDCC2025旨在为全球设计领域注入新动能，构建“设计×科技×可持续”的新想象空间。

世界设计之都大会设计无界设计人工智能
荐AI日报：京东物流推出超脑大模型2.0；DeepSeek V3.1终结版发布；Kimi 推出全新 Agent 模式

本期AI日报聚焦多领域技术突破：京东物流发布“超脑大模型2.0”与“异狼具身智能机械臂系统”，推动物流行业迈向自主执行；DeepSeek推出V3.1终结版，修复漏洞并为V4架构铺路；Kimi上线Agent模式“OK Computer”，支持智能网站开发等复杂任务；ChatGPT新增个性化资讯功能，定制用户专属新闻；Exa Code发布代码索引工具，助力AI代理精准生成代码；Meta推出AI视频创作平台Vibes，简化短视频制作；蚂蚁数科发布隐私保护AI框架Gibbon，推理速度提升超百倍；OpenAI新基准测试显示GPT-5在多个行业逼近人类专家水平，覆盖九大行业44种职业。

京东物流超脑大模型2.0 异狼具身智能机械臂系统
华为MatePad mini劲敌！苹果iPad mini 8要来了：A19 Pro+OLED屏

苹果iPad mini系列称霸了多年的小平板，这两年迎来了很多新玩家的挑战，前不久发布的华为MatePad mini就是最具竞争力的一款，凭借着超轻薄、SIM卡等配置收到很多用户青睐。现在苹果的新一代应战者iPad mini 8也要来了，新品将会在明年上半年发布，起售价维持在499美元。根据泄露的代码显示，iPad Mini 8（代号J510/J511）预计搭载A19 Pro芯片，大概率是与iPhone Air同款的阉割版

iPad mini 8

今日大家都在搜的词：

热文

3 天
7天

DeepMind AI数学奥林匹克突破银牌标准，数学推理能力再提升

“人工智能+”时代，企业做对什么才能抢占先机？

Qwen3-Max成阿里通义“地表最强”：性能超GPT5 数学推理直接满分

腾讯云安全发布人工智能风险评估框架，助企业构建可信智能体

市值一日暴增近3000亿港元，阿里迈向超级人工智能之路

马斯克：Grok 5模型有望实现通用人工智能的突破

iPhone 17 Pro被吐槽闪光灯离镜头太远：拍视频有影子

DeepSeek-V3.2-Exp正式发布

2025 世界设计之都大会“创意可计算性：设计人工智能”，特赞升级五大内容+AI解决方案

荐AI日报：京东物流推出超脑大模型2.0；DeepSeek V3.1终结版发布；Kimi 推出全新 Agent 模式

华为MatePad mini劲敌！苹果iPad mini 8要来了：A19 Pro+OLED屏

今日大家都在搜的词：

热文

比特币价格突破12.5万美元刷新历史最高纪录

乔布斯逝世14周年库克发文缅怀：我们深切怀念你

腾讯混元图像3.0登顶LMArena榜一

小米 17 标准版1TB版本 5299 元开售全系列销量同比增超20%

雷军：小米17系列开售仅5天销量破100万台

理想汽车推出焕新版L系限时优惠 10 月 8 日前享1.5万置换补贴

小米回应“小米汽车突然自己开走”：排除车辆质量问题

马斯克个人财富达5000亿美元特斯拉市值飙升助力

鸿蒙智行9月交付新车52916台：全系累计交付突破95万台

比特币价格突破12.5万美元刷新历史最高纪录

小米17 1TB版明日开售售价5299元

乔布斯逝世14周年库克发文缅怀：我们深切怀念你

腾讯混元图像3.0登顶LMArena榜一

小米 17 标准版1TB版本 5299 元开售全系列销量同比增超20%

雷军：小米17系列开售仅5天销量破100万台

站长商机

​DeepMind AI数学奥林匹克突破银牌标准，数学推理能力再提升

今日大家都在搜的词：

热文

站长商机

DeepMind AI数学奥林匹克突破银牌标准，数学推理能力再提升