首页 > 业界 > 关键词  > DeepMind最新资讯  > 正文

​DeepMind AI数学奥林匹克突破银牌标准,数学推理能力再提升

2024-07-26 15:23 · 稿源:站长之家

谷歌旗下的DeepMind团队近期在国际数学奥林匹克(IMO)中取得了令人瞩目的成绩。DeepMind的两款人工智能模型——AlphaProofAlphaGeometry2,成功解决了本年度比赛中的四个难题,达到了银牌水平。这一突破标志着AI在数学推理方面迈出了重要的一步。

image.png

国际数学奥林匹克是全球最具挑战性的数学比赛之一,自1959年起每年举办,吸引了来自百余个国家的参赛者。今年的比赛中,DeepMind的AI系统表现不俗,成功解决了四道题目,这一成绩相当于银牌水平,这也是AI系统首次在如此高水平的数学竞赛中取得类似成绩。

AlphaProof是一个基于强化学习的新系统,专注于形式化数学推理;而AlphaGeometry2则是其改进版,专门用于解决几何问题。此次AI的表现不仅展示了其在复杂数学问题上的强大能力,还为未来AI在高级数学领域的应用提供了新方向。

数学一直被认为是AI发展的关键标准之一。复杂的几何学问题需要直观和创造性的解决方案以及高级推理能力,这对于AI系统来说是一大挑战。Google表示,这些突破显示了AI在数学推理领域的巨大潜力,同时也反映了AI系统在处理实际复杂问题时的进步。

此外,Google在AI研究方面的投入也显著增加。2024年第二季度,Alphabet在AI研究和开发上的支出达到23亿美元,几乎是去年同期的两倍。这一支出反映了公司对AI技术持续的重视和投入。

目前,AI领域的竞争日益激烈。OpenAI正在开发名为“Strawberry”的新型AI模型,以显著提升AI的推理能力;而Meta公司也推出了最新的AI模型Llama3.1,推动开源AI的发展。

划重点:

📊 DeepMind的AlphaProof和AlphaGeometry2在国际数学奥林匹克中取得银牌标准成绩,展示了AI在数学推理上的新突破。

🔍 AlphaProof和AlphaGeometry2分别解决了四道数学题目,首次在高水平数学竞赛中达到银牌水平。

💰 Google母公司Alphabet在AI研发上的支出大幅增加,显示了对AI技术的持续重视和投入。

举报

  • 相关推荐
  • 下一个爆款在哪儿?2025英特尔人工智能创新应用大赛获奖名单揭晓

    8月16日,2025英特尔人工智能创新应用大赛总决赛在深圳落幕。40支优秀团队从2817支队伍中脱颖而出,围绕工业、教育、心理健康、游戏等领域展开对决。大赛展示了AI从云端走向边缘的趋势,依托酷睿Ultra处理器和低代码开发工具,推动AI应用本地化落地。获奖作品包括动力电池机器人协作拆卸系统和AI生成PPT服务,体现AI与产业需求的深度融合。英特尔与联想、惠普等合作伙伴共同为开发者提供全栈支持,加速AI技术普及和商业化进程。

  • 海尔冰箱唯一获批“制冷家电人工智能技术山东省工程研究中心”

    海尔冰箱在人工智能领域取得新突破,主导建设的"制冷家电人工智能技术山东省工程研究中心"成为2025年山东省工程研究中心认定名单中唯一入选的冰箱品牌。该中心聚焦人工智能、物联网、大数据等技术方向,开发了全空间智慧保鲜舱冰箱等140多项行业首创产品,近三年获授权发明专利803件。海尔冰箱还推出行业首款接入DeepSeek的AI全空间保鲜冰箱,具备方言识别、降噪技术等功能,显著提升用户体验。市场数据显示,2023年1-7月海尔冰箱以47%市场份额稳居行业第一。通过AI技术赋能,海尔冰箱正引领行业向精准、智能保鲜时代跨越。

  • Google Gemini vs Deepseek:谁更适合你的业务场景?AI大模型选型终极对比指南

    企业在选择大模型时面临两难:国际大厂的Gemini技术先进,但国内DeepSeek性价比突出。AIbase平台通过真实场景测试数据指出:1)跨境电商客服场景中,Gemini多语言识别准确率提升12%,但需注意API延迟问题;2)金融研报分析场景下,DeepSeek支持128K长文本且成本仅为Gemini的1/3。决策关键:抛开参数迷雾,聚焦成本、响应速度、语言支持和场景匹配四大维度。AIbase提供可视化对比工具,3分钟生成专属选型报告,让技术决策不再玄学。

  • 谷歌DeepMind发布Genie 3世界模型:支持实时生成交互式3D环境

    据媒体报道,谷歌DeepMind正式发布了其新一代通用世界模型Genie 3。 该模型能够根据用户的文本提示,快速生成丰富多样的交互式虚拟环境。Genie 3不仅能够以每秒24帧的速度生成720p分辨率的高清交互式3D世界,更创新性地引入了 可提示世界事件” 功能。用户通过简单文本指令,即可实时修改虚拟环境,显著提升了沉浸感与创造力。 DeepMind视Genie 3为迈向通用人工智能(AGI) 的�

  • ISC.AI 2025 人工智能安全治理与创新实践论坛圆满召开

    ISC.AI2025人工智能安全论坛在北京召开,聚焦AI安全治理与创新实践。论坛汇集顶尖专家,探讨大模型安全评估与防护、智能体安全、AI治理等前沿议题。360集团张向征指出,随着Agent技术爆发式应用,AI安全已成为产业核心焦点。专家们强调需构建AI安全防护体系,应对大模型直接访问核心系统带来的全新挑战。中国电子院彭健提出企业合规建设需关注九大要素,清华大学苏航揭示智能体安全风险远超传统AI。华为云范建军倡导端到端大模型安全防护,中国信通院杨哲超呼吁构建协同治理框架。论坛为构建安全、普惠、负责任的人工智能未来贡献智慧。

  • AI日报:百度推全球首批AI数字员工;Claude Opus4.1出世;谷歌DeepMind发布世界模型Genie 3

    AI日报栏目聚焦人工智能领域最新动态:1)Claude Opus4.1发布,编程能力提升74.5%;2)OpenAI开源GPT-OSS-120B和20B模型;3)谷歌DeepMind推出革命性3D世界模型Genie3;4)谷歌Gemini新增AI故事书生成功能;5)ElevenLabs推出商用AI音乐生成器;6)百度智能云发布首批AI数字员工;7)OpenAI估值或达5000亿美元;8)00后创业者推出云端AI协作开发工具Vinsoo;9)腾讯启动2026校园招聘,重点培养AI人才;10)马斯克宣�

  • DeepSeek崩了引热议 官方深夜回应:网页/API已恢复

    8月11日,DeepSeek服务突遭全面宕机,API接口、网页平台以及App均无法访问或响应。 许多网友也通过微博话题#DeepSeek崩了#反馈服务异常。

  • AI大模型选型决策指南:10分钟数据对比 Gemini 2.5 Flash-Lite 与 DeepSeek R1

    本文探讨大模型选型困境与解决方案。2025年全球可调用大模型超300个,但选型面临三大难题:单位混乱、定价波动快、87%团队无法量化模型价值。提出三层漏斗筛选法:1)场景刚需筛选80%选项;2)验证核心性能;3)评估边际效益。以Gemini和DeepSeek为例,前者适合常规FAQ场景年省$16,000,后者适用于金融计算场景可降低15%人工复核。建议建立动态评估体系,将3小时选型会议压缩至18分钟,错误率下降40%。核心观点:选型应从参数争论转向场景验证,通过自动化工具为工程师节省时间,聚焦提示词优化而非参数对比。

  • 智能体迎来“DeepSeek时刻”,为何主角是纳米AI?

    大模型重塑了人工智能的产业格局,但却没有彻底颠覆人类的生产模式。 在这背后,并非其技术力量不足,而是当前的应用形态仍停留在“工具赋能”的初级阶段,大模型的潜力被束缚在碎片化场景中,未能转化为重构生产逻辑的核心动能。 正如360集团创始人、董事长周鸿祎所言,大模型的能力其实已经相当强大,甚至超越了我们中的许多人。只是其潜力尚未被挖掘。 而�

  • iPhone 17 Pro放弃钛金属 博主:可能是出于成本考量

    博主定焦数码表示,iPhone 17 Pro放弃钛金属的原因可能是出于成本考量,苹果将蓝牙、Wi-Fi、基带芯片都纳入自研,这些都提升了手机成本。 据悉,iPhone 17 Pro和iPhone 17 Pro Max采用铝制机身,其中框和背板为一体化设计,苹果Logo区域采用玻璃材质,以此来实现无线充电。

今日大家都在搜的词: