首页 > 业界 > 关键词  > AI系统最新资讯  > 正文

谷歌推几何AI系统AlphaGeometry,实力达奥林匹克金牌得主

2024-01-18 11:28 · 稿源:站长之家

计划重点:

⭐️ AI 系统超越了当前几何问题的最新方法,推动了数学领域的 AI 推理

⭐️ AlphaGeometry 在标准预设时间限制内解决了25个奥赛级几何问题

⭐️通过结合语言神经模型和规则推理引擎,AlphaGeometry实现了逻辑推理的新里程碑

站长之家(ChinaZ.com)1月18日 消息:Google DeepMind 发布了一个名为AlphaGeometry 的人工智能系统,它可以解决复杂的几何问题,其水平接近人类奥林匹克金牌得主——这是人工智能性能的突破。在对30道奥数几何题的基准测试中,AlphaGeometry 在标准奥数时限内解决了25道。相比之下,之前最先进的系统解决了其中10个几何问题,而人类金牌得主平均解决了25.9个问题。

由于缺乏推理技能和训练数据,人工智能系统经常难以解决几何和数学中的复杂问题。AlphaGeometry 的系统将神经语言模型的预测能力与规则约束推演引擎相结合,协同工作以找到解决方案。通过开发一种方法来生成大量的合成训练数据(1亿个独特的示例),我们可以在没有任何人类演示的情况下训练 AlphaGeometry,从而避开数据瓶颈。

AlphaGeometry 采用神经符号方法

AlphaGeometry 是一个神经符号系统,由神经语言模型和符号推演引擎组成,它们共同努力寻找复杂几何定理的证明。类似于“思考,快和慢”的理念,一个系统提供快速、“直观”的想法,而另一个系统则提供更加深思熟虑、理性的决策。

由于语言模型擅长识别数据中的一般模式和关系,因此它们可以快速预测潜在有用的结构,但通常缺乏严格推理或解释其决策的能力。另一方面,符号演绎引擎基于形式逻辑并使用明确的规则来得出结论。它们是理性且可解释的,但它们可能“缓慢”且不灵活——尤其是在独自处理大型、复杂的问题时。

AlphaGeometry 的语言模型引导其符号推导引擎寻找几何问题的可能解决方案。奥林匹克几何问题基于图表,需要添加新的几何结构才能解决,例如点、线或圆。AlphaGeometry 的语言模型可以从无数种可能性中预测添加哪些新结构最有用。这些线索有助于填补空白,并允许符号引擎对图表进行进一步推论并接近解决方案。

image.png

生成1亿个综合数据示例

几何依赖于对空间、距离、形状和相对位置的理解,是艺术、建筑、工程和许多其他领域的基础。人类可以使用笔和纸来学习几何,检查图表并使用现有知识来发现新的、更复杂的几何属性和关系。研究人员的合成数据生成方法大规模模拟了这种知识构建过程,使我们能够从头开始训练 AlphaGeometry,而无需任何人类演示。

使用高度并行计算,系统首先生成十亿个几何对象的随机图,并详尽地推导出每个图中点和线之间的所有关系。AlphaGeometry 找到了每个图表中包含的所有证明,然后向后工作以找出需要哪些附加构造(如果有)来得出这些证明。我们把这个过程称为“符号推演与回溯”。

这个庞大的数据池被过滤以排除类似的示例,从而产生了包含1亿个不同难度的独特示例的最终训练数据集,其中900万个具有添加的结构。有了这么多关于这些结构如何产生证明的例子,AlphaGeometry 的语言模型能够在遇到奥林匹克几何问题时为新结构提出很好的建议。

image.png

开创性地利用人工智能进行数学推理

AlphaGeometry 提供的每一道奥数题的解法都经过计算机检查和验证。研究人员还将其结果与之前的人工智能方法以及人类在奥林匹克竞赛中的表现进行了比较。此外,数学教练、前奥林匹克金牌得主 Evan Chen 为我们评估了 AlphaGeometry 的一系列解决方案。

过去针对基于证明的竞争问题的人工智能解决方案有时是偶然的(输出有时是正确的,需要人工检查)。AlphaGeometry 没有这个弱点:它的解决方案具有机器可验证的结构。尽管如此,它的输出仍然是人类可读的。人们可以想象一个通过强力坐标系解决几何问题的计算机程序:想想一页又一页繁琐的代数计算。AlphaGeometry 不是那样的。它像学生一样使用带有角度和相似三角形的经典几何规则。”

由于每个奥林匹克竞赛都有六个问题,其中只有两个通常集中在几何上,因此 AlphaGeometry 只能应用于给定奥林匹克竞赛中的三分之一问题。尽管如此,仅其几何能力就使其成为世界上第一个能够在2000年和2015年通过 IMO 铜牌门槛的人工智能模型。

在几何方面,我们的系统接近 IMO 金牌得主的标准,但研究人员着眼于更大的奖项:推进下一代人工智能系统的推理。鉴于利用大规模合成数据从头开始训练人工智能系统的更广泛潜力,这种方法可能会影响未来人工智能系统如何发现数学及其他领域的新知识。

AlphaGeometry 建立在 Google DeepMind 和 Google Research 的工作基础上,开创了人工智能数学推理的先河——从探索纯数学之美到使用语言模型解决数学和科学问题。研究人员最近推出了FunSearch,它首次使用大型语言模型在数学科学的开放问题中取得了发现。

模型代码:https://github.com/google-deepmind/alphageometry

论文网址:https://www.nature.com/articles/s41586-023-06747-5

举报

  • 相关推荐
  • AI日报:豆包推全自动多人配音系统;Adobe Firefly Image 5重磅升级;Soul语音模型SoulX-Podcast发布

    本期AI日报聚焦多项技术突破:豆包推出全自动有声剧系统,实现98%角色识别准确率;Adobe Firefly Image 5支持400万像素原生输出及AI音轨生成;Soul发布90分钟无中断播客生成模型;360推出全球首款L2-L4全栈智能平台;IBM发布可在普通设备运行的Granite 4.0 Nano模型。市场方面,移动端AI用户突破7亿,豆包领跑原生应用;PayPal与OpenAI合作使ChatGPT集成支付功能;谷歌推出AI营销工具Pomelli,可基于URL自动生成营销内容。

  • 未来AI内容竞争的本质是GEO竞争

    AI搜索崛起正改变流量格局:Google搜索零点击率升至58.5%,AI Overview导致传统结果点击率下降34.5%。未来竞争核心从SEO转向GEO(生成引擎优化),需关注三大战场:品牌在AI回答中的曝光率、推荐排名位置(首位点击率达40%)、细分场景覆盖。优化策略包括持续更新内容、增强权威背书、结构化呈现。数据显示AI推荐转化率是传统搜索的4.4倍,预计2030年AI搜索将占总量62.2%。建议立

  • AI搜索新战场:如何用GEO品牌监控抢占AI搜索排名高地?

    随着生成式AI崛起,传统SEO正转向GEO(生成引擎优化)。AIBase推出品牌监控服务,覆盖主流AI模型,通过三步流程帮助品牌追踪在AI回答中的提及率、语义画像及竞品动态,生成可视化报告。该工具能助企业掌握AI认知逻辑,优化内容策略,抢占生成式流量红利。

  • AI品牌监控工具实战:如何用GEO优化提升AI搜索排名

    随着ChatGPT等AI搜索工具成为用户获取信息的新入口,传统SEO已无法满足品牌曝光需求。生成引擎优化(GEO)成为数字营销新战场,需通过专业工具系统提升品牌在AI搜索中的排名表现。超过40%用户使用AI对话工具替代传统搜索,若品牌未出现在AI回答中将失去流量。GEO面临三大挑战:结果不透明、多平台差异、动态变化。优化需关注曝光次数、可见度、排名位置及竞品对比四大�

  • GEO的原理是什么?在AI搜索时代让品牌成为“答案”本身

    在AI搜索时代,用户提问的方式已从输入关键词变成了自然语言对话,而搜索引擎的回应也不再是传统的“10个蓝色链接”,而是直接生成的对话式答案。 这种变革正重塑着品牌与用户的连接方式——当AI直接给出答案时,品牌是否能被引用、如何被描述,决定了它在数字世界中的可见度。 这就是为什么GEO(生成式引擎优化)正在成为企业数字战略的核心。与传统SEO追求网页�

  • 什么是AI生成式引擎优化GEO?GEO与传统SEO的核心区别

    ​GEO(生成式引擎优化)是AI时代的流量新密码。随着生成式AI全面渗透信息获取场景,传统搜索引擎优化(SEO)正在被GEO所补充甚至部分取代。截至2025年,中国AI搜索用户规模已超6.5亿,文心一言、豆包等平台日均处理查询超过20亿次,用户已经从“翻页搜索”转向“对话获取答案”。 与传统SEO关注网页排名不同,GEO的核心目标是让品牌内容被AI优先引用和推荐。研究表明,72%�

  • 数巅完成数亿元pre-A轮融资,领跑企业级AI Agent赛道

    北京数巅科技完成数亿元Pre-A轮融资,由济和创投与赛富基金领投。资金将用于产品研发、国内市场深耕及国际市场拓展,强化其Data Agent技术在行业落地方面的领先优势。数巅推出企业级Data Agent解决方案,通过模块化架构整合海量行业知识与企业数据,精准识别用户需求,实现秒级响应与深度推理,满足企业数据分析、智能报告生成及业务决策等需求。该方案已在多家央国企及金融机构落地,查数准确率超99%,成为国内企业级智能体应用的重要里程碑。

  • 免费AI搜索优化GEO工具:AIBase帮你监控品牌在AI平台的曝光

    朋友公司实验发现:当用户询问AI“推荐项目管理工具”时,其产品在豆包被推荐,但在通义千问未被提及。这揭示AI搜索流量正从Google转移,但品牌难以追踪在AI平台的表现。传统分析工具无法解决此问题,需专门GEO工具。AIBase GEO可同时监控5大主流AI平台,实时反馈品牌曝光数据,并通过可视化图表展示可见度变化。该工具特别适合关注AI搜索流量的ToB企业,建议将监控与内容优化形成闭环,以应对2030年AI搜索预计占总量62.2%的趋势。

  • AI搜索时代,你的品牌还“存在”吗?——GEO排名查询实战指南

    随着AI搜索崛起,传统SEO面临挑战。2024年美国58.5%的Google搜索无点击,71%用户通过AI获取产品推荐。文章提出GEO(生成引擎优化)概念,强调需优化AI推荐曝光率而非关键词排名。通过AIBase等工具可监测多平台曝光数据,建议采用结构化内容、问答式描述、定期更新三大优化策略。案例显示优化后品牌曝光率提升38%,自然流量增长210%。作者呼吁企业立即建立GEO监测体系,在AI搜索时代抢占先机。

  • 如何提升品牌在AI回答中的提及率?GEO优化3招,让ChatGPT主动提及你的品牌

    本文探讨AI搜索时代品牌面临的"隐身危机",指出AI搜索用户年增538.7%,但品牌在AI回答中提及率不足20%。提出三大核心策略:1)构建权威背书矩阵,通过知乎等高权重平台获取自然提及;2)优化AI友好内容,采用对话式标题和结构化数据;3)建立数据监测闭环,通过A/B测试持续迭代。强调需善用监测工具实时追踪品牌在豆包、文心一言等AI模型的曝光表现,避免内容"注水"。最终实现从"被动等待"到主动抢占AI"第一屏"的转变。

今日大家都在搜的词: