首页 > 业界 > 关键词  > 正文

谷歌 DeepMind 推出 AlphaGeometry:奥林匹克级几何AI系统

2024-01-22 15:12 · 稿源:站长之家

站长之家(ChinaZ.com)1月22日 消息:谷歌旗下的DeepMind研究团队最近推出了名为AlphaGeometry的人工智能系统,该系统在解决几何奥林匹克问题方面表现出色,几乎可与人类金牌得主相媲美。这一成就代表着在大学预科数学困难领域中复杂自动推理能力的显著进步。

几何奥林匹克问题一直以来都被认为是人类层面思考的标准,由于其难度,人工智能在这一领域的应用一直面临挑战,尤其是由于缺乏足够的训练数据。然而,AlphaGeometry的研发团队采用了创新性的方法,通过综合数百万个不同复杂程度的定理和证明,构建了大型数据集进行训练,从而克服了这一问题。

QQ截图20240122151604.jpg

AlphaGeometry专为欧几里得平面几何设计,采用了神经语言模型和符号推演引擎的独特组合。通过创建合成数据进行训练,该系统可以从头开始完全训练,使其能够在数学定理证明方面表现卓越。

在IMO-AG-30基准测试中,该系统在30个经典几何问题中获得了25个问题的成功率,超过了基线,展示了其解决复杂几何问题的能力。AlphaGeometry生成人类可读的证明,提高了答案的可解释性,同时在解决国际数学奥林匹克竞赛(IMO)中的问题方面取得了与金牌得主相媲美的水平。

AlphaGeometry的发布标志着在计算机程序领域中首次实现了比IMO平均候选程序更有效地证明欧几里得平面几何定理的突破,推动了数学竞赛顶峰推理的自动化。

地址:https://github.com/google-deepmind/alphageometry?tab=readme-ov-file

举报

  • 相关推荐
  • DeepSeek第三弹:开源DeepGEMM!

    今天上午9点,DeepSeek继续履行开源周承诺,发布了开源DeepGEMM。该帖子一经转发,立即引来了2.1万阅读量,足以见其在国内外受到追捧的热度。本次开源属于DeepSeek开源周”的第三项项目,此前已发布FlashMLA和DeepEP。

  • 微软开源创新框架:可将DeepSeek,变成AI Agent

    微软在官网发布了视觉Agent解析框架OmniParser最新版本V2.0,可将DeepSeek-R1、GPT-4o、Qwen-2.5VL等模型,变成可在计算机使用的AIAgent。与V1版本相比,V2在检测较小的可交互UI元素时准确率更高、推理速度更快,延迟降低了60%。当任务是“点击设置按钮”时,OmniParser不仅提供了设置按钮的边界框和ID提供了其功能描述,颗显著提高了模型的准确性和鲁棒性。

  • 谷歌:我们的Gemma 3,单GPU便能媲美Deepseek

    在AI领域,“经济效益”一直是热门话题,在DeepSeek实现了令人瞠目的规模经济效益之后,谷歌也不甘落后地加紧了步伐。谷歌发布了他们最新的开源大型语言模型Gemma3。需要注意的是,竞争对手使用的H100芯片数量都是谷歌的估计,Deepseek仅披露了一个使用1814块英伟达性能稍弱的H800GPU芯片来作为R1模型提供服务的例子。

  • 双向奔赴!TCL正式成为奥林匹克全球合作伙伴

    2月20日,TCL&奥林匹克全球合作伙伴签约仪式在北京水立方举行。国际奥委会主席巴赫与TCL创始人、董事长李东生出席仪式并完成签约,此次签约标志着TCL正式成为奥林匹克全球合作伙伴。未来TCL将围绕三大核心产业领域持续推进更高水平的全球化布局,持续探索互利共赢的全球化发展新模式,全面开启全球化新时代。

  • Perplexity免费推出Deep Research:性能超过R1、o3-mini等,CEO:感谢DeepSeek

    AI搜索“老大哥”Perplexity,刚刚也推出了自家的DeepResearch——随便给个话题,就能生成有深度的研究报告。先来划个重点:免费向所有人开放!具体来说,非订阅用户每天最多可查询5次,Pro用户每天可查询500次。Perplexity在回答中总结出了一个表格:CEO对此也给出了自己的答案,一言蔽之,就是“快好省”,不过他顺便还阴阳了一波OpenAI:最后,CEO还预告了一则消息,下周Perplexity还有一个很cool的东西要发布。

  • 透过DeepSeek,聊聊存储是如何给AI加速的

    从AI服务器到AIPC,如何快速的用上DeepSeek成为热门问题。无论DeepSeekJanus-Pro把多模态提升到了一个新层次是媲美主流的DeepSeek-V3,或者应用于本地的DeepSeek-V3,对存储都提出了新的需求。从数据中心、服务器,到个人计算机,铠侠为AI计算提供了丰富、高效的存储方案,并与合作伙伴展开深度合作,从软件和硬件层面入手,利用高性能固态硬盘的特性,为AI计算提供可靠的存储后盾,共同探索更多AI的可能性,充分利用AI与数据,创造更多价值。

  • 蝉妈妈AI—电商人专属的DeepSeek

    “AI电商”是近年电商行业内最火热的议题之一,“DeepSeek”横空出示,更是给众多品牌商家带去新的启发。DeepSeek的逻辑推理能力很强,但是其知识库只更新到23年的12月,就算联网也没办法实时获取最新的电商相关数据,对于电商人来说,很难解决当下遇到的难题。「蝉妈妈AI」将持续优化模型与场景适配性,探索AI与电商的深度融合,助力品牌商家在市场中抢占先机。

  • 中青留学:DeepSeek来袭,AI可以替代留学中介吗?

    随着各种人工智能DeepSeek,豆包,Kimi横空出世,AI替代人类的话题再次被摆到大众面前。在留学申请领域,从智能选校到文书润色,AI似乎可以替代很多留学申请工作。如果大家有进一步的留学信息想要咨询,随时可以咨询中青留学,您身边的责任型留学专家。

  • DeepSeek利润神话背后:大厂AI的焦虑和自救

    AI似乎成了大厂的“救命稻草”。无论财报里的亮点数据是隔三岔五的利好信息,都离不开AI。DeepSeek引发的鲇鱼效应未结束。

  • 国内AI应用市场进入DeepSeek时代

    现在打开手机,“接没接DeepSeek”几乎成了国内互联网产品的投名状,就连拉面店都把“大众点评高分推荐”换成了DeepSeek认证。从搜索到内容创作,从大厂到独立开发者,有着不同应用场景、出自不同开发背景的AI产品正批量接入DeepSeek。在回答完这两个问题后,接下来更重要的问题是——如何把技术红利转化成真实的用户体验和商业价值,DeepSeek横空出世开启的这波AI应用内�

热文

  • 3 天
  • 7天