首页 > 业界 > 关键词  > 正文

谷歌 DeepMind 推出 AlphaGeometry:奥林匹克级几何AI系统

2024-01-22 15:12 · 稿源:站长之家

站长之家(ChinaZ.com)1月22日 消息:谷歌旗下的DeepMind研究团队最近推出了名为AlphaGeometry的人工智能系统,该系统在解决几何奥林匹克问题方面表现出色,几乎可与人类金牌得主相媲美。这一成就代表着在大学预科数学困难领域中复杂自动推理能力的显著进步。

几何奥林匹克问题一直以来都被认为是人类层面思考的标准,由于其难度,人工智能在这一领域的应用一直面临挑战,尤其是由于缺乏足够的训练数据。然而,AlphaGeometry的研发团队采用了创新性的方法,通过综合数百万个不同复杂程度的定理和证明,构建了大型数据集进行训练,从而克服了这一问题。

QQ截图20240122151604.jpg

AlphaGeometry专为欧几里得平面几何设计,采用了神经语言模型和符号推演引擎的独特组合。通过创建合成数据进行训练,该系统可以从头开始完全训练,使其能够在数学定理证明方面表现卓越。

在IMO-AG-30基准测试中,该系统在30个经典几何问题中获得了25个问题的成功率,超过了基线,展示了其解决复杂几何问题的能力。AlphaGeometry生成人类可读的证明,提高了答案的可解释性,同时在解决国际数学奥林匹克竞赛(IMO)中的问题方面取得了与金牌得主相媲美的水平。

AlphaGeometry的发布标志着在计算机程序领域中首次实现了比IMO平均候选程序更有效地证明欧几里得平面几何定理的突破,推动了数学竞赛顶峰推理的自动化。

地址:https://github.com/google-deepmind/alphageometry?tab=readme-ov-file

举报

  • 相关推荐
  • DeepSeek专家模式无法上传文件 官方提示:目前资源紧张

    多位网友今日反馈,DeepSeek的专家模式”已无法上传文件,官方提示资源紧张,不支持文件上传”。 经测试,DeepSeek的网页端和App均已下线了专家模式”的上传文件功能。 目前,DeepSeek的快速模式”依然可以上传文件、图片等,不过还是仅识别图片中的文字。

  • 网易新闻、网易小蜜蜂已接入DeepSeek-V4 智能内容与社区体验全面升级

    近日,网易传媒旗下网易新闻和网易小蜜蜂正式接入DeepSeek-V4大模型,全面升级新闻资讯分发、智能内容创作、社区互动及个性化推荐等核心场景。此举旨在提升内容精准度与效率,优化随看随问、跟帖问答、AI搜索等模块,实现全链路智能化。同时,网易小蜜蜂推出“校园龙虾养成计划”,将AI融入年轻用户社交场景,打造趣味养成与社区互动新体验。未来,网易将持续探索AI在内容生态与智能社区领域的创新应用。

  • DeepSeek回应聊天记录搜索:正在灰度测试 并非全量推送

    近日,不少网友在社交平台上发帖称,DeepSeek能查聊天记录了。 今日实测发现,DeepSeek网页版和APP页面均可通过关键词搜索,查询用户和DeepSeek之间的历史聊天内容。 将DeepSeek APP检查更新至2.1.0(213)版本后,其侧边栏顶部会新出现搜索聊天内容”搜索框。 框内输入关键词后页面会显示多条包含这个词的历史聊天记录,点击某条聊天记录即可定位至具体聊天位置。

  • 告别“路痴”!INDEMIND以消费级具身大脑重构家用机器人空间认知

    家用机器人面临的核心困境并非不够智能,而是无法真正“认识”家庭环境。传统方案存在算力依赖高、跨层级语义整合弱等局限,导致空间感知模糊、地图畸变。INDEMIND推出的ROBOMIND,基于10TOPS算力的纯视觉方案,实现全屋三维地图实时构建与动态更新,解决低纹理位姿发散、动静语义解耦等瓶颈。它从“看见”到“理解”,构建空间语义图谱,支持自主避障、动态路径规划与任务调度,并融合语音、手势等多模态交互。通过数据飞轮形成家庭“心智模型”,让机器人从自动化工具进化为能感知、理解、决策的智能伙伴,真正融入家庭生活。

  • DeepSeek首次有了视觉能力,技术论文却被它连夜删掉了

    DeepSeek做了件罕见的事情:在终于开始灰测多模态能力后,它放出了一篇解释背后技术的论文,但这篇论文却在发布没多久就又被悄悄撤掉。 4月29日,DeepSeek研究员陈小康在X发布一条推文——现在,我们可以看见你了。配图中,DeepSeek 标志性的鲸鱼 logo 摘下眼罩,露出了眼睛。 过去,DeepSeek 最被外界熟知的是它在文本、代码和推理任务上的能力。但真实世界里的问题,并不总�

  • 时隔一个月又崩了!DeepSeek网页及API服务出现异常 官方称正在修复

    今日,多名用户在社交平台反馈DeepSeek服务异常,平台对话页面提示服务器繁忙,请稍后重试”。官方服务状态网站显示DeepSeek网页及API服务不可用。今日下午,官方状态页面更新信息,确认问题已定位,正在实施修复。

  • AI日报:DeepSeek识图模式灰测;小红书成立AI一级部门;阿里发布程序员“数字分身”QoderWake

    本期AI日报涵盖8大热点:1. DeepSeek开启多模态识图灰度测试,视觉理解能力落地;2. 文心一言5.1预览版上线LMSYS,全球排名第13;3. 小红书成立AI一级部门“Dots”及海外团队;4. Chrome发布Prompt API,浏览器原生AI时代来临;5. 阿里发布QoderWake,实现代码修复全流程无人值守;6. 蚂蚁集团开源万亿级大模型Ling-2.6-1T;7. 巨日禄与火山引擎合作,AI短剧进入工业化时代;8. Gemini迎史诗级更新,一键生成Office文档。

  • 填补空白!DeepSeek灰度上线识图模式

    DeepSeek正灰度测试识图模式,用户可在网页端和App端上传图片进行内容理解、描述与分析,填补了多模态能力的空白。该模式与快速、专家模式并列,作为独立一级入口存在,表明视觉理解被定位为核心能力。部分用户已可使用,但另一些用户虽看到入口却收到暂不可用的提示。实测显示,当前开放的主要是图片理解能力,涵盖视觉问答、截图分析等场景,尚未支持图像生成、视频理解或跨模态生成,更接近视觉语言模型范畴。

  • DeepSeek API输入缓存降价!只有首发价格的1/10

    国产大模型DeepSeek官方宣布,全系API输入缓存命中价格下调至首发价的1/10,叠加限时优惠后,V4-Pro缓存输入低至0.025元/百万Tokens,创全球大模型价格新低。 本次调价覆盖DeepSeek-V4-Pro、V4-Flash全系列,核心降幅集中在输入缓存命中场景。 DeepSeek-V4-Pro:从1元降至0.1元/百万Tokens,5月5日前叠加2.5折,实付0.025元。 DeepSeek-V4-Flash:从0.2元降至0.02元/百万Tokens,无额外折扣。

  • 满血版DeepSeek V4要来了:补上缺失的多模态关键一环

    DeepSeek V4刚发布还不到5天,光是降价就来了三轮,然而他们的后续动作还很多,马上就要推出满血DeepSeek V4,补上多模态支持。 DeepSeek负责多模态开发的研究员陈小康(xiaokang_chen)今天下午在X上预告新版DeepSeek V4,不出意外就是多模态版的DeepSeek V4了。 此前发布的DeepSeek V4不论Flash还是Pro,都还是纯文本大模型,未免有些遗憾,不是说纯文本没有用,而是多模态支持能力是当�

今日大家都在搜的词: