首页 > AI头条  > 正文

AI奥赛金牌战:OpenAI与谷歌DeepMind上演“气氛”对决,谁是真赢家?

2025-07-22 08:54 · 来源: AIbase基地

近日,人工智能领域两大巨头OpenAI和谷歌DeepMind相继宣布,其AI模型在2025年国际数学奥林匹克竞赛(IMO)中荣获金牌。这一成就不仅彰显了人工智能系统惊人的发展速度,也意外点燃了两家公司之间一场关乎“领先地位”认知的激烈竞争。

IMO作为全球历史最悠久、最具挑战性的高中数学竞赛之一,其结果被视为衡量人工智能推理能力的重要基准。去年,谷歌以一个需要人工协助的“正式”系统在IMO中摘得银牌。而今年,OpenAI和谷歌都推出了更先进的**“非正式”系统**,这些系统能够直接从自然语言问题中提取信息,并生成有理有据的答案,无需人工转换。两家公司均声称,其AI模型在IMO考试中正确回答了六道题中的五道,超越了多数高中生和谷歌去年的AI模型表现。

机器人对决

推理模型突破与争议

在接受采访时,OpenAI和谷歌IMO项目的研究人员表示,这些金牌成绩代表了AI推理模型在不可验证领域的突破。这尤其重要,因为传统的AI推理模型擅长解决答案明确的问题(如简单数学或编程),但在解决方案模糊的任务上(如协助复杂研究)则表现欠佳。

然而,围绕此次金牌成绩的**“谁先宣布”和“如何宣布”**,两家公司爆发了激烈的争执。OpenAI在周六早上率先公布其AI模型获得金牌的消息,此举立即引来了谷歌DeepMind首席执行官和研究人员的批评。谷歌DeepMind高级研究员、IMO项目负责人Thang Luong向TechCrunch表示,谷歌选择等待官方结果公布是为了尊重参赛学生,并已与国际数学奥林匹克组织者合作准备考试,并于周一上午才公布了官方结果,该结果获得了IMO主席和官方评分的支持。Luong强调:“国际数学奥林匹克组织者有自己的评分标准。所以,任何不基于该标准的评估都不能声称其成绩达到了金牌水平。”

各执一词,竞争白热化

OpenAI参与IMO模型开发的Noam Brown则解释称,IMO数月前曾邀请OpenAI参加正式竞赛,但因当时专注于开发更具研究价值的自然语言系统而婉拒。Brown表示,OpenAI并不知晓IMO正与谷歌进行非正式测试。OpenAI方面称,他们聘请了三位熟悉评分系统的前IMO奖牌获得者作为第三方评估员,来评估其AI模型的表现。在得知金牌成绩后,OpenAI联系了IMO,但IMO建议其等到周五晚上的颁奖典礼结束后再公布结果。IMO方面尚未对TechCrunch的置评请求做出回应。

尽管谷歌在程序上或许更为严谨,但这场争论的背后,是全球领先AI实验室模型飞速进步的宏大图景。今年全球顶尖高中生齐聚IMO,但只有少数人的得分能与OpenAI和谷歌的AI模型匹敌。这表明,曾经遥遥领先的OpenAI,如今正面临着一场比以往任何时候都更加激烈的竞争。随着OpenAI预计在未来几个月发布GPT-5,维持其在AI领域的领先地位形象,无疑是当前“气氛”之战的关键所在。


  • 相关推荐
  • 秘塔AI也终于悄悄上线了DeepResearch。

    测试完以后,我觉得这玩意,还是值得我将近通宵写一篇的。 深度研究,也就是DeepResearch。 我过去写过很多次秘塔AI了,因为我自己的搜索习惯,现在基本就是,大活上ChatGPT用DeepResearch,常识问答直接找豆包,一般的AI搜索就是秘塔AI。 当然很多ChatBot产品都有AI搜索,但是我自己这两年,还是习惯用秘塔AI和Perplexity这样形态的原生AI搜索产品了,这可能就是习惯的力量吧。

  • 剑指谷歌Chrome!OpenAI即将推出AI浏览器

    据媒体报道,OpenAI即将推出的AI浏览器,利用人工智能技术彻底重塑用户的网络浏览体验,直接向占据市场主导地位的谷歌 Chrome 发起挑战。 凭借庞大的每周4亿活跃ChatGPT用户基础,OpenAI的浏览器若被广泛接纳,将对谷歌的广告生态系统、网络数据流和搜索流量构成实质性威胁。谷歌Chrome长期以来是Alphabet广告业务的基石,为其精准广告投放和将流量导向自家搜索引擎提供了关�

  • OpenAI 30亿收购告吹 谷歌24亿截胡Windsurf

    据媒体报道,原本预计由OpenAI斥资30亿美元收购的热门AI编程初创公司Windsurf,周五突然宣布交易取消,转而与谷歌达成合作。 据悉,谷歌DeepMind正积极招募Windsurf首席执行官Varun Mohan、联合创始人Douglas Chen及多位核心研究人员。虽然谷歌不直接持股或获得控制权,但将投入24亿美元获取Windsurf技术授权并招揽其顶尖人才。 根据协议,谷歌将获得Windsurf部分技术的非独家使用许可�

  • A日报:Kimi开放平台上线Kimi Playground;OpenAI重磅发布ChatGPT Agent;Suno推人声替换功能

    【AI日报】汇总了近期AI领域重要进展:1)月之暗面推出Kimi Playground平台,实现从对话助手到智能助理的转变;2)OpenAI发布ChatGPT Agent,支持自主执行浏览、购物等任务;3)Suno发布v4.5+版本,新增人声替换等音乐创作功能;4)谷歌Veo3视频生成模型上线,支持文本转视频;5)全球首个直播流扩散模型MirageLSD发布,实现实时视频转换;6)VSCode编程助手Traycer提升大型代码库处理效率;7)ART框架支持Python一键训练AI Agent;8)NVIDIA语音识别模型Canary-Qwen-2.5B词错率创新低;9)Mistral AI推出Le Chat挑战ChatGPT;10)百度小度上线首个支持物理交互的MCP Server;11)Lightricks的LTXV模型实现60秒高质量视频生成;12)开源模型LTX-Video13B支持30倍速高清视频生成。

  • INDEMIND:停止堆功能,扫地机器人需要回归第一性原理

    文章批评当前扫地机器人行业过度追求"花哨"功能而忽视核心清洁能力的问题。厂商为差异化竞争不断叠加视频通话、机械手等创新功能,却导致产品复杂化、故障率上升,用户体验未获实质提升。指出行业应回归本质,聚焦感知、规划、决策三大核心能力升级,解决避障不佳、覆盖率低等基础痛点。介绍INDEMIND公司通过立体视觉技术构建三维语义地图,实现厘米级障碍

  • OpenAI发布ChatGPT Agent智能体:支持写代码、做PPT、分析金融

    OpenAI推出ChatGPT智能体,整合网页交互、数据搜索与多模态协作功能,可完成代码生成、PPT制作、金融分析等复杂任务。该智能体融合Operator的网页自动化操作、Deep Research的数据分析能力及优化后的GPT-4对话引擎三大核心模块。目前面向付费用户开放,Pro版近乎无限使用,其他版本每月限50次任务。OpenAI承认其仍存在金融建模需人工验证、非英语文本解析准确率低等技术局限,并

  • 刚刚,OpenAI通用智能体ChatGPT Agent正式登场

    ​Agent AI 时代,比我们想象中来得要早一些。 北京时间周五凌晨,OpenAI 突然开启了新产品直播。 本次发布的是全新的 ChatGPT Agent,它实现了通用智能体(Agent)能力的关键升级。

  • 服务中小微企业,哪家城商行更优?DeepSeek答案是这样的

    文章指出中小企业是中国经济的"毛细血管",贡献了50%以上税收、60%以上GDP、70%以上技术创新和80%以上城镇就业。在融资难题下,城商行是关键一环。宁波银行凭借差异化战略定位、数字化赋能、产品创新和区域深耕,成为服务中小企业的标杆。其通过"四专"模式、智能风控系统和本土化服务,实现普惠小微贷款余额2199亿元,不良率连续18年低于1%。文章认为宁波

  • OpenAI核心模型采用物理隔离:为防窃密 上网需明确许可

    据媒体报道,OpenAI近期全面升级其安全体系,以应对企业间谍活动风险。此次升级的核心举措之一是推出信息隔离”政策,旨在严格限制员工对敏感算法和新产品的访问权限。 例如,在开发o1模型期间,OpenAI规定只有经过严格审查并获得相应权限的团队成员,才可在公共办公区域讨论相关细节。 同时,公司还采取了多项物理与网络安全强化措施:将核心专有技术存储在隔离�

  • 微星PAG 系列电源上市!ATX 3.1 金牌全模组 助力暑假高性能装机

    微星科技推出全新PAG G850/750/650LS PCIE5系列电源,专为高性能平台打造,符合ATX3.1规范,支持PCIe5.1原生接口,售价349元起。关键亮点:1)采用ATX3.1标准设计,可承受2倍整机功耗和3倍显卡功耗的瞬时峰值;2)配备16-Pin PCIe5.1接口,最高单接口输出600W;3)创新异色设计接口,便于判断插头是否插牢;4)通过80PLUS金牌认证,转换效率达90%;5)提供六重保护机制,确保安全稳定。该系列电源为新一代CPU和显卡提供强劲动力支持,是暑期装机的高性价比之选。

今日大家都在搜的词: