首页 > AI头条  > 正文

AI实力大比拼:OpenAI与谷歌在国际数学奥林匹克赛中双双夺金!

2025-07-22 15:18 · 来源: AIbase基地

在刚刚结束的2025年国际数学奥林匹克(IMO)比赛中,OpenAI 和谷歌的 AI 模型表现出色,双双获得金牌。这场比赛是世界上历史最悠久、难度最大的高中数学竞赛之一,参赛者们的智力和才华备受瞩目。两家公司独立宣布了这一佳绩,展示了 AI 系统的迅速发展,同时也让人们感受到它们在 AI 领域的竞争愈演愈烈。

去年,谷歌在 IMO 比赛中获得了银牌,使用的是一种 “正式” 系统,这意味着需要人类将问题转化为机器可读的格式。而今年,OpenAI 和谷歌都使用了 “非正式” 系统,能够直接处理问题并生成自然语言的证明性答案。他们声称,各自的 AI 模型在比赛中成功回答了六道题目中的五道,成绩超越了大多数参赛高中生以及谷歌去年使用的 AI 模型。

image.png

在接受采访时,两家公司的研究人员表示,这一金牌成绩代表了在非可验证领域中 AI 推理模型的重大突破。然而,谷歌对 OpenAI 的得分公告提出了质疑,认为 OpenAI 过早宣布了这一成绩,并未经过 IMO 的官方评估。

谷歌 DeepMind 的 CEO 和研究人员们在社交媒体上对 OpenAI 进行了批评,认为其在 IMO 宣布成绩时并没有遵循比赛的正式程序。谷歌的研究人员强调,他们在公布成绩前与 IMO 组织者进行了充分沟通,以尊重参赛学生。

OpenAI 方面则回应称,他们聘请了三位前 IMO 奖牌得主作为第三方评估人员,对模型表现进行了打分,认为自己完全符合比赛的标准。

尽管谷歌的质疑不无道理,但这场争论可能掩盖了更大的背景:多家顶尖 AI 实验室的模型正迅速提升实力。今年,来自世界各地的优秀学生参加 IMO,而 OpenAI 和谷歌的 AI 模型取得的成绩也仅有几百分之一的学生能及,这反映了 AI 技术的飞速进步。

随着 OpenAI 预计在未来几个月内推出 GPT-5,AI 行业的竞争将进一步升级。尽管 OpenAI 曾一度领先,但如今的局面显示出竞争的紧迫感与激烈。

  • 相关推荐
  • 官宣 | 蕾特恩与国家奥林匹克体育中心达成战略合作

    2025年7月9日,蕾特恩集团与国家奥体中心达成战略合作,获授"国家奥体中心供应商"称号。国家奥体中心副主任张红霞、蕾特恩总裁郑金清等出席授牌仪式。此次合作标志着蕾特恩从美容产业向全民健康领域拓展,其系列产品将应用于国家运动员训练及全民健身场景。奥运冠军雷声作为运动员代表发言,强调科学护肤对运动表现的重要性。双方将共同推进"体医融合",助力体育强国与健康中国建设。此次合作既为奥体中心提供专业支持,也为蕾特恩品牌开辟新发展空间。

  • 谷歌24亿收购Windsurf击败OpenAI,Meta/微美全息竞相扩充AI战略布局

    谷歌以24亿美元收购AI编程初创公司Windsurf,原计划由OpenAI斥资30亿美元收购的交易突然取消。Windsurf年收入已达1亿美元,其核心团队将加入谷歌DeepMind。同时,Meta收购AI语音公司PlayAI,加强自然语音生成能力。微美全息等企业也在积极布局"AI+"赛道,推动多场景应用。全球科技巨头正通过收购和人才争夺加速AI领域布局,AI技术已成为推动行业变革的核心引擎,未来竞争将围绕技术创新和商业化应用展开。

  • OpenAI 30亿收购告吹 谷歌24亿截胡Windsurf

    据媒体报道,原本预计由OpenAI斥资30亿美元收购的热门AI编程初创公司Windsurf,周五突然宣布交易取消,转而与谷歌达成合作。 据悉,谷歌DeepMind正积极招募Windsurf首席执行官Varun Mohan、联合创始人Douglas Chen及多位核心研究人员。虽然谷歌不直接持股或获得控制权,但将投入24亿美元获取Windsurf技术授权并招揽其顶尖人才。 根据协议,谷歌将获得Windsurf部分技术的非独家使用许可�

  • 剑指谷歌Chrome!OpenAI即将推出AI浏览器

    据媒体报道,OpenAI即将推出的AI浏览器,利用人工智能技术彻底重塑用户的网络浏览体验,直接向占据市场主导地位的谷歌 Chrome 发起挑战。 凭借庞大的每周4亿活跃ChatGPT用户基础,OpenAI的浏览器若被广泛接纳,将对谷歌的广告生态系统、网络数据流和搜索流量构成实质性威胁。谷歌Chrome长期以来是Alphabet广告业务的基石,为其精准广告投放和将流量导向自家搜索引擎提供了关�

  • 刚刚,OpenAI通用智能体ChatGPT Agent正式登场

    ​Agent AI 时代,比我们想象中来得要早一些。 北京时间周五凌晨,OpenAI 突然开启了新产品直播。 本次发布的是全新的 ChatGPT Agent,它实现了通用智能体(Agent)能力的关键升级。

  • SpaceX将向xAI投资20亿美元:加强对抗OpenAI

    SpaceX已承诺向xAI投资20亿美元,作为其50亿美元股权融资的一部分。在马斯克旗下xAI加速追赶竞争对手OpenAI之际,此举进一步强化了其旗下公司的协同效应。 紧随xAI与X的合并完成,这笔投资使合并后公司估值跃升至1130亿美元。目前,Grok聊天机器人已应用于星链(Starlink)客服业务,并计划未来集成至特斯拉(Tesla)的Optimus人形机器人。 不过,Grok近期因其部分回复内容引发争

  • OpenAI发布ChatGPT Agent智能体:支持写代码、做PPT、分析金融

    OpenAI推出ChatGPT智能体,整合网页交互、数据搜索与多模态协作功能,可完成代码生成、PPT制作、金融分析等复杂任务。该智能体融合Operator的网页自动化操作、Deep Research的数据分析能力及优化后的GPT-4对话引擎三大核心模块。目前面向付费用户开放,Pro版近乎无限使用,其他版本每月限50次任务。OpenAI承认其仍存在金融建模需人工验证、非英语文本解析准确率低等技术局限,并

  • A日报:Kimi开放平台上线Kimi Playground;OpenAI重磅发布ChatGPT Agent;Suno推人声替换功能

    【AI日报】汇总了近期AI领域重要进展:1)月之暗面推出Kimi Playground平台,实现从对话助手到智能助理的转变;2)OpenAI发布ChatGPT Agent,支持自主执行浏览、购物等任务;3)Suno发布v4.5+版本,新增人声替换等音乐创作功能;4)谷歌Veo3视频生成模型上线,支持文本转视频;5)全球首个直播流扩散模型MirageLSD发布,实现实时视频转换;6)VSCode编程助手Traycer提升大型代码库处理效率;7)ART框架支持Python一键训练AI Agent;8)NVIDIA语音识别模型Canary-Qwen-2.5B词错率创新低;9)Mistral AI推出Le Chat挑战ChatGPT;10)百度小度上线首个支持物理交互的MCP Server;11)Lightricks的LTXV模型实现60秒高质量视频生成;12)开源模型LTX-Video13B支持30倍速高清视频生成。

  • 霍涛带领白山云走进2025中国AI算力大会,共话算力变局

    2025中国AI算力大会于6月26日在北京中关村开幕,主题为"智领未来"。大会汇聚了中国信通院、中科院、中国移动研究院等机构及企业代表。白山云科技在霍涛带领下参展,分享了边缘算力推理服务的技术突破与实践,包括:1)异架构算力弹性调度技术实现5秒内实例启动;2)大文件加载优化技术将35MB以上模型加载时间从10分钟缩短至20秒;3)算力服务单元推理优化技术使GPU利用率从27%提升至56%。目前白山云已在全球部署1700+边缘节点,与150+海外运营商互联,致力于构建低时延、高安全、低成本的AI推理基础设施,打造日处理万亿Token请求的平台。

  • 领先OpenAI三个月,百度文库GenFlow领跑通用Agent领域,2.0版本8月上线

    百度文库即将在8月发布GenFlow2.0版本,该版本具备更强大的多模态能力,支持生成多种内容形态,大幅缩短任务交付时间。相比OpenAI同日发布的ChatGPT+Agent,百度文库早在4月就已上线GenFlow1.0,实现全场景覆盖和全链路调度。GenFlow基于MoE架构,在成本、性能和效率上占优,能快速生成PPT、研报等多样化内容,且依托百度14亿专业文档资源,内容质量更可靠。此外,GenFlow还能调用用户个人数据实现个性化定制,并提供内容后期编辑功能,灵活性更高。

今日大家都在搜的词: