首页 > AI头条  > 正文

OpenAI内部神秘 AI一举夺得信息学奥赛金牌,震惊全球!

2025-08-12 08:50 · 来源: AIbase基地

近日,OpenAI 的研究员 Sheryl Hsu 在社交媒体上宣布,他们内部研发的 AI 推理系统在全球顶级编程赛事 ——2025年国际信息学奥林匹克竞赛(IOI)中脱颖而出,获得金牌。这是 AI 首次在该领域达到如此高的成就,更是以绝对优势击败了98% 的参赛人类选手,令人瞩目。

image.png

在这场全球赛事中,OpenAI 的 AI 系统以卓越的表现超越了330位顶尖人类选手,仅有5位选手的成绩高于它。Hsu 特别强调,此次比赛中 AI 完全模拟了人类选手的环境,确保了比赛的公平性。AI 在比赛中是完全断网的,无法访问互联网,这样就杜绝了开卷考试的可能性。

此外,AI 系统也没有调用任何外部知识库,所有的解题逻辑都是由模型内部生成的。与人类选手一样,AI 只有5小时的比赛时间和50次代码提交机会,确保它的表现完全依赖于自身的逻辑推理和问题解决能力。

image.png

值得注意的是,OpenAI 并没有专门为 IOI 竞赛对其模型进行训练或微调。这一切都是基于一个通用推理模型的集成系统(ensemble)。团队的唯一干预是在多个解法中选择最佳的方案进行提交,以及将模型与 IOI 的提交 API 连接。所有解题的过程均由 AI 自主完成,展示了它在复杂算法问题上的强大能力。

在去年的 IOI 比赛中,OpenAI 曾遭遇不小的挫折,最终获得铜牌,仅排在49% 分位。经过一年的努力和改进,今年的 AI 系统一跃而起,从49% 分位飞升至金牌,证明了其卓越的进步与潜力。

最近几周,这一内部推理系统在多个顶级智力竞赛中展现了出色的表现,包括 AtCoder 世界总决赛和国际数学奥林匹克(IMO)等,均取得了优异的成绩。这使得人们对于 OpenAI 的下一代模型充满期待。

  • 相关推荐
  • OpenAI和科大讯飞,瞄准了同一件事

    OpenAI正式发布GPT-5大模型,距离GPT-4推出已29个月。GPT-5虽仍是当前最全面的模型,但性能提升未与主流模型拉开显著差距,部分场景甚至被Grok4和Claude+Opus4.1超越。OpenAI强调此次升级重点在于减少幻觉、提升指令遵循能力和降低模型谄媚性,而非单纯追求性能突破。与此同时,国产大模型代表星火X1也在7月25日升级,同样聚焦解决幻觉问题,在事实性幻觉和忠诚性幻觉治理上取得突破。全球顶尖大模型正从"能用"向"好用"转变,OpenAI和科大讯飞都通过多目标奖励机制和思维链监控等技术手段改善模型可靠性。星火X1已全面赋能教育、医疗、企业应用等行业,在复杂场景任务上满足用户核心需求。大模型产业已进入规模化落地关键期,中国人工智能产业正从追赶走向领先阶段。

  • 博士水平的GPT-5依然翻车 OpenAI奥特曼:AGI已失去意义

    上周末OpenAI公司发布了传闻已久的GPT-5大模型,号称迄今为止最先进的人工智能模型,具备博士级别的智能水平。 GPT-5发布之后在多个榜单上确实刷榜了,包括编程、数学等,总计拿到了25个榜单的第一,评分表现很震撼。 然而上线之后,GPT-5的实际表现引发质疑,跑分第一不代表实际体验第一,甚至被不少用户认为表现倒退了,反应也变慢,这可能是OpenAI翻车最快的旗舰大�

  • GPT-5有望明天发布 OpenAI:免费无限使用

    OpenAI宣布将于太平洋时间7月4日上午10点(北京时间7月5日凌晨1点)举办重要直播活动。官方预告中"LIVESTREAM"误写为"LIVE5TREAM",引发网友猜测可能暗示GPT-5即将发布。消息称免费版ChatGPT将在标准设置下开放GPT-5对话功能,但会设置防滥用阈值;Plus和Pro用户则可享受更智能的GPT-5服务,包括语音交互、绘图创作等高级功能。此前CEO奥特曼曾透露GPT-5将整合多项前沿技术。若属实,这将是AI爱好者的重大福利,也将进一步提升ChatGPT的实用性和用户体验。

  • 用友YonSuite全球化新篇章:One AI-World, One YonSuite

    用友旗下YonSuite发布全球化品牌战略"One AI-World, One YonSuite",标志着其从SaaS工具向智能商业平台的全面升级。该战略基于六年服务万家企业的实践沉淀,提出"六One"模型:统一智能入口、数据中台、AI全场景驱动、产业链协同、全球化运营和客户成功体系。YonSuite已具备1000+智能体、100+AI场景,支持40+国家地区的全球化合规运营,助力企业打破技术、组织和地域壁垒。典型案例显示,其帮助日丰集团实现全球30余家分子公司统一管理,海外系统最快3周上线。在AI与全球化双引擎驱动下,YonSuite正重塑企业级SaaS价值,成为商业文明进化的数字基座。

  • 马斯克宣布Grok4免费开放:全球最强AI模型 学术问题表现已达到博士级别

    马斯克今日上午在社交平台上宣布,Grok 4现在对所有用户免费开放,免费用户每天可完成少量查询,超过限制则需要订阅。 xAI官方介绍,用户只需使用自动”模式,Grok就会将复杂的查询路由到Grok 4。若用户偏好掌控一切”,则可以切换到专家”模式。

  • OpenAI正式发布GPT-5模型 网友:写作像诗人

    OpenAI在直播活动中正式推出新一代人工智能模型GPT-5,宣称其覆盖编程、数学、写作、健康咨询、视觉感知等核心领域,实现"公司迄今为止最重大的模型升级"。OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)形容,与GPT-5交互如同与各领域专家对话,其多维度能力突破将重塑人机协作模式。 分层开放策略满足多元需求 GPT-5将于本周四启动全球用户分批推送,免费用户与付�

  • GPT5上线大翻车!用户强烈呼吁使用旧版 OpenAI重新上线GPT4o

    OpenAI发布最强AI模型GPT-5,但引发用户强烈不满。新模型上线后反应速度变慢、回答质量下降,且官方突然下架GPT-4o等8个旧模型,导致付费用户抗议。部分用户对旧版产生情感依赖,认为GPT-4o更具人性化温暖。第三方测试显示GPT-5在复杂任务上虽有提升,但交互体验明显退步。CEO承认低估用户对旧版的喜爱,承诺将恢复部分旧模型并提供更多定制服务。专家指出大模型边际效益递减,面临数据质量和算力成本限制。总体而言,GPT-5在技术指标进步的同时,牺牲了情感交互体验。

  • 钛动科技亮相ChinaJoy2025,全球营销AI Agent赋能游戏出海新范式

    2025年ChinaJoy盛大开幕,铼动科技携全球首款营销AI+Agent产品Navos强势亮相。Navos通过AI技术覆盖营销全链路,提供出海营销解决方案。展会现场设置"星光奇遇展"和"出海加速站",展示智能营销云、创意生成引擎等创新产品。铼动还联合多家品牌推出互动打卡活动,吸引大量观众参与。线上直播同步进行,2.5小时获5.4万点赞。此次参展重点呈现AI赋能游戏出海的精细化、全球化服务能力,为行业带来"出海新曙光"。(140字)

  • 全球第二大网红 无语哥首次全网官宣中国行

    今日,全球第二大网红无语哥”Khaby Lame,首次全网官宣中国行。 无语哥发文称:想看看唐人街外的中国。”

  • 减少幻觉、不再谄媚!OpenAI:即日起 史上最强大的GPT-5将免费提供给用户

    这是我们迄今为止最智能、最快、最实用的模型,具有内置思维,可将专家级智能交到每个人手中。” OpenAI在官方新闻稿中写道,这是我们迄今为止最优秀的人工智能系统。GPT-5的智能性能远超我们之前的所有模型,在编码、数学、写作、健康、视觉感知等领域均拥有卓越的性能。 GPT-5 不仅在基准测试中超越了之前的模型,回答问题的速度也更快,而且最重要的是,它对现�

今日大家都在搜的词: