首页 > AI头条  > 正文

GPT-5通关宝可梦,创下9517步新纪录,效率惊人!

2025-08-27 16:54 · 来源: AIbase基地

在一场精彩绝伦的宝可梦对决中,AI 新星 GPT-5以9517步的佳绩成功通关经典游戏《宝可梦水晶》,击败了游戏中的终极对手赤爷(Red)。这场战斗不仅让直播间瞬间沸腾,观众们纷纷在公屏上刷起 “GG”(Good Game),也将 GPT-5的效率推向了一个新的高峰。

根据推特博主 Clad3815的统计,GPT-5的通关步数远远低于其前任 o3的27040步,后者几乎是 GPT-5的三倍。这意味着 GPT-5只需短短202小时就能完成这一挑战,而 o3则需要近一个月的时间,显然 AI 的速度令人惊叹。

image.png

游戏中,玩家需要从小镇出发,收集徽章,挑战道馆馆主,最终与赤爷对决。GPT-5如同小智一般,沿着主线一路推进,收集全部16枚徽章时,仅用了9205步,而 o3则耗费了22334步。更为惊人的是,从收集完徽章到击败赤爷的阶段,GPT-5仅需312步,而 o3却花费了将近5000步,效率提高了十几倍。

在四天王和冠军的挑战中,GPT-5同样展现了超高效率,仅用7329步,o3则用了超过18000步。值得一提的是,GPT-5在通关《宝可梦水晶》之前,还成功挑战了《宝可梦红》,同样取得了压倒性胜利。

OpenAI 的联合创始人 Greg Brockman 对此次表现也表示赞赏,GPT-5在这场宝可梦之战中的表现可圈可点。那么,究竟是什么让 GPT-5如此高效呢?Clad3815总结了几个关键因素:

1. 👁️ 幻觉少,速度快:GPT-5在游戏过程中出现的 “幻觉” 现象明显减少,极大提高了它的速度。

2. 🧠 空间推理强:GPT-5在复杂区域中几乎不迷路,能够有效规划行动序列,节省了大量时间。

3. 🎯 目标规划优越:在执行目标和任务规划方面,GPT-5展现出了卓越的能力。

有趣的是,宝可梦这款经典游戏被认为是 AI 能力的一个 “新基准”,为大型语言模型的决策能力、上下文理解和界面控制能力提供了测试平台。然而,挑战这款游戏的成本不菲,一位网友估计 GPT-5在通关《宝可梦红》时,花费了大约3500美元(约2万5人民币)的 API 额度。

  • 相关推荐
  • 当GPT-5遇上Gemini 2.5,谁更适合你的业务?这份对比报告说了算

    某跨境电商CTO复盘会上展示:GPT-5 Standard处理百万级商品描述时,费用比Gemini 2.5 Flash-Lite高35%,响应速度慢0.8秒。大模型选型面临参数迷雾、场景错配、隐藏成本三重困境。AIbase选型对比平台通过真实数据测试,提供透明价格拆解和性能雷达图,帮助规避预算陷阱。实测显示GPT-5在合同逻辑分析准确率高3.2%,而Gemini表格解析速度快40%、月总成本低26%。工具可动态追踪官方调价,生成定制化决策报告,用数据替代经验主义,提升技术选型效率。

  • 煌上煌斥资4.95亿收购立兴食品51%股权,进军冻干食品领域

    8月11日晚间,卤味行业知名企业煌上煌宣布拟斥资4.95亿元收购福建立兴食品51%股权。立兴食品是国内冻干食品领域龙头企业,拥有37条生产线和8000平方米冻干设备,年产能近6000吨。此次收购标志着煌上煌正式进军冻干食品赛道,将丰富其产品矩阵。冻干食品因营养保留、便携等优势需求快速增长,符合健康便捷的消费趋势。立兴承诺2025-2027年累计扣非净利润不低于2.64亿元。�

  • 因为GPT-5,这群人决定在Reddit上起义。

    ​这个周末,对OpenAI的抗诉,好像从未如此热闹过。 起因自然还是因为GPT-5。 OpenAI上了GPT-5当天,做了一个非常神奇的操作,他们只保留了GPT-5,然后把GPT-4.5、GPT-4o、o3什么的,全都砍掉了。

  • GPT-5有望明天发布 OpenAI:免费无限使用

    OpenAI宣布将于太平洋时间7月4日上午10点(北京时间7月5日凌晨1点)举办重要直播活动。官方预告中"LIVESTREAM"误写为"LIVE5TREAM",引发网友猜测可能暗示GPT-5即将发布。消息称免费版ChatGPT将在标准设置下开放GPT-5对话功能,但会设置防滥用阈值;Plus和Pro用户则可享受更智能的GPT-5服务,包括语音交互、绘图创作等高级功能。此前CEO奥特曼曾透露GPT-5将整合多项前沿技术。若属实,这将是AI爱好者的重大福利,也将进一步提升ChatGPT的实用性和用户体验。

  • OpenAI正式发布GPT-5模型 网友:写作像诗人

    OpenAI在直播活动中正式推出新一代人工智能模型GPT-5,宣称其覆盖编程、数学、写作、健康咨询、视觉感知等核心领域,实现"公司迄今为止最重大的模型升级"。OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)形容,与GPT-5交互如同与各领域专家对话,其多维度能力突破将重塑人机协作模式。 分层开放策略满足多元需求 GPT-5将于本周四启动全球用户分批推送,免费用户与付�

  • iPhone17标准版或上高刷 苹果2025秋季发布会定档9月10日

    今日零点,苹果公司正式揭晓了2025年秋季发布会的邀请函,宣布将于当地时间9月9日上午10点,即北京时间9月10日凌晨1点,盛大开启这场科技盛宴。 邀请函设计延续了苹果一贯的简约美学,却又暗藏惊喜,以“前方超燃”为主题,苹果logo融入了独特的液态玻璃效果,预示着发布会将带来前所未有的创新体验。

  • OPPO Find X9九月开始预热:首批搭载天玑9500

    OPPO Find系列产品负责人周意保与网友互动时暗示,OPPO Find X9系列会在9月开启预热。 博主数码闲聊站此前爆料,OPPO Find X9系列会在10月份正式发布,按照惯例,本次发布会将会推出Find X9和Find X9 Pro两款机型。

  • 博士水平的GPT-5依然翻车 OpenAI奥特曼:AGI已失去意义

    上周末OpenAI公司发布了传闻已久的GPT-5大模型,号称迄今为止最先进的人工智能模型,具备博士级别的智能水平。 GPT-5发布之后在多个榜单上确实刷榜了,包括编程、数学等,总计拿到了25个榜单的第一,评分表现很震撼。 然而上线之后,GPT-5的实际表现引发质疑,跑分第一不代表实际体验第一,甚至被不少用户认为表现倒退了,反应也变慢,这可能是OpenAI翻车最快的旗舰大�

  • GPT-5横空出世:API最低0.40美元,人人享“博士级智慧”

    OpenAI正式发布新一代旗舰模型GPT-5,CEO奥尔特曼称其智能水平如同与博士级专家对话。该模型在写作、编码、医疗等核心领域表现突出,幻觉率大幅降低80%,输出token数量减少50%-80%。GPT-5系列包含多个版本,其中GPT-5nano的API价格低至0.4美元/百万token,极具竞争力。基准测试显示GPT-5以68分位居榜首,超越Grok-4等对手。OpenAI同时宣布向所有用户开放使用,并计划升级语音模式,探索

  • 减少幻觉、不再谄媚!OpenAI:即日起 史上最强大的GPT-5将免费提供给用户

    这是我们迄今为止最智能、最快、最实用的模型,具有内置思维,可将专家级智能交到每个人手中。” OpenAI在官方新闻稿中写道,这是我们迄今为止最优秀的人工智能系统。GPT-5的智能性能远超我们之前的所有模型,在编码、数学、写作、健康、视觉感知等领域均拥有卓越的性能。 GPT-5 不仅在基准测试中超越了之前的模型,回答问题的速度也更快,而且最重要的是,它对现�

今日大家都在搜的词: