GPT-5通关宝可梦，创下9517步新纪录，效率惊人！

2025-08-27 16:54 · 来源： AIbase基地

在一场精彩绝伦的宝可梦对决中，AI 新星 GPT-5以9517步的佳绩成功通关经典游戏《宝可梦水晶》，击败了游戏中的终极对手赤爷（Red）。这场战斗不仅让直播间瞬间沸腾，观众们纷纷在公屏上刷起 “GG”(Good Game)，也将 GPT-5的效率推向了一个新的高峰。

根据推特博主 Clad3815的统计，GPT-5的通关步数远远低于其前任 o3的27040步，后者几乎是 GPT-5的三倍。这意味着 GPT-5只需短短202小时就能完成这一挑战，而 o3则需要近一个月的时间，显然 AI 的速度令人惊叹。

游戏中，玩家需要从小镇出发，收集徽章，挑战道馆馆主，最终与赤爷对决。GPT-5如同小智一般，沿着主线一路推进，收集全部16枚徽章时，仅用了9205步，而 o3则耗费了22334步。更为惊人的是，从收集完徽章到击败赤爷的阶段，GPT-5仅需312步，而 o3却花费了将近5000步，效率提高了十几倍。

在四天王和冠军的挑战中，GPT-5同样展现了超高效率，仅用7329步，o3则用了超过18000步。值得一提的是，GPT-5在通关《宝可梦水晶》之前，还成功挑战了《宝可梦红》，同样取得了压倒性胜利。

OpenAI 的联合创始人 Greg Brockman 对此次表现也表示赞赏，GPT-5在这场宝可梦之战中的表现可圈可点。那么，究竟是什么让 GPT-5如此高效呢?Clad3815总结了几个关键因素:

1. 👁️ 幻觉少，速度快:GPT-5在游戏过程中出现的 “幻觉” 现象明显减少，极大提高了它的速度。

2. 🧠 空间推理强:GPT-5在复杂区域中几乎不迷路，能够有效规划行动序列，节省了大量时间。

3. 🎯 目标规划优越:在执行目标和任务规划方面，GPT-5展现出了卓越的能力。

有趣的是，宝可梦这款经典游戏被认为是 AI 能力的一个 “新基准”，为大型语言模型的决策能力、上下文理解和界面控制能力提供了测试平台。然而，挑战这款游戏的成本不菲，一位网友估计 GPT-5在通关《宝可梦红》时，花费了大约3500美元（约2万5人民币）的 API 额度。

相关推荐

当GPT-5遇上Gemini 2.5，谁更适合你的业务？这份对比报告说了算

某跨境电商CTO复盘会上展示：GPT-5 Standard处理百万级商品描述时，费用比Gemini 2.5 Flash-Lite高35%，响应速度慢0.8秒。大模型选型面临参数迷雾、场景错配、隐藏成本三重困境。AIbase选型对比平台通过真实数据测试，提供透明价格拆解和性能雷达图，帮助规避预算陷阱。实测显示GPT-5在合同逻辑分析准确率高3.2%，而Gemini表格解析速度快40%、月总成本低26%。工具可动态追踪官方调价，生成定制化决策报告，用数据替代经验主义，提升技术选型效率。

大模型选型参数迷雾场景错配
煌上煌斥资4.95亿收购立兴食品51%股权，进军冻干食品领域

8月11日晚间，卤味行业知名企业煌上煌宣布拟斥资4.95亿元收购福建立兴食品51%股权。立兴食品是国内冻干食品领域龙头企业，拥有37条生产线和8000平方米冻干设备，年产能近6000吨。此次收购标志着煌上煌正式进军冻干食品赛道，将丰富其产品矩阵。冻干食品因营养保留、便携等优势需求快速增长，符合健康便捷的消费趋势。立兴承诺2025-2027年累计扣非净利润不低于2.64亿元。�

资产收购冻干食品多元化发展
荐因为GPT-5，这群人决定在Reddit上起义。

这个周末，对OpenAI的抗诉，好像从未如此热闹过。起因自然还是因为GPT-5。 OpenAI上了GPT-5当天，做了一个非常神奇的操作，他们只保留了GPT-5，然后把GPT-4.5、GPT-4o、o3什么的，全都砍掉了。

GPT-5
GPT-5有望明天发布 OpenAI：免费无限使用

OpenAI宣布将于太平洋时间7月4日上午10点（北京时间7月5日凌晨1点）举办重要直播活动。官方预告中"LIVESTREAM"误写为"LIVE5TREAM"，引发网友猜测可能暗示GPT-5即将发布。消息称免费版ChatGPT将在标准设置下开放GPT-5对话功能，但会设置防滥用阈值；Plus和Pro用户则可享受更智能的GPT-5服务，包括语音交互、绘图创作等高级功能。此前CEO奥特曼曾透露GPT-5将整合多项前沿技术。若属实，这将是AI爱好者的重大福利，也将进一步提升ChatGPT的实用性和用户体验。

OpenAI GPT-5 直播活动
OpenAI正式发布GPT-5模型网友：写作像诗人

OpenAI在直播活动中正式推出新一代人工智能模型GPT-5，宣称其覆盖编程、数学、写作、健康咨询、视觉感知等核心领域，实现"公司迄今为止最重大的模型升级"。OpenAI首席执行官萨姆·奥尔特曼（Sam Altman）形容，与GPT-5交互如同与各领域专家对话，其多维度能力突破将重塑人机协作模式。分层开放策略满足多元需求 GPT-5将于本周四启动全球用户分批推送，免费用户与付�
iPhone17标准版或上高刷苹果2025秋季发布会定档9月10日

今日零点，苹果公司正式揭晓了2025年秋季发布会的邀请函，宣布将于当地时间9月9日上午10点，即北京时间9月10日凌晨1点，盛大开启这场科技盛宴。邀请函设计延续了苹果一贯的简约美学，却又暗藏惊喜，以“前方超燃”为主题，苹果logo融入了独特的液态玻璃效果，预示着发布会将带来前所未有的创新体验。

苹果发布会 iPhone17系列 Apple
OPPO Find X9九月开始预热：首批搭载天玑9500

OPPO Find系列产品负责人周意保与网友互动时暗示，OPPO Find X9系列会在9月开启预热。博主数码闲聊站此前爆料，OPPO Find X9系列会在10月份正式发布，按照惯例，本次发布会将会推出Find X9和Find X9 Pro两款机型。

OPPO Find X9系列
博士水平的GPT-5依然翻车 OpenAI奥特曼：AGI已失去意义

上周末OpenAI公司发布了传闻已久的GPT-5大模型，号称迄今为止最先进的人工智能模型，具备博士级别的智能水平。 GPT-5发布之后在多个榜单上确实刷榜了，包括编程、数学等，总计拿到了25个榜单的第一，评分表现很震撼。然而上线之后，GPT-5的实际表现引发质疑，跑分第一不代表实际体验第一，甚至被不少用户认为表现倒退了，反应也变慢，这可能是OpenAI翻车最快的旗舰大�

GPT-5发布人工智能模型 OpenAI整改
GPT-5横空出世:API最低0.40美元，人人享“博士级智慧”

OpenAI正式发布新一代旗舰模型GPT-5，CEO奥尔特曼称其智能水平如同与博士级专家对话。该模型在写作、编码、医疗等核心领域表现突出，幻觉率大幅降低80%，输出token数量减少50%-80%。GPT-5系列包含多个版本，其中GPT-5nano的API价格低至0.4美元/百万token，极具竞争力。基准测试显示GPT-5以68分位居榜首，超越Grok-4等对手。OpenAI同时宣布向所有用户开放使用，并计划升级语音模式，探索

GPT-5发布博士级智慧 AI竞争格局
减少幻觉、不再谄媚！OpenAI：即日起史上最强大的GPT-5将免费提供给用户

这是我们迄今为止最智能、最快、最实用的模型，具有内置思维，可将专家级智能交到每个人手中。” OpenAI在官方新闻稿中写道，这是我们迄今为止最优秀的人工智能系统。GPT-5的智能性能远超我们之前的所有模型，在编码、数学、写作、健康、视觉感知等领域均拥有卓越的性能。 GPT-5 不仅在基准测试中超越了之前的模型，回答问题的速度也更快，而且最重要的是，它对现�

GPT-5发布人工智能模型 OpenAI

今日大家都在搜的词：

热文

3 天
7天

GPT-5通关宝可梦，创下9517步新纪录，效率惊人！

当GPT-5遇上Gemini 2.5，谁更适合你的业务？这份对比报告说了算

煌上煌斥资4.95亿收购立兴食品51%股权，进军冻干食品领域

荐因为GPT-5，这群人决定在Reddit上起义。

GPT-5有望明天发布 OpenAI：免费无限使用

OpenAI正式发布GPT-5模型网友：写作像诗人

iPhone17标准版或上高刷苹果2025秋季发布会定档9月10日

OPPO Find X9九月开始预热：首批搭载天玑9500

博士水平的GPT-5依然翻车 OpenAI奥特曼：AGI已失去意义

GPT-5横空出世:API最低0.40美元，人人享“博士级智慧”

减少幻觉、不再谄媚！OpenAI：即日起史上最强大的GPT-5将免费提供给用户

今日大家都在搜的词：

热文

SpaceX第10次试飞成功马斯克：星舰这次没有空中爆炸

小米澎湃OS3发布会官宣首批Beta版招募机型公布

AI日报：Wan 2.2-S2V模型即将发布；字节跳动内测3D Model Ge

罗永浩播客节目爆火：24小时播放量超2000万晒成绩单求合作

何小鹏回应小鹏命名：称有人说小鹏改名销量翻倍

iPhone17标准版或上高刷苹果2025秋季发布会定档9月10日

AI日报：字节视频模型Waver 1.0发布；百度AI搜索APP“梯子AI”

网易云音乐：没有“访客记录”功能也不会有其他形式呈现

苹果客服回应4款iPhone将下架：尚未收到任何通知

AI日报：钉钉十周年发布8.0版本；微信悄悄上线AI播客；阿里开源

iPhone17Pro爆料汇总：橙色版本成最大亮点或迎12项升级

SpaceX第10次试飞成功马斯克：星舰这次没有空中爆炸

20周年版iPhone或成苹果首款曲面机：一体环绕玻璃+曲面机身

小米澎湃OS3发布会官宣首批Beta版招募机型公布

24. 98 万起标配华为ADS 4！鸿蒙智行智界 R7 车型上市

AI日报：Wan 2.2-S2V模型即将发布；字节跳动内测3D Model Ge

罗永浩播客节目爆火：24小时播放量超2000万晒成绩单求合作

字节跳动回应即将发布AI眼镜：早期探索阶段没有发布计划

vivo Y500定档9月1日发布配备8200mAh巨无霸电池

站长商机