在一场精彩绝伦的宝可梦对决中,AI 新星 GPT-5以9517步的佳绩成功通关经典游戏《宝可梦水晶》,击败了游戏中的终极对手赤爷(Red)。这场战斗不仅让直播间瞬间沸腾,观众们纷纷在公屏上刷起 “GG”(Good Game),也将 GPT-5的效率推向了一个新的高峰。
根据推特博主 Clad3815的统计,GPT-5的通关步数远远低于其前任 o3的27040步,后者几乎是 GPT-5的三倍。这意味着 GPT-5只需短短202小时就能完成这一挑战,而 o3则需要近一个月的时间,显然 AI 的速度令人惊叹。
游戏中,玩家需要从小镇出发,收集徽章,挑战道馆馆主,最终与赤爷对决。GPT-5如同小智一般,沿着主线一路推进,收集全部16枚徽章时,仅用了9205步,而 o3则耗费了22334步。更为惊人的是,从收集完徽章到击败赤爷的阶段,GPT-5仅需312步,而 o3却花费了将近5000步,效率提高了十几倍。
在四天王和冠军的挑战中,GPT-5同样展现了超高效率,仅用7329步,o3则用了超过18000步。值得一提的是,GPT-5在通关《宝可梦水晶》之前,还成功挑战了《宝可梦红》,同样取得了压倒性胜利。
OpenAI 的联合创始人 Greg Brockman 对此次表现也表示赞赏,GPT-5在这场宝可梦之战中的表现可圈可点。那么,究竟是什么让 GPT-5如此高效呢?Clad3815总结了几个关键因素:
1. 👁️ 幻觉少,速度快:GPT-5在游戏过程中出现的 “幻觉” 现象明显减少,极大提高了它的速度。
2. 🧠 空间推理强:GPT-5在复杂区域中几乎不迷路,能够有效规划行动序列,节省了大量时间。
3. 🎯 目标规划优越:在执行目标和任务规划方面,GPT-5展现出了卓越的能力。
有趣的是,宝可梦这款经典游戏被认为是 AI 能力的一个 “新基准”,为大型语言模型的决策能力、上下文理解和界面控制能力提供了测试平台。然而,挑战这款游戏的成本不菲,一位网友估计 GPT-5在通关《宝可梦红》时,花费了大约3500美元(约2万5人民币)的 API 额度。