经过5万小时训练，AI懂得玩《精灵宝可梦》了

2023-10-19 10:19 · 稿源：站长之家

划重点:
1. 西雅图软件工程师Peter Whidden花费了几年时间训练一个强化学习算法，使其能够玩经典的《精灵宝可梦》游戏，该AI已经进行了超过5万小时的游戏训练。
2. AI的奖励模型奇特，它有时会陷入游戏中的某些地方，甚至停下来欣赏美丽的游戏场景，而不急于完成任务。
3. AI还表现出对某些事件的“情感”，例如失去一只宝可梦后对宝可梦中心产生负面情感。

站长之家（ChinaZ.com）10月19日消息:AI似乎越来越变得无所不能了，那么AI是否能够玩《精灵宝可梦》?

多年来，西雅图的软件工程师Peter Whidden一直在训练一种强化学习算法，使其能够探索《精灵宝可梦》系列中的第一款经典游戏。在此期间，该AI已经进行了超过5万小时的游戏训练。

Whidden发布了一段时长33分钟的YouTube视频，讲述了AI的开发故事，仅仅在九天内，这段视频就吸引了220万次观看。他已经将自己使用的代码上传到GitHub，以及如何操作和训练AI的说明。

AI的强化模型是一种巴甫洛夫式（Pavlovian，）的模型，它通过奖励积分来鼓励AI提升宝可梦的级别、探索新区域、赢得战斗并击败道馆领主。然而，有时这些奖励并不完全与游戏进展相吻合，但AI的失败却有一种奇特的魅力，这可能是为什么Whidden的视频会走红的原因之一。

YouTube视频：https://www.youtube.com/watch?v=DcYLT37ImBY

在AI的尝试中，有一次它只是停下来凝视Pallet Town（游戏中的第一个地点）的水，然后一动不动。它陷入了一个充满动画水、草地和来回走动的NPC的地方，这意味着对AI来说，每一帧都像是一次新奇的体验，尽管它只是坐在那里，甚至还没有获得第一只宝可梦。但这个AI并不急着“抓住它们”，它只是在享受坎托地区的美丽(或者可能它是在道德上反对迫使这些可爱的小动物互相对战)。

Whidden在视频中解释说:“根据我们自己的目标，只是停下来欣赏风景比探索世界其他地方更有价值。这是一个在现实生活中我们经常遇到的悖论:好奇心引导我们做出最重要的发现，但同时它也使我们容易受到干扰，陷入困境。”

令人意外的是，这个AI在后来的游戏中经历了类似于创伤事件。它的成功部分取决于队伍中所有宝可梦的总等级。但当AI前往宝可梦中心并大量按按钮将一只宝可梦存入存储中时，所有宝可梦的总等级会急剧下降，向AI发送强烈的负面信号。队伍中有一只叫“AAAAAAAAAA”的宝可梦和一只Pidgey总等级是25，但一旦Pidgey被存入电脑，总等级就只有12了。

Whidden解释说:“它没有像人类一样的情感，但一个极高奖励值的单一事件仍然会对它的行为产生持久的影响。在这种情况下，只有一次失去宝可梦就足以让AI对整个宝可梦中心产生负面情感，并在以后的游戏中完全避开它。”

尽管这个AI能够经历创伤，欣赏Pallet Town的美丽，但它毕竟只是一台计算机。它无法阅读和解释游戏中的对话，因此在早期的尝试中，程序会在游戏中的一个十字路口卡住。当你到达《精灵宝可梦红版》的第二个城镇时，你会得到一个物品，需要带回Pallet Town的宝可梦教授那里。但AI很难回头交付包裹，这使得进一步的游戏进程变得不可能。因此，Whidden跳过了这一部分，使每个游戏都从交付包裹后开始，并以Squirtle作为AI的初始宝可梦，因为游戏的早期部分通常更容易使用水属性宝可梦。

Whidden表示:“在视频中，AI达到的最远地点是位于第一道馆和第二道馆之间的月见山（Mt. Moon）。在早期的《精灵宝可梦》游戏中，洞穴一直以来都令人沮丧，即使是拥有真正人类大脑的人也难以导航。” 但是，Whidden最近在他的代码中进行了一些奖励的调整，并尝试了不同的学习算法，最终，AI设法走出了洞穴，到达了蓝靛城。

其他研究人员已经使用强化学习来研究在游戏中使用AI，就像DeepMind的AlphaGo一样，它是第一个击败职业围棋选手的计算机程序。但Whidden的视频之所以引起如此多的关注，是因为他擅长通过人们熟悉的事物，如《精灵宝可梦》，来解释陌生的概念。

（举报）

相关推荐

关键词：

男子给车充电等待时无聊玩弹弓：打碎动车玻璃被行拘5日

公共场合玩弹弓无疑会给他人带来危险，如果造成损失，那么则需要承担相应的法律责任。据央视网报道，在D2347次列车运行途中，有旅客发现4号车厢一扇车窗的外层玻璃突然破裂，随即立刻告诉工作人员并报警。乘警调查发现玻璃受击打脱落，形成近圆形破孔，直径1厘米，孔周环形裂纹明显，初步推断破损特征符合弹弓击打造成。结合案发时间以及现场旅客和工作人员�

公共场合法律责任弹弓
小鹏MONA M03新版1小时大定破1.2万

昨晚，小鹏汽车全新打造的MONA M03车型正式上市，迅速在市场上掀起了一股热潮。据官方数据显示，新车上市仅1小时，大定量便突破了12566辆，这一数字不仅超过去年同期上市车型的表现，更彰显了消费者对小鹏MONA M03的强烈兴趣。此次上市的小鹏MONA M03分为PLUS和Max两种版本，共计四款车型，分别面向年轻消费群体的不同需求。PLUS版车型售价区间为11.98-12.98万元，而Max版车�

小鹏汽车 MONA M03
华为Pura 80系列上架5个小时预约人数破6.5万！交100元订金可拥有优先取机权

华为Pura80系列手机预售火爆，上线5小时预约量突破6.5万。6月5日10:08，Pura80 Pro和Pro+率先开启预约，截稿前已有65656人预约。新机将于6月11日18:08正式开售，线下门店已开启100元订金预售，可享优先取机权。Pura80 Pro+采用全新胭红配色搭配弧形金属中框，超大三角镜头模组设计吸睛。影像方面配备50MP超级大底三摄+红枫多光谱镜头，首创一镜双焦段，影像模组成本创历史纪录。新机取消屏下指纹改用侧边指纹，预装鸿蒙5系统。分析师预计该系列销量有望突破千万台，加剧高端手机市场竞争。

华为Pura80系列华为Pura80Pro 新机预约人数
小米YU7发布上市：售价25.35万起

辅助驾驶方面，小米YU7虽然起步较晚，但追赶速度很快。该车出厂自带1000万clips级别的辅助驾驶端到端大模型，已追平当前第一梯队。全系标配全新一代英伟达Thor车载计算平台，最高算力达700TOPS，标配激光雷达，最远有效点阵云距离200米，在暗光环境下也能看得更清楚，还能准确识别异形障碍物。同时，全系标配4D毫米波雷达，提升雨雾天气出行安全，应用摄像头ALD镀膜技术�

小米YU7 轿跑SUV 购车福利
女子患癌分手给男友转5万反被起诉遭后者索要37万元

近日，北京的张女士经历了一段令人唏嘘的感情纠纷。张女士今年58岁，8年前她在网上结识了比自己小14岁的男友，两人相谈甚欢后很快确定了恋爱关系，男方随后搬进张女士家中同居，这一住便是将近8年。在这8年里，张女士全心全意照顾男友。然而，今年3月1日，男友突然提出分手。原来，张女士在2020年被查出患了乳腺癌，身体每况愈下，精力也大不如前，或许是因为�

感情纠纷分手心酸乳腺癌影响
京东：两天内已收到近5万家酒店商家入驻申请

6月18日，京东官宣正式进入酒旅行业。京东向各酒店经营者发布公开信：参与京东酒店PLUS会员计划”，享最高三年0佣金。今日，京东黑板报再次发文表示：两天内，京东已经收到了近5万家酒店商家的入驻申请。” 据介绍，京东平台拥有全国超8亿高消费力用户，与全国超30000家大型企业和超800万中小企业客户深度合作。目前，京东是国内本地生活流量第一阵营的平台，与

京东酒旅行业酒店PLUS会员
外媒：亚马逊正在训练人形AI机器人，用来“送快递”！

机器人不会疲劳、不需要福利、也无需加班费，对企业而言是极具吸引力的低成本替代者……

亚马逊人形机器人亚马逊AI机器人 AI机器人
荐3个月回本5万，年轻人如何靠Labubu赚钱？

“去年一时冲动，花300多买了labubu，结果现在一看2万8了。” 可能没有人想到，labubu摇身一变成为新一代“理财产品”的日子来得这么快。今年4月，泡泡玛特上线了labubu第三代搪胶毛绒产品“前方高能”系列，甫一发售即被一抢而空，而在千岛平台上，原价99元的labubu均价都在300元以上，隐藏款“本我”的价格更是被炒到了3700元。但这还不是labubu的价格天花板——原价599元�

labubu 泡泡玛特玩具投资
小米请粉丝喝冰美式咖啡：去小米之家就能领！限量5万瓶

该活动时间为5月30日-6月8日，活动门店单店活动期间至少45瓶。而好出片咖啡馆”全国限量1.5万杯，活动门店单店活动期间至少50杯。小米还温馨提示，图示咖啡仅为示意，小米之家发放咖啡为雀巢瓶装咖啡，好出片咖啡馆”内咖啡以各自门店为准。此外，自5月29日20:00起，在小米京东自营旗舰店直播间、天猫小米官方旗舰店直播间、抖音小米官方旗舰店直播间、小米商城�

小米Civi 5 Pro
15万最强智能辅助驾驶！MONA 03 MAX版今天上市何小鹏：比肩友商50万旗舰车

近日，小鹏汽车宣布，小鹏MONA M03Max版已正式面向全国发运，预计将在5月28日（今日）上市后立即开启交付。据悉，此次推出的M03Max版，包括502长续航Max、600超长续航Max两个版型。

小鹏汽车 MONA M03Max

热文

3 天
7天

经过5万小时训练，AI懂得玩《精灵宝可梦》了

男子给车充电等待时无聊玩弹弓：打碎动车玻璃被行拘5日

小鹏MONA M03新版1小时大定破1.2万

华为Pura 80系列上架5个小时预约人数破6.5万！交100元订金可拥有优先取机权

小米YU7发布上市：售价25.35万起

女子患癌分手给男友转5万反被起诉遭后者索要37万元

京东：两天内已收到近5万家酒店商家入驻申请

外媒：亚马逊正在训练人形AI机器人，用来“送快递”！

荐3个月回本5万，年轻人如何靠Labubu赚钱？

小米请粉丝喝冰美式咖啡：去小米之家就能领！限量5万瓶

15万最强智能辅助驾驶！MONA 03 MAX版今天上市何小鹏：比肩友商50万旗舰车

热文

小米预告AI眼镜雷军：自带小爱同学啥都能直接问

雷军称YU7定价合理：希望大家猜测YU7价格要讲科学

罗永浩回应为何总能融到钱并回击谩骂

雷军分享小米端到端辅助驾驶进展：YU7全系搭载 SU7下月升级

2025新财富500创富榜发布：张一鸣问鼎首富梁文锋进前十

小米MIX Flip 2外观公布：配备骁龙8至尊版、5165mAh电池

中消协发倡议抵制极端吃播：平台应严格识别、及时下架

苹果官网首次支持国补目前仅限北京收货地址及上海线下购买

小米预告AI眼镜雷军：自带小爱同学啥都能直接问

雷军称YU7定价合理：希望大家猜测YU7价格要讲科学

罗永浩回应为何总能融到钱并回击谩骂

雷军分享小米端到端辅助驾驶进展：YU7全系搭载 SU7下月升级

站长商机