首页 > 业界 > 关键词  > AI最新资讯  > 正文

经过5万小时训练,AI懂得玩《精灵宝可梦》了

2023-10-19 10:19 · 稿源:站长之家

划重点:

1. 西雅图软件工程师Peter Whidden花费了几年时间训练一个强化学习算法,使其能够玩经典的《精灵宝可梦》游戏,该AI已经进行了超过5万小时的游戏训练。

2. AI的奖励模型奇特,它有时会陷入游戏中的某些地方,甚至停下来欣赏美丽的游戏场景,而不急于完成任务。

3. AI还表现出对某些事件的“情感”,例如失去一只宝可梦后对宝可梦中心产生负面情感。

站长之家(ChinaZ.com)10月19日 消息:AI似乎越来越变得无所不能了,那么AI是否能够玩《精灵宝可梦》?

多年来,西雅图的软件工程师Peter Whidden一直在训练一种强化学习算法,使其能够探索《精灵宝可梦》系列中的第一款经典游戏。在此期间,该AI已经进行了超过5万小时的游戏训练。

Whidden发布了一段时长33分钟的YouTube视频,讲述了AI的开发故事,仅仅在九天内,这段视频就吸引了220万次观看。他已经将自己使用的代码上传到GitHub,以及如何操作和训练AI的说明。

AI的强化模型是一种巴甫洛夫式(Pavlovian,)的模型,它通过奖励积分来鼓励AI提升宝可梦的级别、探索新区域、赢得战斗并击败道馆领主。然而,有时这些奖励并不完全与游戏进展相吻合,但AI的失败却有一种奇特的魅力,这可能是为什么Whidden的视频会走红的原因之一。

image.png

YouTube视频:https://www.youtube.com/watch?v=DcYLT37ImBY

在AI的尝试中,有一次它只是停下来凝视Pallet Town(游戏中的第一个地点)的水,然后一动不动。它陷入了一个充满动画水、草地和来回走动的NPC的地方,这意味着对AI来说,每一帧都像是一次新奇的体验,尽管它只是坐在那里,甚至还没有获得第一只宝可梦。但这个AI并不急着“抓住它们”,它只是在享受坎托地区的美丽(或者可能它是在道德上反对迫使这些可爱的小动物互相对战)。

Whidden在视频中解释说:“根据我们自己的目标,只是停下来欣赏风景比探索世界其他地方更有价值。这是一个在现实生活中我们经常遇到的悖论:好奇心引导我们做出最重要的发现,但同时它也使我们容易受到干扰,陷入困境。”

令人意外的是,这个AI在后来的游戏中经历了类似于创伤事件。它的成功部分取决于队伍中所有宝可梦的总等级。但当AI前往宝可梦中心并大量按按钮将一只宝可梦存入存储中时,所有宝可梦的总等级会急剧下降,向AI发送强烈的负面信号。队伍中有一只叫“AAAAAAAAAA”的宝可梦和一只Pidgey总等级是25,但一旦Pidgey被存入电脑,总等级就只有12了。

Whidden解释说:“它没有像人类一样的情感,但一个极高奖励值的单一事件仍然会对它的行为产生持久的影响。在这种情况下,只有一次失去宝可梦就足以让AI对整个宝可梦中心产生负面情感,并在以后的游戏中完全避开它。”

尽管这个AI能够经历创伤,欣赏Pallet Town的美丽,但它毕竟只是一台计算机。它无法阅读和解释游戏中的对话,因此在早期的尝试中,程序会在游戏中的一个十字路口卡住。当你到达《精灵宝可梦红版》的第二个城镇时,你会得到一个物品,需要带回Pallet Town的宝可梦教授那里。但AI很难回头交付包裹,这使得进一步的游戏进程变得不可能。因此,Whidden跳过了这一部分,使每个游戏都从交付包裹后开始,并以Squirtle作为AI的初始宝可梦,因为游戏的早期部分通常更容易使用水属性宝可梦。

Whidden表示:“在视频中,AI达到的最远地点是位于第一道馆和第二道馆之间的月见山(Mt. Moon)。在早期的《精灵宝可梦》游戏中,洞穴一直以来都令人沮丧,即使是拥有真正人类大脑的人也难以导航。” 但是,Whidden最近在他的代码中进行了一些奖励的调整,并尝试了不同的学习算法,最终,AI设法走出了洞穴,到达了蓝靛城。

其他研究人员已经使用强化学习来研究在游戏中使用AI,就像DeepMind的AlphaGo一样,它是第一个击败职业围棋选手的计算机程序。但Whidden的视频之所以引起如此多的关注,是因为他擅长通过人们熟悉的事物,如《精灵宝可梦》,来解释陌生的概念。

举报

  • 相关推荐
  • 男子给车充电等待时无聊玩弹弓:打碎动车玻璃被行拘5日

    公共场合玩弹弓无疑会给他人带来危险,如果造成损失,那么则需要承担相应的法律责任。 据央视网报道,在D2347次列车运行途中,有旅客发现4号车厢一扇车窗的外层玻璃突然破裂,随即立刻告诉工作人员并报警。 乘警调查发现玻璃受击打脱落,形成近圆形破孔,直径1厘米,孔周环形裂纹明显,初步推断破损特征符合弹弓击打造成。 结合案发时间以及现场旅客和工作人员�

  • 小鹏MONA M03新版1小时大定破1.2万

    ​昨晚,小鹏汽车全新打造的MONA M03车型正式上市,迅速在市场上掀起了一股热潮。据官方数据显示,新车上市仅1小时,大定量便突破了12566辆,这一数字不仅超过去年同期上市车型的表现,更彰显了消费者对小鹏MONA M03的强烈兴趣。 此次上市的小鹏MONA M03分为PLUS和Max两种版本,共计四款车型,分别面向年轻消费群体的不同需求。PLUS版车型售价区间为11.98-12.98万元,而Max版车�

  • 华为Pura 80系列上架5个小时预约人数破6.5万!交100元订金 可拥有优先取机权

    华为Pura80系列手机预售火爆,上线5小时预约量突破6.5万。6月5日10:08,Pura80 Pro和Pro+率先开启预约,截稿前已有65656人预约。新机将于6月11日18:08正式开售,线下门店已开启100元订金预售,可享优先取机权。Pura80 Pro+采用全新胭红配色搭配弧形金属中框,超大三角镜头模组设计吸睛。影像方面配备50MP超级大底三摄+红枫多光谱镜头,首创一镜双焦段,影像模组成本创历史纪录。新机取消屏下指纹改用侧边指纹,预装鸿蒙5系统。分析师预计该系列销量有望突破千万台,加剧高端手机市场竞争。

  • 小米YU7发布上市:售价25.35万起

    辅助驾驶方面,小米YU7虽然起步较晚,但追赶速度很快。该车出厂自带1000万clips级别的辅助驾驶端到端大模型,已追平当前第一梯队。全系标配全新一代英伟达Thor车载计算平台,最高算力达700TOPS,标配激光雷达,最远有效点阵云距离200米,在暗光环境下也能看得更清楚,还能准确识别异形障碍物。同时,全系标配4D毫米波雷达,提升雨雾天气出行安全,应用摄像头ALD镀膜技术�

  • 女子患癌分手给男友转5万反被起诉 遭后者索要37万元

    ​近日,北京的张女士经历了一段令人唏嘘的感情纠纷。张女士今年58岁,8年前她在网上结识了比自己小14岁的男友,两人相谈甚欢后很快确定了恋爱关系,男方随后搬进张女士家中同居,这一住便是将近8年。 在这8年里,张女士全心全意照顾男友。然而,今年3月1日,男友突然提出分手。原来,张女士在2020年被查出患了乳腺癌,身体每况愈下,精力也大不如前,或许是因为�

  • 京东:两天内已收到近5万家酒店商家入驻申请

    6月18日,京东官宣正式进入酒旅行业。 京东向各酒店经营者发布公开信:参与京东酒店PLUS会员计划”,享最高三年0佣金。 今日,京东黑板报再次发文表示:两天内,京东已经收到了近5万家酒店商家的入驻申请。” 据介绍,京东平台拥有全国超8亿高消费力用户,与全国超30000家大型企业和超800万中小企业客户深度合作。 目前,京东是国内本地生活流量第一阵营的平台,与

  • 外媒:亚马逊正在训练人形AI机器人,用来“送快递”!

    机器人不会疲劳、不需要福利、也无需加班费,对企业而言是极具吸引力的低成本替代者……

  • 3个月回本5万,年轻人如何靠Labubu赚钱?

    “去年一时冲动,花300多买了labubu,结果现在一看2万8了。” 可能没有人想到,labubu摇身一变成为新一代“理财产品”的日子来得这么快。 今年4月,泡泡玛特上线了labubu第三代搪胶毛绒产品“前方高能”系列,甫一发售即被一抢而空,而在千岛平台上,原价99元的labubu均价都在300元以上,隐藏款“本我”的价格更是被炒到了3700元。但这还不是labubu的价格天花板——原价599元�

  • 小米请粉丝喝冰美式咖啡:去小米之家就能领!限量5万瓶

    该活动时间为5月30日-6月8日,活动门店单店活动期间至少45瓶。 而好出片咖啡馆”全国限量1.5万杯,活动门店单店活动期间至少50杯。 小米还温馨提示,图示咖啡仅为示意,小米之家发放咖啡为雀巢瓶装咖啡,好出片咖啡馆”内咖啡以各自门店为准。 此外,自5月29日20:00起,在小米京东自营旗舰店直播间、天猫小米官方旗舰店直播间、抖音小米官方旗舰店直播间、小米商城�

  • 15万最强智能辅助驾驶!MONA 03 MAX版今天上市 何小鹏:比肩友商50万旗舰车

    近日,小鹏汽车宣布,小鹏MONA M03Max版已正式面向全国发运,预计将在5月28日(今日)上市后立即开启交付。 据悉,此次推出的M03Max版,包括502长续航Max、600超长续航Max两个版型。