首页 > 业界 > 关键词  > AI最新资讯  > 正文

经过5万小时训练,AI懂得玩《精灵宝可梦》了

2023-10-19 10:19 · 稿源:站长之家

划重点:

1. 西雅图软件工程师Peter Whidden花费了几年时间训练一个强化学习算法,使其能够玩经典的《精灵宝可梦》游戏,该AI已经进行了超过5万小时的游戏训练。

2. AI的奖励模型奇特,它有时会陷入游戏中的某些地方,甚至停下来欣赏美丽的游戏场景,而不急于完成任务。

3. AI还表现出对某些事件的“情感”,例如失去一只宝可梦后对宝可梦中心产生负面情感。

站长之家(ChinaZ.com)10月19日 消息:AI似乎越来越变得无所不能了,那么AI是否能够玩《精灵宝可梦》?

多年来,西雅图的软件工程师Peter Whidden一直在训练一种强化学习算法,使其能够探索《精灵宝可梦》系列中的第一款经典游戏。在此期间,该AI已经进行了超过5万小时的游戏训练。

Whidden发布了一段时长33分钟的YouTube视频,讲述了AI的开发故事,仅仅在九天内,这段视频就吸引了220万次观看。他已经将自己使用的代码上传到GitHub,以及如何操作和训练AI的说明。

AI的强化模型是一种巴甫洛夫式(Pavlovian,)的模型,它通过奖励积分来鼓励AI提升宝可梦的级别、探索新区域、赢得战斗并击败道馆领主。然而,有时这些奖励并不完全与游戏进展相吻合,但AI的失败却有一种奇特的魅力,这可能是为什么Whidden的视频会走红的原因之一。

image.png

YouTube视频:https://www.youtube.com/watch?v=DcYLT37ImBY

在AI的尝试中,有一次它只是停下来凝视Pallet Town(游戏中的第一个地点)的水,然后一动不动。它陷入了一个充满动画水、草地和来回走动的NPC的地方,这意味着对AI来说,每一帧都像是一次新奇的体验,尽管它只是坐在那里,甚至还没有获得第一只宝可梦。但这个AI并不急着“抓住它们”,它只是在享受坎托地区的美丽(或者可能它是在道德上反对迫使这些可爱的小动物互相对战)。

Whidden在视频中解释说:“根据我们自己的目标,只是停下来欣赏风景比探索世界其他地方更有价值。这是一个在现实生活中我们经常遇到的悖论:好奇心引导我们做出最重要的发现,但同时它也使我们容易受到干扰,陷入困境。”

令人意外的是,这个AI在后来的游戏中经历了类似于创伤事件。它的成功部分取决于队伍中所有宝可梦的总等级。但当AI前往宝可梦中心并大量按按钮将一只宝可梦存入存储中时,所有宝可梦的总等级会急剧下降,向AI发送强烈的负面信号。队伍中有一只叫“AAAAAAAAAA”的宝可梦和一只Pidgey总等级是25,但一旦Pidgey被存入电脑,总等级就只有12了。

Whidden解释说:“它没有像人类一样的情感,但一个极高奖励值的单一事件仍然会对它的行为产生持久的影响。在这种情况下,只有一次失去宝可梦就足以让AI对整个宝可梦中心产生负面情感,并在以后的游戏中完全避开它。”

尽管这个AI能够经历创伤,欣赏Pallet Town的美丽,但它毕竟只是一台计算机。它无法阅读和解释游戏中的对话,因此在早期的尝试中,程序会在游戏中的一个十字路口卡住。当你到达《精灵宝可梦红版》的第二个城镇时,你会得到一个物品,需要带回Pallet Town的宝可梦教授那里。但AI很难回头交付包裹,这使得进一步的游戏进程变得不可能。因此,Whidden跳过了这一部分,使每个游戏都从交付包裹后开始,并以Squirtle作为AI的初始宝可梦,因为游戏的早期部分通常更容易使用水属性宝可梦。

Whidden表示:“在视频中,AI达到的最远地点是位于第一道馆和第二道馆之间的月见山(Mt. Moon)。在早期的《精灵宝可梦》游戏中,洞穴一直以来都令人沮丧,即使是拥有真正人类大脑的人也难以导航。” 但是,Whidden最近在他的代码中进行了一些奖励的调整,并尝试了不同的学习算法,最终,AI设法走出了洞穴,到达了蓝靛城。

其他研究人员已经使用强化学习来研究在游戏中使用AI,就像DeepMind的AlphaGo一样,它是第一个击败职业围棋选手的计算机程序。但Whidden的视频之所以引起如此多的关注,是因为他擅长通过人们熟悉的事物,如《精灵宝可梦》,来解释陌生的概念。

举报

  • 相关推荐
  • 人本位AI倾力打造“AI数据库共享服务中心”, 重塑工业AI时代新纪元!

    传统工业采购与供应模式存在信息壁垒、效率低下、成本高企、信任缺失等痛点。东莞市人本位网络技术有限公司推出“人本位AI询报比价系统”,基于AI智能解析与大数据算法,构建精准高效的智能匹配生态。该系统通过小程序实现供需秒级对接,极大提升供应链效率,为采购方提供一键发布、智能匹配服务,为供应方精准推送高意向订单,推动工业采购从“石器时代”迈向智能化变革。

  • AI日报:拍我AI接入Nano Banana;腾讯智影暂停服务;京东自研京点点AI文案上线

    AI日报栏目每日提供人工智能领域热点内容,聚焦开发者,帮助洞悉技术趋势与创新应用。本期要点包括:拍我AI接入谷歌Nano Banana,推出免费创作活动;京东上线“京点点AI文案”工具,支持商家快速生成高质量文案;腾讯旗下“智影”平台暂停服务;钉钉与OpenDataLab合作推出文档解析工具DLU;ChatGPT向免费用户开放新功能;Anthropic禁止中资企业使用Claude;华纳兄弟起诉Midjourney�

  • 用AI构建智能生态 三星Galaxy开启AI手机主流时代

    过去十余年,智能手机发展从性能提升转向影像升级,如今AI成为核心动力。AI已渗透信息获取、跨应用操作及影像创作等方方面面,改变用户习惯。三星Galaxy AI通过多模态感知与跨应用执行能力,显著提升日常效率。调查显示近半数用户高度依赖AI功能,语音指令使用率与打字相当。AI正从尝鲜走向普及,推动行业进入智能体验主导的新周期。

  • 在抖音,AI让心智成为超级链接

    你有没有想过,为什么有些品牌内容「爆得很玄」,而有些却能精准击中消费者心扉? 以蓝月亮为例,当这个品牌被提及,有人立刻想到其领先的生物科技「秒溶术」,有人脱口而出「至尊洗衣三锦囊」的洗护智慧,还有人联想到它推动的快洗时代变革。 这些多样化的记忆点,不仅塑造了消费者对产品的认知,更在无形中引导着市场需求与品牌之间的精准对接,促成了用户偏

  • 狂奔一年,AI玩具们找到了自己的路

    一年前,AI玩具还被怀疑是概念炒作,需要量产数据去证明这个需求真实存在。经过一年发展,这个市场快速膨胀变大,出现了更多样的产品路径、更大额度的融资和更多愿意为之买单的消费者。 「一年前产品刚推出的时候,我们特别忐忑。」跃然创新CEO李勇告诉我们,当时没有成熟的案例作为参照,不知道能不能卖好,团队只是凭直觉认为,将大模型对话能力和毛绒玩具结�

  • B站要变成AI站

    互联网平台都在跟AI结合,B站没有成为例外。从新一季度财报来看,B站的AI味儿也越来越浓了。 8月21日,B站公布第二季度业绩,总营收达73.4亿元人民币,同比增长20%。其中,游戏业务收入为16.1亿元,同比增长60%,广告业务收入为24.5亿元,同比增长20%。由此推动B站毛利率从去年同期的29.9%提升至36.5%,调整后净利润达到5.6亿元,创下历史最好成绩。 从整体来看,B站生态集聚

  • AI云第一,百度智能云凭什么?

    作为国内AI云首倡者,百度智能云又有了大动作。 2025年8月28日,2025百度云智大会在北京如期拉开帷幕,发布了新一见、百舸5.0、千帆4.0等AI全栈产品,迭代了AI全栈能力,包括雅识教育、心影随形、千寻智能等在内的客户也纷纷展示了合作成果,其中“吴彦祖数字口语陪练”被互联网津津乐道。 当下,AI掀起一场“生产力革命”,持续引领智能涌现,而百度智能云是这场革命

  • 大厂押注的AI和视频化,能成为播客的好出路吗?

    长期在国内市场不温不火的播客赛道,正在焕发出越来越蓬勃的新机。 8月15日,自带流量和多重话题标签的罗永浩入驻B站,并宣布将开启一档视频播客节目《罗永浩的十字路口》,8月19日,罗永浩发布了第一条视频播客,与理想汽车创始人李想进行了近4小时的深度对话,一度引发热议,在B站内的观看量超230万。 而由罗永浩掀起的这一波流量热潮背后,可以看出B站对于视频

  • 央视网首场AI晚会七夕“AI心动夜”即将开启 联合可灵AI打造视听盛宴

    8月28日晚8点,央视频与快手可灵AI联合打造的七夕晚会“AI心动夜”正式开启。晚会以“AI视频叙事+传统文化”为核心,通过AI技术融合文化传承、艺术创作与情感表达,呈现跨越虚拟与现实、科技与文化交融的七夕盛典。节目包括《星河告白》《千年婚服秀》等,展现不同时代的爱情故事与中华婚服之美,同时通过《与妻书》《许愿吧》等作品探讨革命年代的深情与当代浪漫。晚会将在央视频、快手等平台同步直播,带领观众体验科技与文化的精彩碰撞。

  • 红熊AI一年强势崛起,横扫多项全国大奖

    上海算模算样科技(红熊AI)凭借卓越技术创新和商业应用价值,入选“2025中国AI+Agent企业商业落地Top20”,成为榜单中最年轻企业。其自主研发的多智能体协同应用框架能深度理解复杂指令并执行任务,在制造、金融、零售等领域实现应用落地。红熊AI的快速崛起凸显中国AI应用市场潜力,标志技术创新与产业需求结合正推动行业转型升级。

今日大家都在搜的词: