首页 > 业界 > 关键词  > AI最新资讯  > 正文

经过5万小时训练,AI懂得玩《精灵宝可梦》了

2023-10-19 10:19 · 稿源:站长之家

划重点:

1. 西雅图软件工程师Peter Whidden花费了几年时间训练一个强化学习算法,使其能够玩经典的《精灵宝可梦》游戏,该AI已经进行了超过5万小时的游戏训练。

2. AI的奖励模型奇特,它有时会陷入游戏中的某些地方,甚至停下来欣赏美丽的游戏场景,而不急于完成任务。

3. AI还表现出对某些事件的“情感”,例如失去一只宝可梦后对宝可梦中心产生负面情感。

站长之家(ChinaZ.com)10月19日 消息:AI似乎越来越变得无所不能了,那么AI是否能够玩《精灵宝可梦》?

多年来,西雅图的软件工程师Peter Whidden一直在训练一种强化学习算法,使其能够探索《精灵宝可梦》系列中的第一款经典游戏。在此期间,该AI已经进行了超过5万小时的游戏训练。

Whidden发布了一段时长33分钟的YouTube视频,讲述了AI的开发故事,仅仅在九天内,这段视频就吸引了220万次观看。他已经将自己使用的代码上传到GitHub,以及如何操作和训练AI的说明。

AI的强化模型是一种巴甫洛夫式(Pavlovian,)的模型,它通过奖励积分来鼓励AI提升宝可梦的级别、探索新区域、赢得战斗并击败道馆领主。然而,有时这些奖励并不完全与游戏进展相吻合,但AI的失败却有一种奇特的魅力,这可能是为什么Whidden的视频会走红的原因之一。

image.png

YouTube视频:https://www.youtube.com/watch?v=DcYLT37ImBY

在AI的尝试中,有一次它只是停下来凝视Pallet Town(游戏中的第一个地点)的水,然后一动不动。它陷入了一个充满动画水、草地和来回走动的NPC的地方,这意味着对AI来说,每一帧都像是一次新奇的体验,尽管它只是坐在那里,甚至还没有获得第一只宝可梦。但这个AI并不急着“抓住它们”,它只是在享受坎托地区的美丽(或者可能它是在道德上反对迫使这些可爱的小动物互相对战)。

Whidden在视频中解释说:“根据我们自己的目标,只是停下来欣赏风景比探索世界其他地方更有价值。这是一个在现实生活中我们经常遇到的悖论:好奇心引导我们做出最重要的发现,但同时它也使我们容易受到干扰,陷入困境。”

令人意外的是,这个AI在后来的游戏中经历了类似于创伤事件。它的成功部分取决于队伍中所有宝可梦的总等级。但当AI前往宝可梦中心并大量按按钮将一只宝可梦存入存储中时,所有宝可梦的总等级会急剧下降,向AI发送强烈的负面信号。队伍中有一只叫“AAAAAAAAAA”的宝可梦和一只Pidgey总等级是25,但一旦Pidgey被存入电脑,总等级就只有12了。

Whidden解释说:“它没有像人类一样的情感,但一个极高奖励值的单一事件仍然会对它的行为产生持久的影响。在这种情况下,只有一次失去宝可梦就足以让AI对整个宝可梦中心产生负面情感,并在以后的游戏中完全避开它。”

尽管这个AI能够经历创伤,欣赏Pallet Town的美丽,但它毕竟只是一台计算机。它无法阅读和解释游戏中的对话,因此在早期的尝试中,程序会在游戏中的一个十字路口卡住。当你到达《精灵宝可梦红版》的第二个城镇时,你会得到一个物品,需要带回Pallet Town的宝可梦教授那里。但AI很难回头交付包裹,这使得进一步的游戏进程变得不可能。因此,Whidden跳过了这一部分,使每个游戏都从交付包裹后开始,并以Squirtle作为AI的初始宝可梦,因为游戏的早期部分通常更容易使用水属性宝可梦。

Whidden表示:“在视频中,AI达到的最远地点是位于第一道馆和第二道馆之间的月见山(Mt. Moon)。在早期的《精灵宝可梦》游戏中,洞穴一直以来都令人沮丧,即使是拥有真正人类大脑的人也难以导航。” 但是,Whidden最近在他的代码中进行了一些奖励的调整,并尝试了不同的学习算法,最终,AI设法走出了洞穴,到达了蓝靛城。

其他研究人员已经使用强化学习来研究在游戏中使用AI,就像DeepMind的AlphaGo一样,它是第一个击败职业围棋选手的计算机程序。但Whidden的视频之所以引起如此多的关注,是因为他擅长通过人们熟悉的事物,如《精灵宝可梦》,来解释陌生的概念。

举报

  • 相关推荐
  • 有AI就有无限可能,灰豚AI发布新一代GEO系统

    11月1日,灰豚AI发布新一代GEO系统,突破传统仅支持文本内容优化的局限,全面支持国内短视频平台作品优化,实现近乎零算力成本。该技术被视作行业重大创新,是当前国内GEO源头厂商的重要突破。系统通过AI训练提升企业在生成式搜索中的品牌影响力,助力企业获得竞争优势。未来电商将从平台化转向AI化,灰豚GEO系统支持多种合作模式,让企业以业务增长为导向,抢占AI市场先机。

  • 人类的心声,被AI听见了

    过去一年里,一个看似无意义的Labubu,成为了颇具情绪号召力的符号。 这只表情夸张、眼神狡黠的小兽,从逼仄的盲盒一路爬上潮流顶峰。它既不代表功能,也不传达身份,却让无数年轻人愿意为之排队、抽签。 而这,离不开更大的消费变迁。事后诸葛来看,Labubu的走红并非偶然,而是精准踩中了一个趋势——在这个时代,人们似乎越来越愿意为“情绪价值”付费。 与此�

  • 进博会“全勤生”三星的AI全景图:AI Home中国首秀

    三星在进博会上首次展出AI+Home智能家庭解决方案,通过Bespoke AI、Vision AI和Galaxy AI三大模块,实现全场景智慧生活。AI正从"会语言"向"会行动"演进,软硬件协同成为核心竞争力。三星凭借从芯片到终端的全产业链优势,打破端侧AI的性能、算力与存储"不可能三角",构建起覆盖手机、电视、家电的生态闭环。未来,AI将全面接管生活,让科技真正服务于人。

  • 双11“换芯” 阿里妈妈AI按下加速键

    ​今年双11的不同,在平台对外披露的商家案例中得以一窥究竟。 AI智能选品、AI智能出价、AI智能调控投放节奏..... 这些营销策略的表述来自音箱品牌Marshall,双11第一波段10天活动期内,Marshall在影音电器行业品牌和店铺排名均位居第一;成交转化率提升67%,爆款成交同比增长30%。这波爆发式增长的背后,反复被CUE到的AI可以说是深藏功与名。 绝非只是平台意志的表达,

  • AI搜索时代,品牌流量被“隐形”?AIBase让你精准掌控品牌AI搜索监控

    随着用户习惯向豆包、文心一言等AI助手提问,品牌竞争已从传统搜索引擎转向AI生成答案的“主动提及名单”。AI时代品牌面临三大痛点:内容难被AI推荐、品牌定位被AI误读、竞品提及率远超自身。AIBase推出品牌监控服务,通过全平台覆盖、精准解析品牌画像、GEO指数量化三大核心能力,构建“AI认知透视体系”,帮助品牌实现从“添加-分析-优化”的闭环管理,让复杂AI推荐逻辑变得清晰可操作,成为抢占用户心智的关键工具。

  • AI漫剧,比短剧更短剧?

    “是个人就能起飞的风口”,又来了。 在短剧行业摸爬两年后,飞鸟再次感受到了熟悉的躁动。朋友圈、群聊、行业会都在谈论同一个词——“漫剧”。有人劝他趁早上车,理由几乎与当年如出一辙:“就像当时的短剧,是个人就能起飞。” 所谓漫剧,并没有统一的定义。它们形式多样:有的是用游戏编辑器生成的3D动画,有的是将平面漫画动态化,还有的直接以“熊猫头”等

  • AI日报:HeyGen发布AI视频翻译引擎;科大讯飞推星火 X1.5;QQ浏览器推出AI+小窗

    本期AI日报聚焦多项技术突破:HeyGen推出精准唇形同步的视频翻译引擎;科大讯飞发布星火X1.5大模型,提升多语言处理能力;QQ浏览器新增AI助手浮窗;科大讯飞推出软硬一体方案,实现高噪声环境精准识别;谷歌Gemini 3 Pro预览版支持百万级上下文窗口;Comfy Cloud让Stable Diffusion实现零门槛创作;谷歌Gemini新增深度研究功能,可整合邮件生成智能报告;上海AgiBot机器人10分钟完成复杂制造任务,重塑生产效率。

  • 爆款带动实现第一增长,海尔冰箱又发AI+方案

    2025年冰箱行业竞争加剧,海尔冰箱凭借AI全链路升级实现逆势增长,前三季度市场份额达47.2%。其通过AI交互平台精准洞察用户需求,构建持续爆款孵化体系,如麦浪系列以精准定位和快速迭代创造“一个系列抵一个企业”的市场效应。智能制造端依托灯塔工厂实现5G+AI技术赋能,每10秒下线一台冰箱。营销环节采用全栈AI+全域ToC模式,单场活动获超百万订单。2026年峰会上再推博观、天悦等AI驱动新品,从单品爆款转向系统化孵化,为行业存量竞争提供新思路。

  • 从识别到修复,联想想帮帮AI服务智能体打造你的AI智能维修管家

    AI时代重塑陪伴形式,联想“想帮帮AI服务智能体”以公益之心推出,通过五大功能(智玩、智验、智检、智修、智换)构建全流程闭环服务。它能随时响应、精准诊断、智能优化系统,一键解决电脑卡顿等问题,让用户省时省心。该服务强调责任与长期守护,结合北京领养日公益理念,传递科技向善、服务有爱的智能温度,重新定义AI陪伴的全部意义。

  • 横扫拉美、力压字节系,「AI届的4399」成为出海AI应用新王?

    在 Sensor Tower 发布的 Q3应用出海榜单中,我们注意到了一个特别的 AI 应用「Seekee」。 它空降下载榜 Top9,是当季度在海外获得最多下载量的出海 AI 应用,而由字节跳动出品、近一段时间炙手可热的「Cici」尽管排名上涨,但仅位列第13。

今日大家都在搜的词: