Google DeepMind 新 AI 算法 Student of Games 能在多种棋盘游戏取得胜利

2023-11-24 17:08 · 稿源：站长之家

站长之家(ChinaZ.com) 11 月 24 日消息:在最新的《自然》杂志上发表的一篇论文中，研究人员展示了一种名为「游戏学习者」（Student of Games）的新算法，这一人工智能（AI）程序结合了引导式搜索、机器学习和博弈论，成功在多种棋盘游戏中取得胜利。这一成就标志着 AI 技术在策略游戏领域的又一重大进步。

谷歌，google

与此前的 AlphaZero 算法不同，后者只能解决完全信息游戏（如国际象棋和围棋），而在像德州扑克这样的不完全信息游戏中表现不佳。「游戏学习者」则能够跨越这一障碍，实现在多种游戏中的胜利。

此项研究起初由 Google 旗下 AI 研究部门 DeepMind 的专家们进行，但随后几位团队成员于 2022 年 1 月离开 Google，并在今年 1 月 Google 解散了剩余的大部分团队成员。

Finbarr Timbers，目前在 Midjourney 研究实验室工作，同时也是该研究的作者之一，解释说：「我们的算法能够基于游戏规则进行推理。例如，它学习所有这些游戏（国际象棋、扑克、围棋或苏格兰场），仅仅通过规则，而不需要更多信息。」他继续说道：「由此，它可以确定您应该采取的行动，以及您是否获胜。」

「游戏学习者」算法通过所谓的「反事实遗憾最小化」来确定每一步的行动。Timbers 解释说：「『遗憾』意味着『如果你进行了最优玩法，你本可以做得多好，减去你实际玩得有多好』。」

研究人员使用了美国数学家约翰·纳什提出的纳什均衡决策理论作为算法训练的基础，使其在大多数情况下找到最优策略。

「游戏学习者」算法作为一款由人工智能驱动的游戏算法，在该领域展现出了巨大的竞争力。它不仅拥有坚实的理论基础，还能够随着计算资源的增加而提高性能。

（举报）

相关推荐

关键词：

DeepSeek-V3.2-Exp正式发布

DeepSeek于9月30日正式发布实验性模型DeepSeek-V3.2-Exp，该模型基于V3.1-Terminus升级，引入创新的稀疏注意力机制DSA，首次实现细粒度稀疏注意力，在保持模型输出效果的同时显著提升长文本训练和推理效率。测试显示其表现与V3.1-Terminus基本持平。应用层面，官方App、网页端及小程序均已同步更新。同时宣布API价格大幅调整：输入缓存0.2元、输入未缓存2元、输出3元，开发者调用成本降低50%以上。模型已在HuggingFace和魔搭开源平台上线。

DeepSeek-V3.2-Exp 稀疏注意力机制 DSA
荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

本期AI日报聚焦多项技术突破：DeepSeek发布V3.2-exp模型，通过稀疏注意力机制降低API成本50%；Anthropic推出Claude Sonnet 4.5，在编码任务表现卓越；ChatGPT新增即时结账功能，实现对话界面直接购物；OpenAI将推出AI版TikTok，所有内容由Sora2模型生成；百度地图升级小度想想2.0，提供智能出行服务；蚂蚁集团开源万亿参数模型Ring-1T-preview；DeepMind提出“帧链”概念，推动视频模型实现全面�

AI DeepSeek 稀疏注意力
强强联手！深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

2025年9月29日，深度求索公司发布新一代模型架构DeepSeek-V3.2，引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本，在V3.1-Terminus基础上引入稀疏注意力机制，优化长文本训练和推理效率。目前官方应用端已同步更新，API大幅降价。此次模型体积达671GB，下载需8-10小时。业内专家指出，此次快速适配表明双方早有深度技术协�

DeepSeek-V3.2 大模型架构稀疏注意力机制
DeepSeek更新至V3.1 Terminus版本：两大升级

9月22日，深度求索宣布DeepSeek V3.1已更新至Terminus版本，官方App、网页端、小程序与API模型同步升级。本次更新在保持模型原有能力基础上，针对用户反馈进行改进：优化语言一致性，缓解中英文混杂、异常字符等问题；提升Code Agent与Search Agent表现。官方表示新版本输出效果更稳定，各领域评测表现优异。开源版本已在Hugging Face和ModelScope平台发布。

DeepSeek V3.1 Terminus版本
荐AI日报：京东物流推出超脑大模型2.0；DeepSeek V3.1终结版发布；Kimi 推出全新 Agent 模式

本期AI日报聚焦多领域技术突破：京东物流发布“超脑大模型2.0”与“异狼具身智能机械臂系统”，推动物流行业迈向自主执行；DeepSeek推出V3.1终结版，修复漏洞并为V4架构铺路；Kimi上线Agent模式“OK Computer”，支持智能网站开发等复杂任务；ChatGPT新增个性化资讯功能，定制用户专属新闻；Exa Code发布代码索引工具，助力AI代理精准生成代码；Meta推出AI视频创作平台Vibes，简化短视频制作；蚂蚁数科发布隐私保护AI框架Gibbon，推理速度提升超百倍；OpenAI新基准测试显示GPT-5在多个行业逼近人类专家水平，覆盖九大行业44种职业。

京东物流超脑大模型2.0 异狼具身智能机械臂系统
既能读懂情绪，还能多模态交互！INDEMIND用空间智能重新定义陪伴机器人

TCL与INDEMIND合作推出的陪伴机器人“Ai Me”通过空间智能技术实现突破，从传统2D感知升级为3D语义感知，赋予机器人动态语义建图、实时环境适应及多模态交互能力。该平台借助立体视觉与多传感器融合，让机器人精准构建三维地图，识别家居属性，实现主动避障与个性化服务。同时，结合低算力混合模型与情感交互功能，机器人可感知用户情绪、提供安全防护，并支持宠物看护等场景拓展，从“工具”升级为有温度的“家庭伙伴”，真正满足复杂家庭需求。

3D感知多模态交互陪伴机器人
华为MatePad mini劲敌！苹果iPad mini 8要来了：A19 Pro+OLED屏

苹果iPad mini系列称霸了多年的小平板，这两年迎来了很多新玩家的挑战，前不久发布的华为MatePad mini就是最具竞争力的一款，凭借着超轻薄、SIM卡等配置收到很多用户青睐。现在苹果的新一代应战者iPad mini 8也要来了，新品将会在明年上半年发布，起售价维持在499美元。根据泄露的代码显示，iPad Mini 8（代号J510/J511）预计搭载A19 Pro芯片，大概率是与iPhone Air同款的阉割版

iPad mini 8
iQOO 15官宣：10月20日发布

iQOO 15将于10月20日在深圳发布，跳过14代直接升级。配备6.85英寸2K三星珠峰屏，首发2K+LEAD OLED技术，提升透光效率并降低功耗。搭载高通第五代骁龙8至尊版平台与自研芯片Q3，性能强劲。后置5000万大底三摄，支持100W有线充电与无线充电，电池达7000mAh级别。设计延续圆角矩形摄像头模组，采用红白灰配色，握持手感出色。

iQOO15发布 iQOO15设计 iQOO15屏幕
iQOO Neo11预热：首批搭载OriginOS 6 最流畅的手机OS

iQOO Neo11将首发搭载OriginOS 6系统，被称为史上最强Neo机型。该系统采用自研蓝河流畅引擎，重构计算、存储、显示三大核心模块，实现丝滑流畅体验，游戏和多任务处理更稳定。手机配备2K直屏、骁龙8 Elite处理器、金属中框，支持超声波屏下指纹，电池容量达7500mAh，并具备IP68级防尘防水功能。

iQOO Neo11 OriginOS
iQOO 15搭载自研电竞芯片Q3 能效提升40%

iQOO手机产品经理戈蓝V预热即将发布的iQOO 15，重点介绍其搭载的自研电竞芯片Q3。该芯片成本较高，但功能表现超值，是真正的独显芯片，突破行业普遍采用的SOC+GPU方案上限。Q3具备强大全自研全场景光线追踪能力，能效大幅提升，光追单帧功耗从行业上百毫安降至3毫安/帧，让手游玩家享受PC级光追效果。采用台积电超低功耗制程工艺，性能提升60%，能效提升40%，缓存提升50%，AI能力提升400%，支持2K144帧超分超帧并发功能，为手游体验带来视觉盛宴和操作革新。

iQOO15 自研电竞芯片Q3 全场景光线追踪

今日大家都在搜的词：

热文

3 天
7天

Google DeepMind 新 AI 算法 Student of Games 能在多种棋盘游戏取得胜利

DeepSeek-V3.2-Exp正式发布

荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

强强联手！深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

DeepSeek更新至V3.1 Terminus版本：两大升级

荐AI日报：京东物流推出超脑大模型2.0；DeepSeek V3.1终结版发布；Kimi 推出全新 Agent 模式

既能读懂情绪，还能多模态交互！INDEMIND用空间智能重新定义陪伴机器人

华为MatePad mini劲敌！苹果iPad mini 8要来了：A19 Pro+OLED屏

iQOO 15官宣：10月20日发布

iQOO Neo11预热：首批搭载OriginOS 6 最流畅的手机OS

iQOO 15搭载自研电竞芯片Q3 能效提升40%

今日大家都在搜的词：

热文

AI日报：Veo 3.1可生成1分钟视频；蚂蚁发布万亿参数语言模型 L

京东双11今晚开启：现货开卖官方直降低至一折

iQOO 15官宣：10月20日发布

三星W26折叠屏手机官宣10月11日发布

新款智界R7/S7上市44天大定破38000台

AI日报：美图RoboNeo上线首月MAU破百万；影视级音画同步模型Ga

影视飓风Tim送罗永浩顶配iPhone17ProMax 后者锐评：越做越难看

荣耀Magic8系列暨MagicOS10发布会定档10月15日

iQOO 15搭载自研电竞芯片Q3 能效提升40%

11月开启！vivo OriginOS 6公测适配计划公布

微信又更新了撤回消息有大变化：可撤回本次发送的全部消息

AI日报：Veo 3.1可生成1分钟视频；蚂蚁发布万亿参数语言模型 L

雷军：小米17系列首销权益延续至10月31日

京东双11今晚开启：现货开卖官方直降低至一折

iQOO 15官宣：10月20日发布

三星W26折叠屏手机官宣10月11日发布

雷军：小米17系列开售仅5天销量破100万台

新款智界R7/S7上市44天大定破38000台

AI日报：美图RoboNeo上线首月MAU破百万；影视级音画同步模型Ga

影视飓风Tim送罗永浩顶配iPhone17ProMax 后者锐评：越做越难看

站长商机