首页 > 业界 > 关键词  > DeepMind最新资讯  > 正文

DeepMind新国际象棋AI系统AZdb吊打旧系统AlphaZero

2023-08-25 11:18 · 稿源:站长之家

文章概要:

1. 谷歌DeepMind开发了一个集成系统AZdb(AlphaZero Db),将多个AlphaZero代理组合成一个“联盟”,以增强AI国际象棋能力并提高泛化能力。

2.AZdb代理使用行为多样性和响应多样性,创造独特下棋风格,更好适应不同对手和新局面。

3. 测试显示,AZdb解决两倍难题,ELO评分提高50分,优于旧版AlphaZero。

站长之家(ChinaZ.com)8月25日 消息:谷歌DeepMind开发了一个集成系统AZdb,将多个AlphaZero AI系统组合成一个“联盟”,以增强AI国际象棋能力并提高泛化能力。

国际象棋 下棋

DeepMind使用“行为多样性”和“响应多样性”技术,AZdb 的AI系统被训练以不同的方式下棋。根据Google Deepmind 的说法,行为多样性最大化了AI系统之间平均棋子位置的差异,而响应多样性则使AI系统面临针对不同对手的游戏。在实践中,这也意味着 AZdb 的AI系统将看到更多不同的位置,扩大分布数据的范围,这应该允许系统更好地泛化到看不见的位置。

研究人员让AZdb与旧版AlphaZero下棋,结果显示AlphaZero Db的ELO评分提高了50分,在解决困难的国际象棋谜题时成功解题数是AlphaZero的两倍。

这证明了多AI集成的优势,AZdb可以考虑更多可能性,更好地推广到未知棋局。

AlphaZero Db展现了更高的国际象棋水平和泛化能力,这是深度强化学习在游戏领域应用的一个重要进展。多样性的集成为AI的发展提供了新的思路。

举报

  • 相关推荐
  • AI日报:Claude推出Claude Design;DeepSeek开启首轮外部融资;蚂蚁灵光App闪应用突破3000万个

    本期AI日报聚焦多项AI领域动态:Anthropic推出Claude Design,通过文字描述生成专业设计稿,降低非设计师创作门槛;国产大模型DeepSeek开启首轮外部融资,估值超百亿美元;蚂蚁灵光App闪应用突破3000万个,投入1亿元激励创作者。此外,Moonshot AI与清华大学发布PrfaaS架构提升大模型推理效率,NVIDIA开源Lyra 2.0支持单图生成可探索3D场景,德国法院裁定AI二次创作漫画不一定侵权。同时,Anthropic的MCP协议被曝存在重大安全漏洞,而其推出的桌面宠物Claude Buddy硬件由深圳制造,展现了AI与硬件的创新结合。

  • GLM-5.1之后Minimax 2.7正式开源:顶级国产AI就等DeepSeek V4了

    稀宇科技旗下Minimax 2.7大模型已开源,编程能力大幅提升,性能接近Claude Opus和GPT-4 Pro,但价格更低。国产开源大模型已占据全球主要份额,头部包括阿里Qwen、智谱GLM、稀宇Minimax及备受关注的DeepSeek。目前GLM-5.1和Minimax 2.7均已开源,而DeepSeek V4预计4月下旬发布,将全面支持国产AI硬件系统,原生支持多模态,并有望在AI编程方面带来惊喜。

  • 品牌在 DeepSeek/豆包搜索结果中不显示怎么办?GEOBase 一站式诊断 AI 可见度

    2026年,AI搜索(AIGC Search)已成为主流流量入口,品牌面临的最大危机是“AI根本不知道你是谁”。文章分析了全球及中国GEO市场竞争格局,指出市场已形成“综合型大厂”与“技术型精锐”并行的局面,并列举了PureblueAI、蓝色光标等十家头部服务商的核心定位。同时,文章拆解了头部服务商的三种核心策略:RAG适配、引用率保证和语义舆情对冲。针对品牌在AI回答中“消失”的痛点,2026年的工具已从“搜排名”进化到“语义监测”,并介绍了GEO诊断系统、AI引用追踪器等工具如何解决具体问题。最后,文章以GEOBase为例,阐述了其基于“站长之家”背景的差异化竞争优势:权威性、工具化、平民化,以及极致的性价比。

  • INDEMIND:穿越行业周期,机器人最终要回到“家庭琐事”里

    本文探讨了机器人行业的发展方向,强调实用性比炫酷更重要。INDEMIND公司选择聚焦底层技术,致力于让机器人真正理解家庭环境,解决实际问题。其技术发展经历了从视觉模组到ROBOMIND机器人物理AI大脑的完整布局,通过“端云协同”架构控制成本并提升能力。公司认为机器人的核心价值是“解决问题”而非“取悦观众”,并与多家头部企业合作,将技术应用于陪伴、看护等多个领域,推动有用机器人走进千家万户。

  • DeepSeek专家模式上线 此前V4版本已开启灰度测试

    近日,智能交互平台DeepSeek迎来重要更新,正式上线专家模式,旨在为用户在处理复杂问题时提供更为卓越的体验。此次更新是DeepSeek自走红以来,首次在产品端引入模式分层设计,标志着其在功能优化与用户体验提升上迈出了重要一步。 在最新版本的DeepSeek中,用户在输入框上方即可清晰看到新增的“快速模式”与“专家模式”选项。其中,快速模式主要针对日常对话场景设

  • DeepSeek专家模式上线!深度思考+极速Token 复杂难题一键搞定

    DeepSeek正式上线专家模式,进一步提升用户在处理复杂问题时的体验。 最新版本中,DeepSeek输入框上方新增快速模式”与专家模式”,这是DeepSeek走红以来首次在产品端引入模式分层设计。 快速模式侧重日常对话,即时响应速度快,还支持图片和文件文字识别。 专家模式则专注解决复杂问题,支持更深入的思考和智能搜索。尽管尚不确定该模式是否搭载了传闻中的 DeepSeek V4 �

  • 元戎启行冲刺百万级交付,前DeepSeek核心成员阮翀将亮相北京车展

    元戎启行CEO周光透在智能电动汽车发展高层论坛上表示,公司正通过基座模型推动辅助驾驶系统规模化落地,计划2026年实现百万辆量产目标。基座模型能显著降低系统开发与部署成本,使辅助驾驶能力在更大规模车型中落地。随着量产规模扩大,系统将获得更多真实数据,形成“规模-数据-模型”的正向循环,持续提升系统稳定性与安全性。目前搭载其城市NOA方案的量产车辆已超30万辆,累计运行里程超13亿公里。业内分析认为,规模化将成为自动驾驶公司竞争的重要壁垒。

  • DeepSeek V4又又灰度测试:全新界面、多模态重大升级没跑了

    快科技4月7日消息,DeepSeek V4预计本月发布,新模型可能包含快速版、深度版及多模态版三款,支持视觉功能。此前系统崩溃和灰度测试均暗示升级在即。程序员展示的新界面含快速、专家及视觉选项,与现有界面形成对比。此外,DeepSeek至少还有两款使用国产芯片的大模型在开发中。用户期待官方正式发布,并希望推出面向AI编程的特别版。

  • OPPO Pad Mini支持全新AI手写笔:一键批注、灵感成画

    OPPO Pad Mini将于4月21日发布,号称轻薄Mini板王。 今日,OPPO智能生态产品总监乔家栋发布视频,展示了OPPO Pad Mini全新AI手写笔的随手一圈”功能。 据介绍,用户在OPPO Pad Mini上使用AI手写笔随手圈选内容后,草稿即可自动转化为思维导图,同时支持对资料进行一键批注,显著提升学习与办公效率。

  • AI日报:Claude Opus 4. 7发布;阿里开源 Qwen3.6-35B-A3B;Perplexity推出Mac端AI助手

    本期AI日报聚焦多领域技术进展:Anthropic发布Claude Opus 4.7,强调模型可靠性与任务执行稳定性;阿里开源MoE模型Qwen3.6-35B-A3B,以300亿激活参数实现高效编程能力;OpenAI升级Codex,增强Mac桌面操控与多智能体并行;Opera推出“浏览器连接器”,集成多款AI助手;英伟达Lyra2.0实现单图生成90米3D环境;谷歌Gemini接入个人相册推动图像生成个性化;Perplexity发布Mac端AI助手,支持系统级操作;iOS 27 Beta曝光多项Apple Intelligence功能,涵盖营养标签解析与智能照片管理。

今日大家都在搜的词: