首页 > AI头条  > 正文

谷歌 DeepMind 推出 SIMA 2:一款全新的通用智能体,征战复杂 3D 虚拟世界

2025-11-18 13:55 · 来源: AIbase基地

谷歌 DeepMind 最近发布了 SIMA2,旨在测试通用智能体在复杂3D 游戏世界中的表现。SIMA2(可扩展可指令多世界智能体)在原有基础上进行升级,采用了 Gemini 模型,能够更好地理解目标、解释计划并通过自我学习在不同环境中不断进步。

image.png

SIMA2的前身 SIMA1于2024年问世,当时它通过渲染图像和虚拟键盘鼠标进行控制,学习了600多项语言指令,任务完成率约为31%,而人类玩家的完成率则高达71%。而 SIMA2在保留相同的界面基础上,使用 Gemini2.5Flash Lite 作为核心推理引擎。这使得 SIMA2不仅仅是指令执行者,更成为了与玩家互动的游戏伙伴。

image.png

SIMA2的架构将 Gemini 整合为核心部分,通过接收视觉观察和用户指令,推导出高层目标并产生相应的操作。这种新的训练模式使得智能体能够解释自己的意图,回答有关当前目标的问题,并展示其对环境的推理过程。在 DeepMind 的评估中,SIMA2的任务完成率提升至62%,几乎达到了人类玩家的水平。

SIMA2还扩展了指令渠道,不仅能够理解文本指令,还能处理语音、图形甚至表情符号。在一项演示中,用户要求 SIMA2找到 “像熟透的番茄一样颜色的房子”,它能够推理出 “熟透的番茄是红色的”,并顺利找到目标。

自我改进也是 SIMA2的一大亮点。在初期阶段使用人类的游戏演示后,智能体进入新游戏,完全依靠自己的经验进行学习。Gemini 模型为智能体生成新任务并评分,这使得后续版本在许多之前失败的任务上也能成功,而无需额外的人类演示。

最后,DeepMind 结合 SIMA2与 Genie3,通过单一图像或文本提示生成互动3D 环境,展示了智能体在全新环境中如何识别物体并完成指定任务。这标志着一个通用智能体向更高级的现实世界机器人发展的重要一步。

官方博客:https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/

划重点:  

🌟 SIMA2整合了 Gemini2.5Flash Lite 模型,使智能体具备更高的推理和计划能力。  

📈 SIMA2的任务完成率提升至62%,接近人类玩家的水平,展示出显著的性能改进。  

🛠️ 通过自我改进机制和 Genie3环境生成,SIMA2展现了在全新场景中的适应能力和通用性。

  • 相关推荐
  • 百度发布全球最大通用智能体 活跃用户超2000万

    在百度世界2025大会上,百度正式宣布其智能体产品GenFlow3.0已在百度文库与百度网盘全端上线,目前活跃用户突破2000万,已成为全球规模最大的通用智能体,致力于帮助用户在工作、学习和生活中成为超级个体”。 GenFlow3.0被定位为全球首个全端通用智能体,具备更强大的多模态通用能力,可实现全模态内容的输入、处理与输出。 该产品采用中心化原生Multi-Agent架构,结合行�

  • 百度文库网盘发布GenFlow3.0,活跃用户超2000万,成全球最大通用智能体

    11月13日,百度世界2025大会在京召开,正式发布GenFlow3.0通用智能体,活跃用户超2000万。基于此,百度文库、网盘全面升级,推出Office+Agent与GenX+++Agent两大智能体,支持办公套件操作及跨模态创作,并强化记忆中心与自由画布功能。同时,百度网盘全球上线,文库推出海外AI平台Oreate,9月新版登顶Product Hunt日榜。产品助力用户成为“超级个体”,覆盖工作、学习与生活全场景。

  • AI日报:李飞飞Marble 3D世界模型公测;OpenAI首次推出ChatGPT群聊功能;百度发布多模态 AI助手超能小度

    本期AI日报聚焦多项技术突破:World Labs推出Marble 3D模型,实现多模态生成可交互虚拟世界;OpenAI在韩新试点ChatGPT群聊功能,支持多人协作互动;苹果更新隐私政策,要求第三方AI调用需明示授权;百度发布多模态助手“超能小度”,支持空间感知与设备免费升级;LinkedIn推出AI人脉搜索,通过自然语言精准匹配专业人士;Cursor完成23亿美元融资,估值达293亿;Character AI与耶鲁合作实现音画同步技术Ovi;Google NotebookLM上线深度研究工具,支持多格式文件分析与知识库构建。

  • 华为第一款Pro Max!华为Mate 80 Pro Max四色官图公布

    华为Mate 80系列已经官宣11月25日发布,同时还揭晓这次的四款机型,分别是分别是Mate 80、Mate 80 Pro、Mate 80 Pro Max、Mate 80 RS非凡大师。 其中,Mate 80 Pro Max是全新版本,取代了以往的Pro 系列。 从官网信息来看,Mate 80和Mate 80 Pro应该差距较小,两款机型配备了完全一样的四款配色。

  • 华为Mate 80标准版首次支持3D人脸识别:看齐Pro

    博主数码闲聊站爆料,华为Mate 80全系支持3D人脸识别,包括标准版,这在Mate系列史上还是第一次。 已知Mate 70 Pro系列支持3D人脸识别,其正面采用三挖孔形态,预计Mate 80系列正面也将是三挖孔设计,而且该机还将支持侧边指纹识别。 据悉,全新的华为Mate 80系列共有4款机型,分别是Mate 80、Mate 80 Pro、Mate 80 Pro Max、Mate 80 RS非凡大师。 其中Mate 80和Mate 80 Pro屏幕尺寸是6.75英寸,M

  • 数据分析迎来“智能体”时代,火山引擎披露多智能体架构性能优化关键

    在2025智能大会暨第18届中国R会议上,火山引擎专家分享了Data Agent在业务数据分析中的性能调优实践。报告指出,数据分析正从传统商业智能向数据智能体跃迁,其核心能力扩展到复杂任务的自主执行与决策。Data Agent通过工具生态、运行时管理与安全环境设计,实现全场景覆盖,具备多步骤任务规划与动态调整能力,显著降低企业数据分析门槛并提升洞察效率。未来该技术将融合多模态理解与实时计算能力,在金融、制造、医疗等领域形成规模化落地,成为企业数据价值释放的核心引擎。

  • 谷歌发布Gemini 3 数学能力堪称全球最强

    谷歌正式推出新一代推理模型Gemini 3.0 Pro,在各大评测榜单表现优异:LMArena竞技场以1501分登顶,数学基准测试达23.4%远超同行,编程能力稳居第一梯队,视觉理解准确率高达72.7%达现有水平两倍。该模型基于自研TPU训练,配套发布Agentic编程平台Antigravity,支持多步骤复杂流程自主执行(如智能整理收件箱)。目前通过Gemini应用、AI Studio及API向各类用户开放。

  • 遇到平板电池问题,试试联想想帮帮AI服务智能体的AI智修功能

    联想推出“想帮帮AI服务智能体”,通过AI智修功能解决手机/平板常见故障。用户只需在APP中输入问题,AI即可自动检测电池耗电快、断触、游戏卡顿等异常,结合知识库智能诊断并执行修复。系统具备主动预警、自动修复能力,严重故障时可协助预约售后。该服务覆盖设备全生命周期,提供快速定位、即时处理的一站式解决方案,让用户告别手动排查烦恼。

  • 华为Mate X7外观公布 搭载全新折叠玄武架构

    华为Mate X7折叠屏手机正式亮相,搭载全新超可靠折叠玄武架构,通过80℃热水喷淋、铁球冲击及弯折测试等极限可靠性检测,抗跌落、抗冲击及抗热水性能全面升级。支持IP58/IP59级别防尘抗水,典藏版外屏采用第二代玄武钢化昆仑玻璃,抗摔性能更出色。延续后置四摄与闪光灯布局,影像系统升级至5000万像素可变光圈主摄和潜望长焦镜头,硬件配置麒麟9030芯片,提供12GB/16GB/20GB多种内存版本,满足不同使用需求。

  • 1299元起售!iPhone Pocket发布:采用3D 针织一体结构

    今日下午,苹果发文称,三宅一生携手苹果正式推出新配件iPhone Pocket。 其中短带款提供八种色彩外观:柠檬色、柑橘色、紫色、粉色、孔雀绿色、宝石蓝色、肉桂色和黑色。 长带款提供三种色彩外观:宝石蓝色、肉桂色和黑色。 短带款iPhone Pocket售价为1299元,长带款售价为1899元。

今日大家都在搜的词: