首页 > 业界 > 关键词  > Agents最新资讯  > 正文

又整活儿?谷歌推Agents SIMA 可让角色在任何3D游戏场景中蹦跶

2024-03-14 10:43 · 稿源:站长之家

站长之家(ChinaZ.com)3月14日 消息:谷歌推出了一款名为Agents SIMA的新型AI系统,专门设计用于在任何3D游戏中自主行动。这种系统能够根据自然语言指令在多种视频游戏设置中执行任务,标志着AI代理展示了在广泛游戏世界中理解指令并执行任务的能力,类似于人类的操作方式。

image.png

项目地址:https://top.aibase.com/tool/sima

SIMA的目标不仅在于在游戏中获得高分,更重要的是学会在多种游戏环境中理解和执行自然语言指令,这将有助于开发更通用实用的AI系统。为了训练和测试SIMA,DeepMind与多家游戏工作室合作,在9种不同类型的游戏中对SIMA进行训练,使其能够适应不同的虚拟环境。

SIMA包含两个核心模型:一个用于精确图像-语言映射,另一个用于预测接下来的画面。这两个模型都在特定的3D游戏环境数据上进行了微调。SIMA的接口设计简洁,只需游戏画面和自然语言指令作为输入,并通过键鼠操作来控制游戏角色。这种人性化的交互方式使SIMA能够与各种虚拟环境互动。

目前SIMA已经掌握了600项基础技能,未来希望能够执行更高级复杂的任务,如资源采集、营地建设等,这需要战略规划和子任务拆解的能力。SIMA代表了以语言驱动的通用AI代理的发展方向。随着在更多环境中的训练以及模型性能的提升,SIMA有望成长为一个更加全能和智能的AI助手,服务于现实世界中的各种任务。

举报

  • 相关推荐
  • 谷歌A2A协议是什么? MCP 和 Agent2Agent 有什么区别?

    4月10日,在GoogleCloudNext大会上,谷歌宣布开源Agent2Agent协议,这一协议被业界视为智能体交互领域的“通用语言”,旨在突破跨平台、多模态协作及安全保障等核心技术瓶颈,并联合全球50余家科技企业共同构建新一代智能生态。本文从技术实现与行业变革两个维度,深度解析A2A协议的核心价值。这一协议的推出,标志着智能体协作模式从封闭系统向开放生态的范式转变,为产业数字化转型注入新动能。

  • 接替Manus,字节的Agent王牌能打多久?

    字节跳动旗下智能体平台"扣子空间"推出首款由大厂发布的Agent爆款产品,自4月18日上线后引发用户疯抢邀请码。该产品具备规划、工具调用和记忆等关键能力,支持游戏攻略撰写、市场调研等复杂需求,并首创"探索模式"和"规划模式"双交互设计。虽然底层模型能力较DeepResearch和Manus仍有差距,但凭借产品设计优化和量大价优的优势,成功填补了Manus留下的市场空白。字节同步推出企业版HiAgent解决私有化部署问题,半年内智能体业务订单量增长超330%。当前行业正迎来Agent爆发期,但企业落地仍面临系统接入、数据安全等挑战。

  • 谷歌开源发布A2A协议 Agent2Agent智能体交互协议详细介绍

    在GoogleCloudNext25大会上,谷歌宣布开源了首个标准智能体交互协议——Agent2AgentProtocol,这一举措有望彻底改变智能体之间的交互方式,打破系统孤岛,对智能体的能力、跨平台协作以及执行效率产生质的飞跃。A2A协议是一种开放标准,旨在为智能体提供一种通用的交互方式,使它们能够在不同的底层框架和供应商之间无缝协作。每个部分都有指定的内容类型,这使得客户端和远程智能体能够协商所需的正确格式,并且明确包括用户界面能力的协商,比如iframe、视频、网络表单等,从根据用户的需求和设备的能力,提供最佳的用户体验。

  • MCP协议和Function Calling 、 AI Agents的区别是什么?MCP优势有哪些

    MCP、FunctionCalling和AIAgents是三种重要的技术手段,它们在实现AI模型与外部系统交互方面各有特点。本文将详细对比这三种技术,并深入探讨MCP的多项显著优势。随着MCP技术的不断发展,我们有理由相信,它将在未来的AI领域发挥越来越重要的作用。

  • 谷歌版MCP”来了,开源A2A,不同厂商Agent也能协作

    “谷歌版MCP”来了!谷歌推出A2A协议,即Agent2Agent,能让AIAgent在不同生态系统间安全协作无需考虑框架或供应商。不同平台构建的AIAgent之间可以进行通信、发现彼此的能力、协商任务并开展协作,企业可通过专业Agent团队处理复杂工作流。从各大厂最近动作来看,芜湖,不愧是Agent元年。

  • 微软上线GPT-image-1模型 通过API向开发者开放使用

    OpenAI于4月24日发布全新图像生成模型GPT-image-1,通过API向全球开发者开放。该模型支持生成高质量图像,具备多级定制功能,包括控制敏感度、生成效率、背景、输出格式等参数,并推出"吉卜力模式"生成独特风格图像。Adobe、Figma等多家企业已将其集成到产品中。API定价按token计算,低质量图像生成成本约0.02美元/张。OpenAI CEO Sam Altman高度评价该模型,认为其为开发者带来更大创意空间。

  • 刚刚,OpenAI发布GPT-image-1模型,更强吉卜力版本来啦

    OpenAI发布全新图像生成模型GPT-image-1,通过API向全球开发者开放。该模型支持精细控制图像敏感度、生成效率、背景、输出格式等参数,并集成吉卜力模式。Adobe、Figma等企业已将其应用于产品中。API支持批量生成、蒙版编辑、透明度调整等高级功能,图像生成成本从0.02-0.19美元/张不等。CEO Sam Altman表示该模型与ChatGPT版本差异显著,开发者可通过API实现更多创意场景。新模型在�

  • AI Agent大变天!谷歌开源A2A,一夜改变智能体交互

    谷歌在GoogleCloudNext25大会上,开源了首个标准智能体交互协议——Agent2AgentProtocol。A2A将彻底打破系统孤岛,对智能体的能力、跨平台、执行效率产生质的改变,支持Atlassian、Box、Cohere、Intuit、Langchain、MongoDB、PayPal、Salesforce、SAP、ServiceNow、UKG和Workday等主流企业应用平台。通过A2A协议,MongoDB可以使其数据库服务与智能Agent相结合,实现更高效的数据管理和自动化数据处理。

  • 「扣子空间」内测上线,和 Agent 一起开始你的工作

    “摘星空间”平台正式推出,集生产、专业领域支持及双模系统协作能力,通过多类型AI智能体实现高效办公,具备生产提升、专家深度支持、双模协同等四大核心功能,未来将持续扩展Agent能力边界。

  • 数势科技SwiftAgent 3.0发布 从智能分析到智能决策

    在全球数字化转型浪潮中,企业数据价值挖掘的瓶颈日益凸显:数据口径混乱、分析门槛高、决策链路长等问题导致大量数据资产“沉睡”。数势科技于今日正式发布SwiftAgent 3.0,基于DeepSeek R1/V3 大模型与行业领先的智能引擎,重构企业数据分析与决策范式,实现从“数据可视化”到“决策自动化”的跨越式升级。企业数据分析的三大核心痛点:数据孤岛与语义鸿沟跨部门数据