首页 > 业界 > 关键词  > DeepMind最新资讯  > 正文

​DeepMind研发新AI项目Open-X Embodiment,可控制各种类型的机器人

2023-10-07 10:50 · 稿源:站长之家

文章概要:

- Google DeepMind与33家其他研究机构合作,开展了一个新项目,旨在创建通用型AI系统,可与不同类型的物理机器人一起工作,并执行多种任务。

- 他们提出的Open-X Embodiment项目结合了多个机器人类型的数据集和能够跨多种任务传递技能的模型,取得了比传统方法更好的训练效果。

- 研究人员基于Transformer深度学习架构开发了RT-1-X和RT-2-X模型,这些模型在各种任务中表现出色,对机器人领域的研究具有重要意义。

近日,Google DeepMind与33家其他研究机构合作推出了一个令人瞩目的新项目,旨在解决机器人领域的一个重大挑战:为每个机器人、任务和环境训练机器学习模型所需的巨大工作量。这个项目的目标是创建一个通用型AI系统,能够与不同类型的物理机器人协同工作,并执行多种任务。

Google Robotics的高级软件工程师Pannag Sanketi表示:“我们观察到,机器人通常擅长专业领域,但在通用性方面表现较差。通常情况下,您必须为每个任务、机器人和环境训练一个模型,更改一个变量通常需要从头开始。”

为了克服这一挑战,他们推出了Open-X Embodiment项目,引入了两个关键组成部分:一个包含多个机器人类型数据的数据集,以及能够在广泛任务范围内传递技能的模型系列。研究人员将这些模型在机器人实验室和不同类型的机器人上进行了测试,在训练机器人方面取得了卓越的结果,相比于传统方法,表现出更高的成功率。

这个项目的灵感部分来自于大型语言模型(LLMs),它们在大规模通用数据集上训练时,能够匹敌甚至胜过在狭窄任务特定数据集上训练的小型模型。令人惊讶的是,研究人员发现这一原则同样适用于机器人领域。

为了创建Open X-Embodiment数据集,研究团队收集了来自20个不同国家的22种机器人实体的数据,数据集包括超过500种技能示例和150,000个任务示例,总计超过100万个事件(事件是机器人每次尝试完成任务时执行的动作序列)。

与此数据集相配套的模型基于Transformer深度学习架构构建。RT-1-X是基于Robotic Transformer1(RT-1)构建的,它是一个用于实际机器人领域的多任务模型。RT-2-X则是基于RT-1的继任者RT-2构建的,它是一个视觉-语言-行动(VLA)模型,学习了来自机器人和Web数据的知识,可以响应自然语言指令。

研究人员在五个不同的研究实验室中使用五种常用的机器人对RT-1-X进行了各种任务的测试,结果表明,与为每个机器人专门开发的模型相比,RT-1-X在任务中表现出了50%更高的成功率,如拾取和移动物体以及打开门等。该模型还能够将其技能推广到不同的环境,而专门的模型适用于特定的视觉环境。这表明,在多种任务中,基于多样示例训练的模型表现出色。根据论文,该模型可以应用于各种机器人,从机械臂到四足动物。

RT-2-X在新任务和紧急技能方面比RT-2成功率高出三倍,尤其在需要空间理解的任务方面表现更好,例如区分在布料附近移动苹果和将其放在布料上的任务。

image.png

研究人员计划进一步研究如何将这些进展与DeepMind开发的自我改进模型RoboCat的见解相结合,RoboCat可以在不同的机械臂上执行各种任务,并自动生成新的训练数据来提高其性能。

他们已经开源了Open X-Embodiment数据集和RT-1-X模型的小版本,但没有开源RT-2-X模型。他们相信这些工具将改变机器人的训练方式,加速研究进展,促进机器人相互学习,以及研究人员之间的知识交流。机器人领域的未来在于使机器人能够相互学习,让研究人员互相学习。

举报

  • 相关推荐
  • 慧辰股份的AI应用破圈 发布机器人智脑“X”平台赋能让硬件更智能

    慧辰股份发布AI战略,聚焦垂直领域打造“专才”而非“通才”AI产品。其四大智能体包括:Data Agent重塑数据分析交互,让业务人员用自然语言分析内外数据;垂直行业数据洞见智能体,专攻非结构化数据价值挖掘;市场需求研判智能体,辅助销售团队把握商机;数字员工管理平台,规模化部署AI应用。通过将AI技术与行业Know-How深度结合,该公司推动AI从“炫技”走向“赋能”,成为产业数字化转型的基础设施。

  • 智元×火花机器人攻克复杂环境集群控制,机器狗方阵演绎精准协同闪耀广州灯光节

    2025年广州国际灯光节上,智元机器狗D1+EDU方阵完成行业首次大型文旅活动机器狗集群协同展演。通过精准步态控制实现方阵变换、同步舞蹈等高难度动作,智能灯带与光影实时联动形成"光河""星空"等视觉效果。该方案攻克了开放场景下多机协同控制技术瓶颈,形成可复制的标准化解决方案,为机器狗在开业典礼、主题展会等场景的规模化应用提供路径,有效破解集群协同难、环境适应性差等行业痛点。

  • 从“主动预防”切入,首款家庭具身机器人开启一场大规模社会实验

    星动力公司推出首款家用具身智能机器人星动力H1,通过“千台臻享计划”招募1000个体验家庭,开展大规模用户共创活动。该产品定位“主动预防”健康管理,集自主移动、精细操作、环境感知与人机协同于一体,致力于成为家庭智能伙伴而非单一功能设备。此举旨在探索具身智能在非标准化家庭场景中的可行性,通过真实用户反馈持续优化产品,为人机协同模式提供实践样本。

  • 人形机器人让小鹏走上了神坛

    这场由机器人引爆的重估,效果或许超乎小鹏汽车董事长兼CEO何小鹏的预料。 IRON登场那几天,全网都在找拉链,还有批评声指出,何小鹏在演戏。这种不信任,恰恰是市场对小鹏,乃至所有中国车企的刻板印象:会堆料、会营销,但搞不定具身智能这种真科技。 市场越是质疑里面藏人,那把最终亮出的剪刀就越有分量。何小鹏要的,本就不是一句“信了”,而是一个迫使资�

  • 联合国向善机器人青少年挑战 首次登陆中国

    国际电信联盟与联合国粮农组织联合发起的“2025-2026国际电联机器人向善青少年挑战赛”在中国启动。这是联合国官方支持的青少年人工智能与机器人活动首次在华举办,标志着中国青少年科技创新教育与国际标准全面接轨。赛事以“粮食安全”为主题,邀请全球10-18岁青少年设计机器人应对农业挑战,探索AI在智慧农业等领域的应用。中国区活动由复旦大学等承办,将于2026年3月在上海举行总决赛,优胜队伍将代表中国参加全球峰会。活动旨在培养青少年科技向善理念,通过实践提升创新能力与全球视野。

  • 马斯克:数字“永生”有望20年内实现 人类意识上传至机器人

    在上周的特斯拉股东大会上,埃隆马斯克再次抛出震撼性预言:人类有望在20年内,通过其脑机接口公司Neuralink与特斯拉人形机器人Optimus的结合,实现某种形式的数字永生”。 根据他的构想,这一过程将分两步实现:首先由Neuralink捕捉并创建人类心智的数字快照”,涵盖记忆、思维模式甚至个性特征。 Optimus是一款双足机器人,设计目标是在真实世界中导航、与人类互动并执

  • 打破乐器边界:AeroBand空气吉他助力机器人高交会开唱

    2025年11月14日,第二十七届中国国际高新技术成果交易会在深圳开幕。全球智能乐器品牌AeroBand空气乐队携智能乐器亮相,重点展示其明星产品AeroBand空气吉他。该产品是全球首款手自一体智能吉他,曾获2023年红点设计奖,具备手自一体、律动伴唱、APP互动学习及无痛硅胶弦等功能。展会现场,机器人化身演奏家与音乐人同台献艺,引发观众热烈反响。AeroBand通过科技重塑音乐全链路体验,致力于打造新一代智能乐器生态系统,让音乐学习更自由、创作更高效、表演更具突破性。

  • AI浪潮下,项目经理如何破局 | 2025 PMI项目管理大会

    人工智能正重塑项目管理模式,项目经理需超越传统技能,掌握AI赋能下的效率提升、创新促进与决策优化能力。个人应通过组织平台与业务深度绑定,构建不可替代的核心价值。2025PMI项目管理大会将探讨AI前沿应用,助力从业者系统掌握转型路径,实现个体与组织的双向赋能,在AI时代保持竞争力。

  • 前DeepSeek研究员罗福莉已加入小米:全力奔赴AGI

    11月12日,“95后AI天才少女”罗福莉宣布加入小米MiMo大模型团队。她曾因“雷军千万年薪挖角”话题引发热议,拥有丰富AI研发经历,先后在幻方量化和DeepSeek参与大模型研发。罗福莉表示,将与团队致力于推动AI从语言迈向物理世界,全力构建通用人工智能。她的加入将为小米AI研究注入新活力。

  • 何小鹏回应机器人IRON里是真人质疑:感谢认可

    在第七届小鹏科技日上,小鹏汽车自主研发的人形机器人IRON首次亮相,其逼真步态引发网友惊叹“100%真人在里面”。面对质疑,董事长何小鹏以“感谢认可”巧妙回应,展现技术自信。IRON采用类人“骨骼-肌肉-皮肤”结构,搭载仿生肌肉驱动系统和22自由度拟态双手,能精准感知环境变化。团队历时7年研发,计划明年4月进入量产阶段。该机器人还融合物理世界模型体系,集成VLT/VLA/VLM三大核心能力,实现实时环境交互。此次展示既体现小鹏技术积累,也引发对科技真实性的思考。

今日大家都在搜的词: