首页 > 业界 > 关键词  > DeepMind最新资讯  > 正文

​DeepMind研发新AI项目Open-X Embodiment,可控制各种类型的机器人

2023-10-07 10:50 · 稿源:站长之家

文章概要:

- Google DeepMind与33家其他研究机构合作,开展了一个新项目,旨在创建通用型AI系统,可与不同类型的物理机器人一起工作,并执行多种任务。

- 他们提出的Open-X Embodiment项目结合了多个机器人类型的数据集和能够跨多种任务传递技能的模型,取得了比传统方法更好的训练效果。

- 研究人员基于Transformer深度学习架构开发了RT-1-X和RT-2-X模型,这些模型在各种任务中表现出色,对机器人领域的研究具有重要意义。

近日,Google DeepMind与33家其他研究机构合作推出了一个令人瞩目的新项目,旨在解决机器人领域的一个重大挑战:为每个机器人、任务和环境训练机器学习模型所需的巨大工作量。这个项目的目标是创建一个通用型AI系统,能够与不同类型的物理机器人协同工作,并执行多种任务。

Google Robotics的高级软件工程师Pannag Sanketi表示:“我们观察到,机器人通常擅长专业领域,但在通用性方面表现较差。通常情况下,您必须为每个任务、机器人和环境训练一个模型,更改一个变量通常需要从头开始。”

为了克服这一挑战,他们推出了Open-X Embodiment项目,引入了两个关键组成部分:一个包含多个机器人类型数据的数据集,以及能够在广泛任务范围内传递技能的模型系列。研究人员将这些模型在机器人实验室和不同类型的机器人上进行了测试,在训练机器人方面取得了卓越的结果,相比于传统方法,表现出更高的成功率。

这个项目的灵感部分来自于大型语言模型(LLMs),它们在大规模通用数据集上训练时,能够匹敌甚至胜过在狭窄任务特定数据集上训练的小型模型。令人惊讶的是,研究人员发现这一原则同样适用于机器人领域。

为了创建Open X-Embodiment数据集,研究团队收集了来自20个不同国家的22种机器人实体的数据,数据集包括超过500种技能示例和150,000个任务示例,总计超过100万个事件(事件是机器人每次尝试完成任务时执行的动作序列)。

与此数据集相配套的模型基于Transformer深度学习架构构建。RT-1-X是基于Robotic Transformer1(RT-1)构建的,它是一个用于实际机器人领域的多任务模型。RT-2-X则是基于RT-1的继任者RT-2构建的,它是一个视觉-语言-行动(VLA)模型,学习了来自机器人和Web数据的知识,可以响应自然语言指令。

研究人员在五个不同的研究实验室中使用五种常用的机器人对RT-1-X进行了各种任务的测试,结果表明,与为每个机器人专门开发的模型相比,RT-1-X在任务中表现出了50%更高的成功率,如拾取和移动物体以及打开门等。该模型还能够将其技能推广到不同的环境,而专门的模型适用于特定的视觉环境。这表明,在多种任务中,基于多样示例训练的模型表现出色。根据论文,该模型可以应用于各种机器人,从机械臂到四足动物。

RT-2-X在新任务和紧急技能方面比RT-2成功率高出三倍,尤其在需要空间理解的任务方面表现更好,例如区分在布料附近移动苹果和将其放在布料上的任务。

image.png

研究人员计划进一步研究如何将这些进展与DeepMind开发的自我改进模型RoboCat的见解相结合,RoboCat可以在不同的机械臂上执行各种任务,并自动生成新的训练数据来提高其性能。

他们已经开源了Open X-Embodiment数据集和RT-1-X模型的小版本,但没有开源RT-2-X模型。他们相信这些工具将改变机器人的训练方式,加速研究进展,促进机器人相互学习,以及研究人员之间的知识交流。机器人领域的未来在于使机器人能够相互学习,让研究人员互相学习。

举报

  • 相关推荐
  • DeepSeek + Kimi一键生成高质量PPT

    文章介绍如何用两个免费AI工具快速制作PPT:先用微信版DeepSeek生成大纲,再用Kimi智能助手一键生成PPT。操作步骤包括:1)在微信搜索DeepSeek,输入需求生成结构化大纲;2)访问Kimi网页版,将大纲粘贴至PPT助手功能;3)选择模板样式,一键生成PPT。该方法适用于教师备课、学生汇报、职场报告等多种场景,能自动完成从构思到排版的全部流程,高效且效果惊艳。

  • DeepSeek上新!开源发布DeepSeek-Prover-V2-671B新模型

    快科技4月30日消息,今日,DeepSeek 今日在 AI 开源社区 Hugging Face 发布了一个名为 DeepSeek-Prover-V2-671B 的新模型。据介绍,DeepSeek-Prover-V2-671B 其参数量达到6710亿,使用了更高效的 safetensors 文件格式,并支持 BF16、FP8、F32 等多种计算精度,方便模型更快、更省资源地训练和部署。在模型架构上,该模型使用了DeepSeek-V3架构,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。同时支持超长上下文,最大位置嵌入达163840,使其能处理复杂的数学证明,并且采用了FP8量化,可通过量化技术减小模型大小,提

  • 初中老师如何用deepseek 和 Kimi无痛做课件

    本教程指导初中教师如何利用Deepseek和Kimi两款AI工具高效完成备课全流程。Deepseek用于生成教学设计方案和PPT大纲,Kimi则根据大纲快速生成精美课件。操作步骤:1)在Deepseek输入教学需求生成教学设计;2)用Deepseek生成PPT大纲;3)将大纲粘贴至Kimi PPT助手一键生成课件。该方法特别适合日常备课、临时调课需求,能大幅提升备课效率,让教师既省时又高效。

  • IQ 过百的 AI 模型名单发布:ChatGPTDeepseek等上榜

    人工智能IQ哪家强?o3 智商高达 132、Gemini 2.5 Pro Exp. 拿下 128 分、Claude 凭借 3.7 Sonnet Extended 位列第四、Deepsee R 1……

  • Flyme AIOS 2发布:魅族Note 16首发 接入DeepSeek

    在智能交互方面,Flyme AIOS2接入DeepSeek R1满血版,具备深度思考能力,并提供三种模式供用户选择。此外,星纪魅族成为首家接入阿里云首个端到端全模态大模型通义千问Qwen - Omni的厂商,这使得系统能带来更敏捷聪明、更具拟人情感的超自然语音对话体验,正式

  • 半马最独立的机器人诞生:不用人陪跑、靠自己完成反超

    快科技4月19日消息,全球首个人形机器人半程马拉松今日在北京亦庄开跑,共有21支机器人队伍与12000名人类选手同场竞技,共同挑战21.0975公里的赛道。目前,天工机器人已经冲线完赛,夺得冠军,不过还有很多人关注到了一个呆萌的小机器人,它就是来自松延动力的N2小顽童。之所以说它特殊,是因为在这场比赛中,绝大多数机器人都需要两到三名人类工作人员陪跑,然而它却根本不需要,全程都是自己一个在战斗,甚至还能不断反超其他机器人。如此独立的一幕也让不少人感慨万千,盛赞其是这届比赛中最为独立、最为励志的机器人。据介绍,松延动?

  • AI日报:国内首个多模态AI程序员上岗;字节启动Top Seed计划招募AI人才;DeepSeek R1T Chimera上线OpenRouter

    【AI日报】今日AI领域重要动态:1.百度发布文心快码3.5及多模态AI程序员"文心快码Comate Zulu",提升开发效率;2.字节跳动启动"Top Seed"计划,招募30名AI博士人才;3.DeepSeek开源R1T Chimera模型上线OpenRouter平台;4.阿里AI工程师余亮获"全国劳动模范"称号;5.开源图像编辑工具Step1X-Edit登陆Hugging Face,性能媲美GPT-4o;6.谷歌被曝每月向三星支付巨额资金预装Gemini应用

  • 基于公共API网关的WEEX机器人部署指南

    WEEX是一家成立于2018年的中心化交易所(CEX),凭借其信誉和稳定的用户活跃度吸引了众多散户交易者。2024年10月日均交易量接近24亿美元,提供多样化的衍生品交易和网格交易(GRID)等稳定盈利策略。虽然WEEX在2024年4月才推出公共API网关,但已朝着自动化交易迈出重要一步。文章介绍了三种适用于WEEX的AI交易机器人供应商:CryptoHopper的自动调整仓位网格机器人、GunBot的内置LLM代码生成功能,以及WunderTrading的高效套利机器人。此外还推荐了HummingBot等开源工具和3Commas等优秀供应商,帮助投资者实现自动化交易。WEEX的优势在于信誉良好、深度现货市场和低廉费率,但缺乏灵活的自动化工具是其显著缺点。

  • 获第3名的机器人带伤比赛 跑完半马累瘸火了

    快科技4月19日消息,今日上午7时30分,全球首个人形机器人半程马拉松赛事在北京亦庄南海子公园南门鸣枪开跑。20支机器人队伍在21.0975公里的赛道上展开激烈角逐,比赛状况百出,笑料”不断。其中,旋风小子队的N2机器人第三个冲线完赛,获得季军。然而,赛后N2机器人却因带伤作战”而瘸腿”,这一情况引发了广泛关注。据悉,比赛赛道地形复杂,包含平地、坡道与弯道,这对机器人的稳定性、动力系统、路径规划和转向能力都是极大的考验。N2机器人在比赛中全力以赴,一路克服诸多困难,始终保持着稳定的发挥。但冲过终点线后,观众发现它的?

  • AI简历教程!用 deepseek 一键生成高质量简历

    本文介绍如何利用AI工具Deepseek快速制作专业简历。传统简历制作依赖WPS模板或作图软件,过程繁琐。现在通过Deepseek平台,只需输入自然语言指令(如工作经验、技能等关键信息),系统即可自动生成排版精美的HTML版简历,还能转换为PDF格式。操作流程分三步:1.访问官网输入需求指令;2.查看并运行生成的HTML代码;3.保存文件或转为PDF。该工具特别适合求职者快速制作突出个人优势的专业简历,大幅提升求职效率。