首页 > 业界 > 关键词  > 正文

​Mobile ALOHA:一种低成本的整体远程操作系统用于数据收集

2024-01-11 17:30 · 稿源:站长之家

划重点:

1. 💡 研究人员提出了一种低成本的整体远程操作系统,名为 Mobile ALOHA,用于收集关于整体远程操作的数据。

2. 💡 Mobile ALOHA 通过将其放在轮式底座上,扩展了原始 ALOHA 的功能,使其具有移动能力。

3. 💡 研究人员使用静态 ALOHA 数据集进行模仿学习,通过预训练和联合训练,实现了在移动操作任务中的良好性能。

站长之家(ChinaZ.com)1月11日 消息:研究人员从斯坦福大学对使用模仿学习进行整体远程操作的任务进行了研究。然而,这种方法在许多日常情况下需要整体远程操作的协调,包括移动和灵巧操作,而不仅仅是单个的移动或操作行为。

image.png

这项研究解决了在实现双臂移动操作的模仿学习中的两个关键问题。首先,他们引入了一种名为 Mobile ALOHA 的整体远程操作系统,该系统成本低廉,并设计用于收集双臂移动操作的数据。通过将 Mobile ALOHA 放置在轮式底座上,用户可以在物理连接状态下通过推动车轮来使底座移动,从而实现底座的独立移动,同时用户可以双手控制 ALOHA。研究人员通过同时记录手臂操作和底座速度数据来创建整体远程操作系统。

研究团队指出,通过简单地连接底座和手臂的动作,然后进行直接模仿学习,可以获得模仿学习中的出色表现。他们通过将移动底座的线性和角速度与 ALOHA 的14个自由度关节位置结合起来,创建了一个16维动作向量。这种表达方式几乎不需要实现改变,使得 Mobile ALOHA 能够直接受益于之前的深度模仿学习方法。

研究人员指出,目前几乎没有可用的双臂移动操作数据集。然而,受到在各种机器人数据集上进行预训练和联合训练以进一步提高模仿学习性能的最近成功的启发,他们开始使用静态双臂数据集。具体而言,他们通过引入 RT-X 来使用静态 ALOHA 数据集,该数据集包含825个与 Mobile ALOHA 任务无关的活动,并且两只手臂分开安装。

尽管任务和形态上存在差异,但研究表明,在几乎所有移动操作任务中都可以实现积极的迁移,达到与仅使用 Mobile ALOHA 数据训练的策略相当或更高的性能和数据效率。此外,这一观察结果也适用于其他类别的最先进的模仿学习技术,如 Diffusion Policy 和 ACT。

这种模仿学习的结果对于许多复杂的活动也很有效,包括拉椅子、联系电梯、打开两门壁柜来存放沉重的烹饪锅,以及清理溢出的酒。每项任务只需50个人类示例,协同训练就可以让我们获得超过80% 的性能,与没有协同训练相比,平均绝对提高34%。

项目网址:https://mobile-aloha.github.io/

举报

  • 相关推荐
  • 国内独家AI+操作系统TencentOS Server亮相2025中国国际金融展

    腾讯云TencentOS+Server历经15年技术积累,打造了国内独家AI+操作系统,已在农业银行、招商银行等金融机构核心系统落地应用。该系统具备性能提升、安全稳定等关键能力,支持国产CPU深度优化,实测性能提升9%-25%。其推出的TACO-LLM大模型推理加速器显著降低延迟,在金融信创生态实验室评测中获得权威认证。作为OpenCloudOS社区核心贡献者,TencentOS+Server已适配1697款硬件,覆盖四大架构,并孵化云原生OS"玄湾"等创新项目,成为国产操作系统规模化应用的标杆。

  • 全场景智能操作系统再进化,鸿蒙6点亮2025华为开发者大会

    华为鸿蒙系统迎来重大升级,HarmonyOS 6开发者Beta版正式启动报名。该系统在互联、智能、安全、流畅等核心体验全面优化,已覆盖超10亿设备,Top5000应用适配率达100%。鸿蒙生态建设取得突破性进展:开源代码超1.3亿行,800万开发者加入,30000+应用及元服务加速开发;创新推出"碰一碰"跨设备交互、AI主动防诈等特色功能。通过星盾安全架构保障用户隐私,累计拦截86亿次不合理权限请求。此次升级标志着国产操作系统在万物互联时代的技术突破,正推动全场景智能生态发展。

  • 有道14B低成本轻量模型“子曰3”开源,数学推理性能超越大模型

    网易有道6月23日开源国内首个专注数学教育的"子诳3"大模型系列数学模型(Confucius3-Math)。该模型在单块消费级GPU上高效运行,在多项数学推理任务中性能超越更大规模的通用模型,高考数学题测试得分达98.5分。其训练成本仅2.6万美元,推理性能是DeepSeek+R1的15倍,服务成本低至每百万token0.15美元,大幅降低教育AI应用门槛。该开源模型为教育公平提供低成本、高性能的AI�

  • 天九共享免费开放低代码,助力100万家企业低成本数智化

    6月18日,天九数科集团宣布其低代码平台正式面向全球免费开放。该平台通过可视化拖拽、模块化组件等功能,可快速搭建ERP、CRM等管理系统,显著降低中小企业数字化转型门槛。目前中国中小企业数字化率不足20%,面临"不愿转、不敢转、不会转"困境。天九平台具有零成本接入、高效部署等优势,已帮助某餐饮企业一周内建成智能订货系统,人工误差减少30%。集团计划未来3年服务超100万家企业,助力实现2027年中小企业上云率超40%的政策目标,推动普惠数字经济发展。

  • 上海飞络|AI Agent驱动企业MSS安全运营变革 ---构建高效低成本防护体系

    在数字化转型浪潮中,企业面临指数级增长的网络威胁。上海飞络信息科技的Synergy AI产品通过AI+Agent技术重塑安全防护格局:1)统一告警分析:整合多元设备告警,精准识别APT攻击等高级威胁;2)智能设备调度:自动协调防火墙、WAF等设备应对DDoS攻击;3)实时威胁阻断:秒级隔离受感染终端,防止数据泄露。该方案使金融企业平均响应时间大幅缩短,显著降低数据泄露风险。未来将持续优化预测能力,实现主动防御,为企业构建高效智能的托管安全服务体系。

  • 贝锐蒲公英巡检机器人组网方案:解决移动入网与数据远程传输难题

    智能巡检机器人在能源、电力、化工等行业应用广泛,通过物联网和AI技术实现自动化、智能化发展。其搭载激光雷达、相机等设备,可24小时执行设备监测、故障预警等任务,显著提升运维效率并保障人员安全。但面临三大难题:1)复杂环境下无线网络覆盖不足;2)高清视频传输对带宽要求高;3)敏感数据需满足安全合规要求。贝锐蒲公英基于SD-WAN技术推出工业级路由器R300系列解决方案,支持4G/5G多网智能切换,内置全球智能链路和抗丢包算法,确保数据实时稳定传输。方案采用国密算法和零信任架构,满足三级等保要求,实现数据全链路加密。该方案为智能巡检提供了一站式远程连接解决方案,推动行业向数字化、无人化迈进。

  • 水库视频监测、多地泵站远程管理,贝锐蒲公英如何打通水利数据回传?

    文章探讨了智慧水利系统建设面临的四大挑战:1)偏远监测站点有线网络接入困难,无线信号不稳定;2)传统专线组网成本高昂;3)设备分散导致运维复杂;4)水利数据存在安全风险。针对这些问题,贝锐蒲公英提出基于SD-WAN的异地组网解决方案,通过工业路由器实现4G/5G快速接入,支持双网备份确保在线率,显著降低组网成本。该方案具备云端部署、远程集中运维能力,提供完善的数据加密传输和权限管理体系,已成功应用于水文监测、水库大坝安全监控、灌区智能灌溉及城市供排水管网监测等多个场景,助力水利行业数字化转型。

  • 董明珠回应老是骂人:是严格要求的另一种说法

    近日,ISO制冷压缩机国际标准全球发布会在珠海盛大举行。 格力电器董事长董明珠出席了此次发布会,并在会上表达了对格力电器科技人员的感谢。她称,感谢格力电器这四年来所有科技人员为这两项标准作出的贡献。

  • 雷军疑似回应余承东 :诋毁,本身就是一种仰望

    今日上午,“雷军疑似回应余承东”这一微博话题迅速冲上热搜榜第一名,引发网友广泛关注与讨论。 事情的起因要追溯到未来汽车先行者大会。会上,华为常务董事、终端BG董事长余承东发表了一番言论。他指出,当前汽车企业不仅要具备制造、销售、服务能力,还得拥有强大的用户体验把握能力,以及产品定义、分析、市场定位和设计能力。

  • 张朝阳称韦东奕开账号非常好:他的学术科普是一种公益

    近日,北大数学天才韦东奕开通抖音账号,发布4秒自我介绍视频,3天内涨粉超2400万,引发全网关注。 同时,韦东奕经过世界纪录认证机构(WRCA)确认,为72小时内抖音平台学术领域获得粉丝最多的人”。 据其家人介绍,后续该账号将分享数学相关内容,使韦东奕与外界有更多接触。 今日下午,搜狐CEO张朝阳开启直播,讲解今年高考物理题。