首页 > 业界 > 关键词  > 正文

​Mobile ALOHA:一种低成本的整体远程操作系统用于数据收集

2024-01-11 17:30 · 稿源:站长之家

划重点:

1. 💡 研究人员提出了一种低成本的整体远程操作系统,名为 Mobile ALOHA,用于收集关于整体远程操作的数据。

2. 💡 Mobile ALOHA 通过将其放在轮式底座上,扩展了原始 ALOHA 的功能,使其具有移动能力。

3. 💡 研究人员使用静态 ALOHA 数据集进行模仿学习,通过预训练和联合训练,实现了在移动操作任务中的良好性能。

站长之家(ChinaZ.com)1月11日 消息:研究人员从斯坦福大学对使用模仿学习进行整体远程操作的任务进行了研究。然而,这种方法在许多日常情况下需要整体远程操作的协调,包括移动和灵巧操作,而不仅仅是单个的移动或操作行为。

image.png

这项研究解决了在实现双臂移动操作的模仿学习中的两个关键问题。首先,他们引入了一种名为 Mobile ALOHA 的整体远程操作系统,该系统成本低廉,并设计用于收集双臂移动操作的数据。通过将 Mobile ALOHA 放置在轮式底座上,用户可以在物理连接状态下通过推动车轮来使底座移动,从而实现底座的独立移动,同时用户可以双手控制 ALOHA。研究人员通过同时记录手臂操作和底座速度数据来创建整体远程操作系统。

研究团队指出,通过简单地连接底座和手臂的动作,然后进行直接模仿学习,可以获得模仿学习中的出色表现。他们通过将移动底座的线性和角速度与 ALOHA 的14个自由度关节位置结合起来,创建了一个16维动作向量。这种表达方式几乎不需要实现改变,使得 Mobile ALOHA 能够直接受益于之前的深度模仿学习方法。

研究人员指出,目前几乎没有可用的双臂移动操作数据集。然而,受到在各种机器人数据集上进行预训练和联合训练以进一步提高模仿学习性能的最近成功的启发,他们开始使用静态双臂数据集。具体而言,他们通过引入 RT-X 来使用静态 ALOHA 数据集,该数据集包含825个与 Mobile ALOHA 任务无关的活动,并且两只手臂分开安装。

尽管任务和形态上存在差异,但研究表明,在几乎所有移动操作任务中都可以实现积极的迁移,达到与仅使用 Mobile ALOHA 数据训练的策略相当或更高的性能和数据效率。此外,这一观察结果也适用于其他类别的最先进的模仿学习技术,如 Diffusion Policy 和 ACT。

这种模仿学习的结果对于许多复杂的活动也很有效,包括拉椅子、联系电梯、打开两门壁柜来存放沉重的烹饪锅,以及清理溢出的酒。每项任务只需50个人类示例,协同训练就可以让我们获得超过80% 的性能,与没有协同训练相比,平均绝对提高34%。

项目网址:https://mobile-aloha.github.io/

举报

  • 相关推荐
  • DK Mobile Reborn上线!注册账号教程+下载教程+官网地址分享

    MMORPG新游《DKMobile Reborn》 4 月 18 日上线,还是我们熟悉的泡菜三端互通游戏,这种游戏最好的地方就在于随时随地都能玩,而且游戏还支持"离线战斗模式",也是就玩家无需启动游戏也能延续自动战斗。首发五个职业,剑盾,狂战,射手,法师,奶妈。新游大家还是值得关注一下,尤其是搬砖选手,这个很有戏。今天给大家带来注册账号教程+下载教程+官网地址分享。DK Mobile Re

  • 《鸿蒙开物:终端操作系统破晓之路》新书发布会圆满举办

    4月27日,《鸿蒙开物:终端操作系统破晓之路》新书发布会在浙江大学与北京风入松书店双会场举行。该书由方兴东教授团队历时5年完成,采访超100位关键人物,形成近200万字一手素材,全景式还原了鸿蒙操作系统从无到有的研发历程。

  • 理想自研星环OS正式开源!操作系统代码已开放下载

    理想汽车4月28日宣布自研"星环OS"操作系统正式开源,成为全球首个实现整车级操作系统全面开源的车企。该系统代码已通过Gitee平台开放下载,采用Apache License V2.0开源协议,覆盖智能车控、智能驾驶、通信中间件、信息安全四大核心模块。该系统不同于车载屏幕系统,而是整车全链路操作系统,包括车辆控制等核心功能。研发始于2021年,投入200名研发人员和10亿元人民币。系统采用资源集中与共享架构,支持英飞凌、地平线等主流车规芯片,芯片适配验证时间比传统闭源系统缩短80%。在性能方面,AI算力虚拟化损耗降低80%,传感器访问时延降低90%,存储资源占用减少30%,响应速度比AUTOSAR提升1倍。安全性能方面,120km/h高速状态下AEB刹停距离缩短7米。

  • 全球首个!百度发布内容操作系统沧舟OS 让AI无所不能

    百度在Create2025开发者大会上推出全球首个内容领域操作系统"沧浪OS"。该系统支持全模态内容输入输出、多智能体调用,适配MCP协议,突破场景和入口限制,实现端到端交付。沧浪OS整合百度文库、网盘等产品线的AI业务框架,包含数百个经过验证的Agent工具,支持跨模态、跨格式的内容理解。系统打通百度文库、学术数据库及全网公开内容,同时支持用户授权的本地或网盘私有内容。目前沧浪OS已全面拥抱MCP生态,通过标准化协议对外开放核心能力,降低接入门槛,推动AI应用普及。

  • 《英勇之地》登陆鸿蒙PC生态:国产游戏与操作系统的双向奔赴

    5月8日,国产沙盒竞技网游《英勇之地》成为首批适配鸿蒙PC系统的游戏之一。这款由国内团队研发的高自由度生存竞技游戏,完成了对鸿蒙PC系统的全方位技术适配,在分布式架构、低延迟渲染等方面进行了深度优化,使百人同屏战斗场景帧率稳定性提升30%。游戏同步开启二周年庆典活动,推出"女儿国"新地图、新英雄"齐天大圣"及"秘境试炼"新玩法。此次合作被视为国产游戏与自主操作系统协同创新的标杆案例,鸿蒙系统为游戏提供跨终端技术底座,游戏IP则丰富了鸿蒙生态内容。项目组表示将持续优化游戏体验,推动国产软硬件协同发展。

  • 成都汇阳投资关于华为鸿蒙PC 操作系统发布,相关公司迎来发展

    华为于2025年5月19日正式发布基于HarmonyOS的鸿蒙PC操作系统。该系统历时五年研发,集结超万名工程师和20多家研究所,积累2700多项专利。核心特点包括:纯鸿蒙架构重构、分布式技术支持跨设备协同、原生AI能力(如智能文档处理)、星盾安全架构(达CC EAL5+级)。性能方面较Windows能耗降低22%,已适配150+头部应用,预计年底支持超2000款应用。产业生态方面,WPS、金山办公等已深度适配,华勤技术等供应链企业同步受益。分析师预测,若生态持续完善,鸿蒙PC有望3-5年内占据中国15%-20%市场份额,成为全球第三大PC操作系统。

  • 鸿蒙系统在电脑端首次亮相:重构生态版图,开启操作系统全场景时代

    5月8日,华为在深圳举办鸿蒙电脑技术与生态沟通会,首次展示鸿蒙操作系统电脑端版本,并宣布鸿蒙电脑将于5月19日正式发布。该系统历时5年研发,投入上万名工程师,布局2700多项专利,从内核重构操作系统,具有系统级AI能力、分布式协同体验和全场景安全防护三大技术亮点。目前已有150+专属应用适配,300+生态应用完成适配,预计年底支持超2000个应用,覆盖办公、设计、金融等核心场景。鸿蒙电脑首次实现移动端与电脑端深度融合,支持"一次开发,多端部署",显著降低开发者适配成本。同时,该系统通过芯片级加密和权限管理,满足政企用户安全需求。华为还联合惠普、佳能等厂商,支持1000+外设连接,推动硬件生态发展。

  • 百度文库、百度网盘联合发布全球首个内容操作系统「沧舟OS」,致力于让AI「无所不能、无处不在」

    4月25日,百度在Create2025开发者大会上推出全球首个内容领域操作系统"沧浪OS"。该系统整合百度文库和网盘资源,构建"公私有知识框架+工具框架"体系,通过知识化框架(公域/私域/记忆三大知识库)和工具化框架(多模理解、检索、文件解析等组件),实现内容元素级拆解。沧浪OS还包含阅读器、编辑器、播放器三大组件,通过调度中枢协调AI Agent工作。目前该系统已集成数百项AI Agent功能,覆盖图文影音等多种内容形态,并与华为、三星等厂商展开深度合作,将MCP架构应用于手机云存储等场景,提升文件管理效率。

  • 国内最佳免费远程软件?从游戏串流到远程办公,UU远程一周年实力再升级

    网易UU远程迎来一周年庆典,回顾其作为远程串流领域领先平台的发展历程。该平台凭借P2P直连超低延迟技术,支持4K144帧和真彩模式,实现跨设备无缝畅玩PC游戏。同时拓展办公场景,提供虚拟键盘、文件传输等功能,并预告4.0版本将新增多屏控制等升级。从游戏娱乐到远程办公,UU远程正打破设备与场景边界,成为连接数字生活的通用语言。

  • 华为辟谣招聘骗局:内推实习、远程实习等都是假的!

    今年三月份,华为正式启动了2026届实习生招聘,但网络上出现了不少打着华为实习名号的骗局出现……