首页 > 业界 > 关键词  > H2O最新资讯  > 正文

新AI框架H2O:将人类动作实时转换为机器人动作 可行走、后空翻、踢球等

2024-03-11 11:07 · 稿源:站长之家

划重点:

1. 🔄 **框架介绍**:H2O(Human to Humanoid)是基于强化学习的框架,通过仅使用RGB摄像头实现了全尺寸人形机器人的实时全身遥控操作。

2. 🔄 **数据处理过程**:采用可扩展的“从模拟到实际”处理,通过特权模仿者筛选和选择可行的动作,构建了大规模的重定目标运动数据集。

3. 🔄 **实时遥操作实现**:在模拟环境中使用经过精炼的动作训练了鲁棒的全身机器人模仿者,并以零次试验方式将其转移到实际机器人,成功实现了在真实场景中的动态全身运动遥操作。

站长之家(ChinaZ.com)3月11日 消息:最新的研究中,由卡内基梅隆大学的研究团队开发,提出了一种名为H2O(Human to Humanoid)的框架,通过强化学习实现了人对人形机器人的实时全身遥控操作。

image.png

该框架在仅使用RGB摄像头的条件下,成功地让人形机器人模仿并实时执行各种动态的全身运动,包括行走、后空翻、踢球、转身、挥手、推动、拳击等。

image.png

为了实现这一突破性的技术,研究团队提出了一种可扩展的“从模拟到实际”的处理过程,以构建大规模的人类运动数据集,为人形机器人提供实时遥操作的训练样本。在处理过程中,通过特权模仿者筛选和选择可行的动作,优化了人形机器人的身体模型,确保其对人类运动的高度还原性。

image.png

框架的核心包括三个关键阶段:首先,通过优化形状和运动参数,将SMPL(Skinned Multi-Person Linear model)身体模型与人形机器人的结构对齐,形成基础的运动数据集。其次,通过训练一个特权模仿策略,去除运动数据集中的异常和不可行的动作,生成更加真实和清晰的运动数据集。最后,通过在模拟环境中训练一个实时模仿策略,实现对人形机器人的零次试验遥操作。

实时遥操作的过程涉及使用RGB摄像头和姿势估计器捕捉人类运动,然后通过训练有素的模仿策略,使人形机器人能够即时模仿并执行这些运动。

这项研究不仅成功实现了全身运动的学习式实时遥操作,还展示了在真实世界情境中的应用,如左右踢球、递盒子、前行后跳、拳击等。据了解,这是首次在人形机器人领域实现了这一技术上的突破,为全新的人机交互和协作场景提供了有力的支持。

项目入口:https://top.aibase.com/tool/human-to-humanoid-h2o-

举报

  • 相关推荐
  • 宇树科技发布H2仿生人形机器人:身高180厘米、体重70公斤

    宇树科技10月20日发布新一代仿生人形机器人Unitree H2,身高180厘米、体重70公斤,形态更接近真人。该机器人具备流畅完成舞蹈、武术等复杂动作的能力,新增仿生人脸模块提升交互体验。相比前代H1,H2在运动性能和人机交互维度实现突破,结合优化算法可执行更具表现力的指令。行业分析指出,H2延续了宇树在机械设计、动力系统等核心领域的技术积累,有望推动仿生机器人向消费级与行业场景加速渗透。

  • 2025最值得尝试的AI搜索可见性监控工具推荐榜

    AI搜索时代,品牌可见性监控成为刚需。传统SEO工具无法追踪AI平台推荐情况,而71%美国用户用AI辅助决策。文章指出,大语言模型每次仅推荐2-7个品牌,若未入选即等同于“不存在”。国内企业痛点在于缺乏本土化监控工具,多数工具仅覆盖ChatGPT等国际平台。为此推荐AIBase平台,可实时监测豆包、DeepSeek等五大国产AI平台,提供多平台覆盖、智能场景分析和趋势追踪功能。建议企业建立“监控-优化-验证”闭环,持续提升AI搜索可见性。

  • 新款小鹏X9在北极冰雪路面100-0km/h急刹 稳稳刹住

    今天,何小鹏分享了新款小鹏X9于瑞典基律纳北极圈内的测试动态。 此次测试聚焦低温湿滑路面车辆稳定性,新款小鹏X9完成100-0km/h紧急制动,不仅稳稳刹住,且俯仰幅度小、无横摆,有效避免了湿滑路面易出现的失控风险。 更令人惊喜的是,车辆在湿滑非铺装路面高速行驶时,车内小熊玩偶始终纹丝不动,直观体现出其出色的行驶平稳性。

  • 战略卡位AI搜索:头部品牌为何集体转向光引GEO的2.0体系?

    2025年营销预算正向GEO迁移,企业从追求流量转向构建“心智垄断”。光引GEO通过“五会”能力实现科学营销闭环,提供三大战略价值:建立AI原生品牌权威、实时市场洞察系统、扭转舆论的防火墙。头部品牌的集体转向表明,布局GEO已成为抢占下一代AI原生消费场景的关键战略卡位。

  • 2025年AI搜索可见性监控实战:从0到1建立GEO品牌追踪体系

    文章揭示AI搜索时代品牌面临的"隐形危机":某SaaS公司虽在Google排名第一,但在ChatGPT等AI引擎中却未被提及,反被竞品频繁推荐。随着超40%年轻用户将AI搜索作为主要信息渠道,传统SEO已无法保障品牌可见度。文章提出GEO品牌监控体系,强调需从用户视角构建查询地图,通过自动化工具追踪品牌在AI答案中的提及率、情感倾向等新指标,并制定六大实战策略,包括构建AI�

  • AI日报:上海首例涉AI提示词著作权案宣判;Kimi K2 Thinking发布;中文图像编辑新王UniWorld-V2发布

    今日AI领域动态:上海首例AI提示词著作权案宣判,法院认定提示词不具独创性;月之暗面发布Kimi K2思考模型,实现自主多轮工具调用;UniWorld-V2图像编辑模型支持中文框选即改,性能超越GPT-Image;谷歌推出AI文件检测工具Magika 1.0,支持超200种格式;Sora安卓版首日下载量达47万次;我国发布全球首个AI海洋大模型“瞰海”,可精准预测10天内海洋变化;宇树科技“Embodied Avatar”系统实现低延迟远程机器人操控;谷歌Gemini API推出文件搜索工具,简化私有RAG系统集成。

  • 端侧AI驱动产业链变革,elexcon2026聚焦芯片/存储/嵌入式核心器件创新

    近期华为、三星、追觅、阿里巴巴等科技企业密集发布智能穿戴新品,推动设备从“手机配件”向“独立智能终端”转型。这一趋势正深刻影响上游技术路径与产业格局,在AI芯片、存储与嵌入式领域引发新一轮技术升级与价值重构。中国成为全球创新引擎,2025年第二季度全球腕戴设备出货量同比增长12.3%,中国市场增速达33.8%,占据全球近半份额。端侧AI驱动技术升级,供应�

  • AI生万物,移往无前 | 第12届TMA大奖终审会成功举办

    11月1日,第12届TMA大奖终审会在云南玉溪成功举办。本届赛事聚焦移动营销与AI创新,新增数智营销、AI创新等赛道,细分短剧营销、节日/事件营销等类别。60余位行业专家评审入围案例,最终获奖结果将于12月19日盛典揭晓。活动搭建了行业交流平台,推动营销与AI技术融合发展。

  • AI浪潮下,项目经理如何破局 | 2025 PMI项目管理大会

    人工智能正重塑项目管理模式,项目经理需超越传统技能,掌握AI赋能下的效率提升、创新促进与决策优化能力。个人应通过组织平台与业务深度绑定,构建不可替代的核心价值。2025PMI项目管理大会将探讨AI前沿应用,助力从业者系统掌握转型路径,实现个体与组织的双向赋能,在AI时代保持竞争力。

  • 即构ZIM2025版本更新:AI互动、功能焕新、赋能开发

    即构科技发布ZIM 2.23.0版本,新增群组定向消息、消息编辑功能,并深度适配HarmonyOS与uni-app-x框架。通过“AI+IM”方案,支持低延迟互动与多模态交互,提供一站式内容审核等服务。该版本强化了跨端协同能力,助力开发者快速构建稳定、高效的实时通讯应用,满足社交、直播等多元场景需求。

今日大家都在搜的词: