首页 > 传媒 > 关键词  > Figure最新资讯  > 正文

端到端VLA是具身智能的曙光吗?这项被Figure AI带火的关键技术有中国团队更早提出并应用

2025-03-03 15:25 · 稿源: 站长之家用户

Figure AI 在与 OpenAI 终止合作后,果然发布了大新闻,这家人形机器人公司从外接大模型的方式,转入本地具身大模型来完成机器人的感知、交互与操作,充分展现了本体具身大模型与外接互联网大模型的优势。

根据 Figure AI 有限的技术分享,他比较新推出的 Helix 系统是基于视觉-语言-行动(VLA)端到端整体架构演进的一套快慢系统。

借助 Helix,Figure AI 将端到端 VLA 模型运行到自家的双足人形机器人 Figure 02 上,实现了面向场景任务的泛化性。

在 Figure AI 官方展示视频中,机器人一边用头部追踪手部,一边调整躯干姿势,同时能够比较准确抓取物体。

这种多自由度协调在高维动作空间中相当挑战性,而 Helix 可以做到美好平衡。

究其本质,Helix 是一个能够对整个人形上身(包括手腕、躯干、头部和各个手指)进行高速率连续控制的 VLA 模型,作为 Figure AI 的比较优秀大脑,它完成了所有事情:

像人类一样用眼睛观察、用耳朵听、用手操作,并在没有特别训练的情况下完成全新的任务,有准确的控制能力。

这在视频中得到了充分展现:Helix 驱动的机器人成功抓取数千种新物体,仅需一句「拿起 [X]」,当指令为「拿起沙漠物品」时,它能识别玩具仙人掌并完成抓取。

「Helix 表现出了强大的物体泛化能力,只需用自然语言询问,就能捡起数千种形状、大小、颜色与材料特性各异的新奇家居用品,而这些物品在此前的训练中从未见过。」Figure AI 的创始人兼 CEO 布雷特·艾德考克认为。

Figure AI 此番高举高打的端到端 VLA 架构,实际在硅谷也是非常新的技术。

伯克利机器人行业的优质团队创办的 PI,在 2024 年 6 月、10 月分别发表了 OpenVLA、PI-0,奠定了端到端 VLA 的圣杯标准,当时获得极大反响。

但这个技术不只是硅谷优质团队的专利,中国科研力量也在端到端 VLA 舞台上展露过实力。

2024 年 6 月,比 PI 早发表的,针对操作机器人的 RoboMamba 端到端具身大模型,由北大,智平方等合力推出。

这一模型不仅比 PI 的 OpenVLA 更早公开应用,还在未见任务(Unseen Task)的泛化能力上显著超越 Google 的 RT 系列模型,进一步巩固了中国在大模型原创力上的国际声誉。

这是业界能看到的,仅有初创公司参与的端到端 VLA 工作被国际专家认可。

图注:图源 RoboMamba 论文

图注:论文介绍了一个名为 RoboMamba 的多模态状态空间模型,旨在提高机器人的推理和操作能力,同时保持有效的微调和推理

论文创新性地将视觉编码器与有效的 Mamba 语言模型集成,构建了全新的端到端机器人多模态大模型。

端到端的背后,是对量产的深入理解。在场景多变的情况下,如何用数据驱动的方式完成系统升级迭代,如何对数据,模型结构,训练方法实现系统级别 AI 突破。这些关键问题困住了大量具身智能领域的入局者。

小鹏、OPPO前首席科学家,微软总部研究员,创新领军人才郭彦东,是初次提出端到端 VLA 架构的人,这来自于他在产业、行业多年的深耕积累,以及他在 AI 原创领域的硬核研发能力。依托技术的先发布局,和大量人工智能软硬一体化结合的量产经验,帮助智平方率先做到了这一点,成为国内最早进行真正商业落地的通用智能机器人公司。

本质上,能做好 VLA 端到端的公司具备对大模型前沿技术的硬核创新能力,其间的点滴积累如能应用到整个 AI+硬件行业,会成为相当价值的存在。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 新时达人形机器人新达“入职”海尔工厂,机器人真的开始进厂打工了?

    人形机器人新达在重庆海尔冰箱互联工厂成功落地,标志着具身智能机器人从实验阶段迈向场景实训。相比传统工业机器人,新达具备更高场景适应性和工序协同能力,能完成涂润滑油、物料搬运、智能巡检等复杂任务。其核心技术“大脑-小脑-本体”深度协同,通过视觉语言模型实现自主决策,全栈自研运动控制系统确保精准操作。这不仅是技术突破,更验证了工业制造从自动化向智能化升级的可行路径。

  • 累活、脏活让机器人干!海尔智家一工厂用上“人形机器人”

    海尔重庆冰箱互联工厂引入人形机器人“新达”,标志着制造业智能化进入新阶段。该机器人具备人类外形与智能内核,承担涂油、巡检、搬运等高强度作业,通过三大核心技术实现高效精准操作:基于视觉语言模型的“超强大脑”实现任务理解规划;自主研发的“灵活小脑”保障毫秒级实时响应;仿人形双臂与多模块感知系统构成“全能身体”。工厂通过机器人解放人力,践行“以人为本”理念,推动制造业向智能化、高效化与可持续发展迈进。

  • “超脑+机器人”重构物流新生态!京东物流“狼族”机器人全阵容亮相世界物联网博览会

    10月31日,世界物联网博览会在无锡开幕,京东物流"狼族"智能机器人军团成为焦点。展会首次完整呈现"超脑+狼族"智能系统,展示天狼四向车、智狼扩展版、自动分播墙等新产品及成熟产品矩阵。系统实现全流程智能作业,分拣准确率超99.99%,存储坪效提升240%,作业人员减少58%。通过仓-站-人高效协同,昆山亚一智能物流园已实现近半数订单由机器人处理。京东物流计划未来5年采购300万台机器人,持续强化智能供应链技术底座,推动行业向科技驱动转型。

  • 宇树科技发布H2仿生人形机器人:身高180厘米、体重70公斤

    宇树科技10月20日发布新一代仿生人形机器人Unitree H2,身高180厘米、体重70公斤,形态更接近真人。该机器人具备流畅完成舞蹈、武术等复杂动作的能力,新增仿生人脸模块提升交互体验。相比前代H1,H2在运动性能和人机交互维度实现突破,结合优化算法可执行更具表现力的指令。行业分析指出,H2延续了宇树在机械设计、动力系统等核心领域的技术积累,有望推动仿生机器人向消费级与行业场景加速渗透。

  • 触觉增强世界模型引关注,一目科技IROS首秀定义机器人感知新维度

    在2025年IROS大会上,中国AI企业一目科技凭借触觉感知与具身智能领域的突破成为焦点。公司展示了全球最薄仿生视觉触觉传感器,厚度大幅缩减,实现0.005N三维力分辨率和120fps输出帧率。CEO李智强提出"视觉-触觉-语言-行动"新范式,指出触觉能捕捉物理世界的隐秘维度。通过创新仿真平台和生成式AI技术,突破传统数据收集限制,显著提升机器人操作技能训练效率。现场机械臂成功演示易碎品抓取等复杂任务,验证了触觉感知在精细操控中的核心价值,为"操控即服务"产业愿景提供技术支撑。

  • 华文众合携国内首款中小学具身教育智能机器人亮相第86届中国教装展

    10月24-26日,第86届中国教育装备展在青岛成功举办,聚焦“人工智能引领教育装备高质量发展”。华文众合展出智慧书法教室、智慧粉笔教室等创新产品,并发布国内首款中小学具身教育智能机器人“华文小弈”。该机器人融合AI语音交互、智能运动控制等功能,旨在通过寓教于乐方式提升课堂互动性。展会现场还通过经典古文背诵、AI书法教学等互动环节,展现科技与传统教�

  • 国内首款中小学具身智能教育机器人亮相第86届中国教育装备展示会

    10月24日,第86届中国教育装备展在青岛西海岸新区开幕。北京华文小弈机器人公司推出国内首款中小学具身智能教育机器人,专为中小学AI教育设计,覆盖课程、大模型、具身智能等核心内容,具备语音交互、运动控制等功能。该机器人以大语言模型驱动,支持图形化编程与RAG知识底座,通过云端协同实现“大小脑”双系统智能模式,配套互动式AI课程,打造沉浸式学习体验,助力学生从理论到实践全面提升。

  • 1.3亿美元!LiblibAI拿下国内最大AI应用融资

    2025年AI应用公司LiblibAI完成1.3亿美元B轮融资,由红杉中国等机构领投,创国内AI应用赛道最大单笔融资。该公司通过“工具集成+社区生态”模式,整合图像、视频、3D等多模态能力,覆盖从灵感到成片的完整AI工作流,已孵化超2000万创作者。平台将加速全球化布局,打造多模态内容生态,标志着AI投资正从底层模型转向应用层落地。

  • 海外仓系统怎么选?通过一件代发了解领星海外仓系统

    本文探讨海外仓一件代发服务及其系统支持。以跨境卖家小美为例,说明通过海外仓本地发货可缩短配送时间至2-4天,提升客户体验。文章详细解析一件代发全流程:收货质检、上架存储、订单处理打包、出库配送及物流追踪,并指出成本控制、库存管理和订单处理是常见痛点。最后推荐领星海外仓系统,其集成WMS、OMS等功能,支持多平台对接和智能化管理,能有效解决运营难题,是海外仓的高效选择。

  • AI日报:Sora免费额度要缩水;月之暗面发布Kimi Linear架构;Canva免费放出Affinity专业设计套件

    本期AI日报聚焦多项技术突破:OpenAI调整Sora免费额度并推出付费计划,标志视频生成进入商业化;Figma收购Weavy推出AI设计工具;OpenAI发布基于GPT-5的安全研究助手Aardvark;全球首款AI字体生成器Dr Fonts上线;中国信通院发布大模型一体机应用报告;月之暗面推出Kimi Linear架构实现推理速度6倍提升;Canva免费发布Affinity设计套件挑战Adobe;Chrome新增Gemini驱动的图像生成与深度搜索功能。

今日大家都在搜的词: