首页 > AI头条  > 正文

字节跳动推出VLA通用机器人模型GR-3 支持高灵巧度操作

2025-07-22 14:08 · 来源: AIbase基地

近日,字节跳动Seed团队正式推出全新Vision-Language-Action Model(VLA)模型GR-3,该模型在机器人操作领域展现出突破性能力,不仅能理解包含抽象概念的语言指令,还可精准操作柔性物体,并具备快速迁移至新任务、认识新物体的泛化能力。这一成果被视为迈向通用机器人“大脑”的重要进展。

传统机器人操作模型往往依赖大量机器人轨迹数据进行训练,导致迁移至新任务时成本高、效率低。GR-3则通过少量人类数据即可实现高效微调,其核心突破在于采用Mixture-of-Transformers(MoT)网络结构,将视觉-语言模块与动作生成模块整合为40亿参数的端到端模型。其中,动作生成模块通过Diffusion Transformer(DiT)结合Flow-Matching技术生成动作,并引入归一化的RMSNorm设计,显著增强了动态指令跟随能力。这一结构使GR-3能像人类一样,直接根据摄像头画面与语言指令规划连续动作,例如在听到“收拾餐桌”后,自动完成“打包剩菜→收拾餐具→倒垃圾”的全流程。

微信截图_20250722140449.png

训练数据层面,GR-3突破了单一数据源的局限,通过三合一数据训练法实现能力跃升:其一,利用遥操作机器人收集的高质量真机数据,确保基础操作能力;其二,通过用户授权的VR设备采集人类轨迹数据,使新任务学习效率提升近一倍(450条/小时 vs 传统250条/小时);其三,融合公开可用的图文数据,让模型理解“大”“小”“左右”等抽象概念,并识别未见过物体的特征。这种多样性数据融合策略,使GR-3在未见过的物体抓取任务中成功率较基准模型提升17.8%,仅需10条人类轨迹数据即可将新物体操作成功率从60%提升至80%以上。

为验证模型性能,团队在通用拾取放置、长程餐桌清理、柔性衣物操作三大任务中展开系统性测试。在通用拾取放置任务中,GR-3在训练过的场景里指令遵循率和成功率分别达98.1%和96.3%,在新环境(卧室书桌、超市柜台等)中性能几乎无衰减,且能精准处理“把雪碧旁边的可乐放进盘子”等涉及空间关系的复杂指令。长程餐桌清理任务中,GR-3可自主完成多步骤操作,平均完成度超95%,并能严格跟随分步指令,面对无效指令时准确判断不动作。柔性衣物操作测试显示,GR-3在挂衣服任务中完成度达86.7%,即使面对短袖等未见过的衣物款式或混乱摆放状态,仍能稳定完成任务。

与硬件的协同创新是GR-3的另一亮点。团队研发的通用双臂移动机器人ByteMini作为载体,配备22个全身自由度与独特手腕球角设计,结合全身运动控制(WBC)系统,实现狭小空间内的精细操作与平滑轨迹生成。例如,抓取纸杯时能自动调整力度避免捏碎,机械臂可像人类手腕般灵活转动。多摄像头布局(2个手腕摄像头看细节、头部摄像头看全局)则确保“眼观六路”的感知能力。

尽管GR-3在泛化性与操作精度上已超越业界此前可测试的VLA头部模型π0,但团队仍计划通过扩大模型规模、增加训练数据量(如更多物体的视觉语言数据、复杂任务机器人数据)进一步提升泛化能力。同时,引入强化学习(RL)方法突破模仿学习局限,使机器人在遇到物体滑落等突发情况时能自主调整策略,增强抗干扰能力。

字节跳动Seed团队表示,GR-3的研发旨在解决传统机器人“听不懂抽象指令”“不适应环境变化”“做不好长程任务”的三大瓶颈。未来,团队将持续探索大模型与机器人技术的深度融合,推动通用机器人“大脑”走进日常生活,成为帮助人类处理各类事务的智能助手。这一成果不仅为机器人学习领域提供了新范式,更让“机器人全能助手”的愿景更近一步。

ArXiv:https://arxiv.org/abs/2507.15493

项目主页:https://seed.bytedance.com/GR3

  • 相关推荐
  • 字节跳动TRAE2.0真的好用吗?同类型AI产品上哪找?

    字节跳动TRAE2.0 AI编程工具升级亮点:1)新增语音交互功能,支持中英文混合输入,实现"说话写代码";2)Builder模式迭代后项目生成成功率提升至92%,复杂需求可一次性跑通;3)免费版每月100次调用额度,支持GPT-4o和Claude-3.5模型;4)五大隐藏技巧:语音调试、图片生成代码、API批量测试等可提升300%效率;5)针对中文开发者优化,支持阿里云/腾讯云SDK调用。实测3分钟

  • 空调行业跟风较上劲 !海尔风随人动、避人吹,格力也推出空调机器人

    2025年上半年空调市场持续火热,线上销售额同比激增50%,线下增长16%。美的、格力、海尔三大品牌占据约70%市场份额,并在"送风体验"创新领域展开激烈竞争。海尔推出"聪明风系列"应用AI人感防直吹技术,实现"风随人动";美的升级无风感技术,内置毫米波雷达2.0系统;格力则推出"空调机器人控制"专利技术,通过多模态模型动态调节送风。三大巨头通过技术创新保持市场优势,上半年份额出现细微波动(海尔+0.7%、美的+0.1%、格力-1.4%),显示行业竞争持续升级。

  • 普渡机器人发布AI扫吸推机器人PUDU MT1 Vac,重新定义智能吸尘新标准

    普渡科技7月15日发布AI扫吸推机器人PUDU MT1Vac,专为大面积吸尘场景设计。产品采用双独立风道系统,吸尘效率提升200%,配备20L超大容量尘污分离系统,单次作业可覆盖1000㎡酒店地毯清洁需求。机器人具备55cm超宽吸尘宽度,集成HEPA级过滤系统,能识别不同地面材质自动调节吸力。搭载激光SLAM+视觉VSLAM融合定位系统,适应酒店、商超等复杂场景。该产品填补了大容量高效吸尘机器人市场空白,推动行业智能化升级。

  • 智慧养老再升级!海尔养老机器人矩阵亮相老博会

    文章主要探讨了在人口老龄化背景下,传统养老服务模式面临人力依赖重、效率低等挑战,科技赋能成为破局关键。海尔在2025年青岛国际康养产业博览会上展示了一系列AI产品,包括衣物洗护机器人、助行机器人等,系统化呈现了科技赋能居家养老的可行路径。其中,海尔智能衣物洗护机器人能实现从洗衣到收纳的全流程自动化,减轻老年人负担;AI运动外骨骼机器人W1则通过柔性算法等技术,帮助老年人稳健行走。文章强调,智慧养老不仅要解决显性问题,更要关注不易察觉的生活痛点,海尔以"无人家务"为方向,加速布局家庭服务机器人场景应用,推动养老从"被动辅助"向"主动赋能"转型,为构建更高效、人性化的智慧适老新方案提供科技支撑。

  • 高交会机器人“八大金刚”展区与“六大代表”展区再掀江湖风云:在“怒放的生命”里狂飙

    2025年2月16日,深圳南山区举办"怒放的生命——企业风采嘉年华"活动,展示8家科技企业机器人创新成果。活动凸显深圳作为中国人工智能与机器人产业主力军的地位,政府通过政策引导、产学研合作等推动技术突破与产业转化。高交会特设机器人展区,汇聚行业顶尖企业。深圳计划投入45亿元发展AI与机器人产业,目标2027年实现千亿产值。活动展现了从技术突破到商业落地的完整产业链,为全球智能产业发展提供"中国方案"。

  • INDEMIND:停止堆功能,扫地机器人需要回归第一性原理

    文章批评当前扫地机器人行业过度追求"花哨"功能而忽视核心清洁能力的问题。厂商为差异化竞争不断叠加视频通话、机械手等创新功能,却导致产品复杂化、故障率上升,用户体验未获实质提升。指出行业应回归本质,聚焦感知、规划、决策三大核心能力升级,解决避障不佳、覆盖率低等基础痛点。介绍INDEMIND公司通过立体视觉技术构建三维语义地图,实现厘米级障碍

  • 聚焦AI新赛道,elexcon深圳国际电子展暨嵌入式展设 AI 机器人专区

    2025年深圳国际电子展暨嵌入式展(ELEXCON)将于8月26-28日举办,聚焦"All for AI, All for GREEN"主题。展会特设AI机器人专区,汇聚越疆、大疆等400+产业链企业,展示从芯片到整机的全产业链技术。同期举办第七届中国嵌入式技术大会,探讨具身机器人嵌入式系统等前沿议题。预计吸引600+机器人领域决策者参与,覆盖AI芯片、汽车电子等热点领域。依托深圳电子产业集群优势�

  • A日报:Trae 2.0 正式升级 SOLO 模式;通义发布Qwen3新模型;智谱AI重磅推出Zread

    本期AI日报聚焦多项AI领域突破:1)Trae 2.0推出SOLO模式,实现AI全流程自主开发;2)阿里通义发布Qwen3-235B大模型,支持256K文本处理;3)智谱AI推出Zread工具,一键转换GitHub项目为使用手册;4)零一万物发布万智企业大模型平台2.0及定制Agent方案;5)字节跳动推出通用机器人模型GR-3,具备高精度操作能力;6)Pika推出AI视频特效APP,降低创作门槛;7)Dia浏览器将上线AI驱动的"分身鼠标&

  • 200W月活流量池,有效提高游戏LTV和ARPU值 Mistplay把激励流量玩出了新高度

    文章介绍了游戏激励平台Mistplay的创新模式,通过"玩赚"机制将短期激励升级为长期行为养成。该平台拥有200万月活用户,通过AI算法精准匹配游戏与玩家,显著提升用户留存率、付费转化等核心数据。典型案例显示,合作游戏7日留存率高于行业均值25%,30日ROAS提升21%。Mistplay近期推出iPhone版应用,并创新推出"LoyaltyPlay"模式,在非游戏应用中设置游戏激励中心。其独特优势在于自有用户流量池、AI驱动的精准投放技术,以及通过社区运营维持用户粘性。平台已覆盖全球九大市场,帮助多款游戏实现出海成功。

  • 腾讯云自研操作系统TencentOS与中国金融认证中心达成合作,全面支持安全启动

    腾讯云操作系统TencentOS Server V4全面支持安全启动(Secure Boot)功能,通过与微软和中国金融认证中心(CFCA)合作,实现双轨并行的安全启动方案。该系统不仅获得微软签名认证,还基于CFCA国产根证书体系完成适配,构建从固件到操作系统的完整信任链。TencentOS团队严格遵循安全规范,对密钥实施严格保护,确保系统启动各环节安全验证,有效防御底层恶意软件攻击。该方案支持"开箱即用",无需额外配置即可在主流服务器和虚拟化平台运行,大幅提升部署效率与安全防护水平。

今日大家都在搜的词:

热文

  • 3 天
  • 7天