首页 > 传媒 > 关键词  > 世界机器人大会最新资讯  > 正文

智元机器人姚卯青:以世界模型驱动飞轮,解锁具身智能规模化应用

2025-08-14 11:13 · 稿源: 站长之家用户

8月10日,2025世界机器人大会在北京举行。智元机器人合伙人兼具身业务部总裁姚卯青在会议上发表了题为《通向具身智能大规模突破之路——智元的本体数据算法飞轮》的演讲,系统阐述了智元在具身智能领域的探索成果与未来方向。

姚卯青介绍,上海智元机器人成立于2023年2月,自创立起便致力于推动 AI 与机器人的深度融合。至今,智元已取得一系列扎实成果:发布全系列多款机器人产品,建成规模化生产产线与机器人训练场数据采集中心,在具身智能相关算法领域实现多项创新,并在多个实际应用场景完成探索验证,为技术落地筑牢根基。

姚卯青强调,机器人企业要让软硬件产品在行业有效落地,核心在于构建 “本体 - 数据 - 模型 - 场景” 紧密耦合的全栈布局。这四者形成相互驱动的飞轮迭代逻辑:优质本体产生高质量数据,海量高质量数据支撑算法持续突破,算法结合场景试错后,又为本体优化、数据采集方向、算法迭代提供新指引。这种闭环循环不断加速,未来智元将分享更多飞轮迭代成果。

“进入飞轮循环的首个挑战是数据。”姚卯青指出,与大语言模型从业者不同,机器人从业者需直面物理世界强交互特性,既要调试硬件,又要将模型部署到工业级系统测试,这使得数据需求与互联网数据存在本质差异。

“然而,现有互联网数据对机器人训练远远不够,” 姚卯青解释道,“机器人需要大量动作类、长程规划类数据,这类数据在网络上极为稀缺。” 为此,智元希望 “种下第一棵树”,吸引更多同行加入数据建设,共同形成数据海洋,目前这一探索已取得阶段性成果。

为破解数据难题,智元于2024年底开源了AgiBot World百万真机数据集。姚卯青表示,该数据集旨在提供工业级高质量数据支撑,包含百万条机器人数轨迹,每条数据都经过多轮审核,确保场景贴近现实、任务复杂多样。

姚卯青还表示,AgiBot World数据集只是起点,智元在数据采集方式上有两项关键创新:

对抗式采集数据:在常规数据采集过程中主动引入干扰,例如改变语言指令、制造视觉扰动等,以此提升数据信息密度。实践证明,这种方式能提供数倍于常规数据的信息量,有效加快机器人训练收敛速度,且已在多任务和多构型机器人上验证效果。

自主进化式的数据采集:针对机器人在真实环境中自主执行任务时难以提前枚举的 “长尾失效” 问题,智元引入自主进化式采集方案。 当机器人执行任务失效瞬间,系统自动接管并打断进程,回退到失效前状态,再通过人工接管完成数据采集。这一方式能将难场景下的高价值数据补充到训练集,有效拓展数据分布边界,依托数据扩增提升机器人能力上限,其逻辑类似 Dagger 算法框架。

姚卯青说,围绕数据消费,智元于今年3月推出具身智能基座模型GO-1。该模型在架构上实现双重创新:依托 VLM 基础模型和 MOE 混合专家架构,其中 “隐式动作专家” 融合多源数据形成通用动作表达,“显式动作专家” 则将通用描述精准落实到特定本体控制,让机器人既能从人类视角学习动作规律,又能掌握物理世界交互逻辑。

姚卯青指出,GO-1模型发布后,其在生活、零售、工业三大场景的评测中表现尤为亮眼。相较于3月时的海内外开源模型,成功率提升10%-30%。同时,智元发布的AgiBot World数据集,能够很好的验证 Scaling Law,研究揭示了预训练关键规律:数据量、多样性及质量对模型性能影响显著,且实验证明,单一本体预训练数据的后训练迁移效果优于多本体数据。这表明,机器人预训练的核心在于数据场景的多样性、质量,以及适配的模型设计。

“除 GO-1外,智元团队深耕世界模型方向,秉持 “生成理解一体化” 理念。正如人类做事前会在脑海中规划推演,机器人也需依托世界模型精准推演,缩短与实际操作的差距。测试显示,在智元自身本体的多任务测试中,GE-Act 效果优于近期开源的 UniVLA 和 NVIDIA 的 GR00T 模型;针对跨本体迁移能力,以AgiBot World数据集训练的 GE-Base 模型,在 Franka 等本体上表现优异,在开源 Benchmark 和真机测试中,成功率显著高于现有开源模型。”姚卯青说

姚卯青强调,基于世界模型生成的动作,智元机器人能完成叠衣服、组装纸盒等复杂双臂灵巧操作,也能在工业传送带上精准执行物体抓取和打包任务。值得注意的是,相较于 VLA 等短时序输入输出模型,具备长时序推演能力的 GE-Act 在动态场景抓取定位精度上优势明显。

GE-Sim 以动作序列为输入,如同高精度仿真器,能在杂乱真实环境中渲染画面,且具备时空一致性和语义合理性。对比测试显示,其与真实机器人的推理效果高度一致,量化成功率接近。姚卯青说,依托该仿真器,可快速迭代机器人策略,极大缩短模型研发周期,减少实际评测中的复杂流程与损失。

姚卯青表示,为规范世界模型评测,智元推出 GE Bench 并已在 GitHub 和 HuggingFace 开源,成为 IROS 世界模型挑战赛的重要准备工具。 该 Benchmark 从轨迹遵循度、语义合理性、因果一致性等多维度评估模型,而基于机前数据预训练的 GE-Base 模型,在各维度表现均优于主流视频生成类模型。

姚卯青分享了智元在机器人研发中的实践心得:机器人本质要回归执行器,优质执行器是性能基础;传感器虽重要,但调教与量产一致性是行业难题;若聚焦单一机器人类型,人形是较合理的选择;具身智能应是 “机器人 + AI”,需深度结合硬件本体;此外,必须追求量产和一致性,以减少各环节误差。

姚卯青表示,智元计划将上述 “苦涩教训” 融入飞轮迭代,并于今年下半年推出新一代机器人AgiBotG2。该平台采用更灵巧的本体设计,对传感器、执行器提出更高标准,搭载英伟达 Thor 高算力量产域控制器,被定义为 “工业级交互式具身智能作业全球标杆平台”,引发行业广泛关注。

姚卯青强调,“数据 - 模型 - 本体 - 场景” 飞轮的转动,最终是为赋能千行百业。过去一年,智元在多场景取得突破:柔性制造中,用具身智能解决专业设备无法应对的高精度、力控、泛化性操作问题;物流分拣上,具身智能通用机器人与专用设备配合,处理传统视觉定位 + 规划难以完成的杂乱物品分拣;此外,还实现了安检岗点人力清零、电力通信机房巡检操作等场景的人力替代与降本增效。

“具身智能赛道广阔,” 姚卯青呼吁,“希望全球同行携手,共同探索这一智能边疆,让技术真正创造价值。”

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 普渡机器人闪耀2025世界机器人大会,全形态具身智能产品矩阵震撼首秀

    2025世界机器人大会(WRC)8月8日在北京开幕,主题为"让机器人更智慧,让具身更智能"。深圳普渡科技携全形态具身智能产品矩阵参展,重点展示包括全球首款类人形具身智能服务机器人"闪电匣Arm"、全尺寸双足人形机器人PUDU D9、猫形机器人贝拉Pro及新款机器狗PUDU D5-W等创新产品。"闪电匣Arm"突破电梯控制难题,实现自主乘梯;D5-W机器狗具备超强运动性能,适应复杂地形。普渡通过"一脑多形"技术架构,构建了业界领先的具身智能体系,产品覆盖专用、类人形、人形及机器狗等多元形态,彰显技术整合与创新能力。目前公司业务已扩展至80多个国家和地区,累计出货超10万台。

  • 周鸿祎与机器人PK球技:带球突破 被机器人抢断

    近日,世界机器人大会现场迎来一场别开生面的“人机对决”——360集团创始人周鸿祎现身加速进化机器人展台,亲自下场与机器人展开1V1足球大战,以球技较量科技实力,引发现场观众阵阵喝彩。 根据现场拍摄的视频画面,这场人机足球赛战况异常激烈。比赛伊始,周鸿祎迅速进入状态,展现出灵活的盘带技术,在绿茵场上灵活穿梭,甚至一度险些晃过面前的机器人对手,

  • 视源股份全栈自研机器人首次亮相世界机器人大会 定位“3D岗”生产力伙伴

    2025世界机器人大会在北京开幕,视源股份携自主研发的机器人产品参展。其工业级高性能四足机器人MAXHUB X7首次亮相,具备全天候、全地形作业能力,已在工业、电力等场景落地应用。该产品采用多传感器融合导航技术,能适应复杂环境,IP66防护等级确保极端条件下稳定运行。视源股份依托"三院一站"研发体系,构建了从算法创新到制造验证的机器人全栈技术能力。目前公司商用清洁机器人已进入欧洲、东南亚及日本市场,在大型商超批量部署。未来将持续加大研发投入,推动机器人与行业场景深度融合。

  • 智元机器人获富临精工数千万元订单,工业具身智能迎来规模化商用突破

    智元机器人与富临精工达成数千万元项目合作,近百台远征A2-W机器人将落地富临精工工厂,这是国内首个工业领域具身机器人规模化商业签约案例,也是该品类在全球智能制造场景的首次规模化落地。2025年7月,首套远征A2-W已在富临精工生产线完成工业常态化作业直播,单班次完成1000箱周转箱配送。此次部署实现机器人从"单厂试点验证"到"多厂全线覆盖"的跨越式升级,每日承担500台以上产能的原材料配送任务。该系统通过"具身机器人+AMR"构建深度协同系统,实现从物料出库、产线上料到空箱回收的全流程作业。富临精工表示机器人表现超出预期,单班近万次操作零故障。智元机器人表示此次合作验证了具身机器人技术成熟度,将作为工业具身机器人规模化应用的标杆案例。

  • 周鸿祎和机器人擂台打拳:红衣教主一拳、一脚放倒机器人

    在2025世界机器人大会现场,360集团创始人周鸿祎与宇树一款拳击机器人上演了一场趣味对决。 网友拍摄的视频显示,周鸿祎直接零帧起手,上去就抱着机器人,右腿一个反向绊,直接一脚将机器人放倒。 等待几秒后,拳击机器人一个腰马合一成功起身,并摆出了拳击动作,周鸿祎和它碰手后,机器人快速使出了一套连环招,动作铿锵有力,周鸿祎有些吃不准它的实力,选择

  • 智元机器人将召开首届合作伙伴大会

    智元机器人将于8月21日举办首届合作伙伴大会,展示具身智能领域最新成果。大会将呈现科技感十足的沉浸式体验空间,重点展示讲解接待、文娱商演、工业智造等八大核心服务场景。远征A2、精灵G1等多款机器人将现场演示迎宾接待、数据采集等硬核技能。当晚还将举办"百台机器人派对",展现自主完成调酒、送餐等餐饮服务的创新应用。公司计划通过渠道网络建设和生态体系发展,加速技术研发与商业落地的核心突破,推动具身智能在更多场景规模化商用。

  • 京东宣布百亿大计划:这次是智能机器人

    2025世界机器人大会在北京开幕,京东作为大会独家全球战略合作伙伴”,携手宇树科技、智元等全球顶尖机器人品牌亮相。 京东现场发布智能机器人产业加速计划”,宣布投入超百亿资源,计划三年内助力100个智能机器人品牌成交额破10亿,推动智能机器人走进超百万个终端场景。 当前智能机器人行业高速发展,预计2028年中国机器人市场将达千亿美元规模,但存在商业化缓

  • 全球首个女团机器人被拍卖:成交价超万元

    昨晚,价值9999元灵童念NIA-F01人形机器人在某拍卖平台以1元起拍,最终以10580元成交。 这款全球首款AI具身人形桌面机器人号称全球首个女团机器人”,其身高56厘米,为三分之一人类大小,裸机重量不超过700克。 皮肤采用软质PVC材质,细腻亲肤,触感平滑,骨架由ABS及金属等材料构成,支持用户自行绘制体妆和面妆。 基于自研6-8毫米微型数字伺服舵机,拥有最高34个自由度

  • 具身智能机器人产业投资热度攀升,阿里/京东/微美全息齐上阵探寻长期发展潜力

    2025年人形机器人行业迎来融资热潮,京东、腾讯、阿里等科技巨头纷纷入局。摩根士丹利预测2050年全球市场规模将超5万亿美元。国内政策大力支持,核心部件国产化率超70%,今年产业规模有望达379亿元。微美全息(WIMI.US)等企业加速技术突破,布局关键组件研发。行业正从实验室走向生产线,在养老等场景实现应用落地。未来3-5年有望实现商业化突破,逐步融入生产生活各领域。

  • 欧菲光:机器人业务稳步推进,技术突破拓展应用场景

    欧菲光在投资者互动平台回应机器人业务布局,表示已形成明确规划,产品主要应用于扫地机器人、服务机器人等场景。公司自2019年切入机器人赛道,聚焦感知层技术创新,初期推出的ToF避障模块凭借高精度测距能力成为扫地机器人标配方案。2024年发布双光源ToF专利架构方案,实现"避障+定位导航"一体化功能,探测距离提升至10米,兼具低功耗、高采样率等优势,显著降低客户集成成本。未来将持续加大研发投入,围绕"性价比"与"高性能"深化技术布局,优化供应链管理降低成本,同时探索多传感器融合方向。凭借光学光电领域积累,公司已与多家品牌建立长期合作,形成"需求-研发-落地"闭环生态。业内分析认为,随着智能化需求增长,服务机器人市场将持续扩容,欧菲光有望凭借技术优势占据重要地位。

今日大家都在搜的词: