首页 > 传媒 > 关键词  > 世界机器人大会最新资讯  > 正文

智元机器人姚卯青:以世界模型驱动飞轮,解锁具身智能规模化应用

2025-08-14 11:13 · 稿源: 站长之家用户

8月10日,2025世界机器人大会在北京举行。智元机器人合伙人兼具身业务部总裁姚卯青在会议上发表了题为《通向具身智能大规模突破之路——智元的本体数据算法飞轮》的演讲,系统阐述了智元在具身智能领域的探索成果与未来方向。

姚卯青介绍,上海智元机器人成立于2023年2月,自创立起便致力于推动 AI 与机器人的深度融合。至今,智元已取得一系列扎实成果:发布全系列多款机器人产品,建成规模化生产产线与机器人训练场数据采集中心,在具身智能相关算法领域实现多项创新,并在多个实际应用场景完成探索验证,为技术落地筑牢根基。

姚卯青强调,机器人企业要让软硬件产品在行业有效落地,核心在于构建 “本体 - 数据 - 模型 - 场景” 紧密耦合的全栈布局。这四者形成相互驱动的飞轮迭代逻辑:优质本体产生高质量数据,海量高质量数据支撑算法持续突破,算法结合场景试错后,又为本体优化、数据采集方向、算法迭代提供新指引。这种闭环循环不断加速,未来智元将分享更多飞轮迭代成果。

“进入飞轮循环的首个挑战是数据。”姚卯青指出,与大语言模型从业者不同,机器人从业者需直面物理世界强交互特性,既要调试硬件,又要将模型部署到工业级系统测试,这使得数据需求与互联网数据存在本质差异。

“然而,现有互联网数据对机器人训练远远不够,” 姚卯青解释道,“机器人需要大量动作类、长程规划类数据,这类数据在网络上极为稀缺。” 为此,智元希望 “种下第一棵树”,吸引更多同行加入数据建设,共同形成数据海洋,目前这一探索已取得阶段性成果。

为破解数据难题,智元于2024年底开源了AgiBot World百万真机数据集。姚卯青表示,该数据集旨在提供工业级高质量数据支撑,包含百万条机器人数轨迹,每条数据都经过多轮审核,确保场景贴近现实、任务复杂多样。

姚卯青还表示,AgiBot World数据集只是起点,智元在数据采集方式上有两项关键创新:

对抗式采集数据:在常规数据采集过程中主动引入干扰,例如改变语言指令、制造视觉扰动等,以此提升数据信息密度。实践证明,这种方式能提供数倍于常规数据的信息量,有效加快机器人训练收敛速度,且已在多任务和多构型机器人上验证效果。

自主进化式的数据采集:针对机器人在真实环境中自主执行任务时难以提前枚举的 “长尾失效” 问题,智元引入自主进化式采集方案。 当机器人执行任务失效瞬间,系统自动接管并打断进程,回退到失效前状态,再通过人工接管完成数据采集。这一方式能将难场景下的高价值数据补充到训练集,有效拓展数据分布边界,依托数据扩增提升机器人能力上限,其逻辑类似 Dagger 算法框架。

姚卯青说,围绕数据消费,智元于今年3月推出具身智能基座模型GO-1。该模型在架构上实现双重创新:依托 VLM 基础模型和 MOE 混合专家架构,其中 “隐式动作专家” 融合多源数据形成通用动作表达,“显式动作专家” 则将通用描述精准落实到特定本体控制,让机器人既能从人类视角学习动作规律,又能掌握物理世界交互逻辑。

姚卯青指出,GO-1 模型发布后,其在生活、零售、工业三大场景的评测中表现尤为亮眼。相较于3月时的海内外开源模型,成功率提升10%-30%。同时,智元发布的AgiBot World数据集,能够很好的验证 Scaling Law,研究揭示了预训练关键规律:数据量、多样性及质量对模型性能影响显著,且实验证明,单一本体预训练数据的后训练迁移效果优于多本体数据。这表明,机器人预训练的核心在于数据场景的多样性、质量,以及适配的模型设计。

“除 GO-1外,智元团队深耕世界模型方向,秉持 “生成理解一体化” 理念。正如人类做事前会在脑海中规划推演,机器人也需依托世界模型精准推演,缩短与实际操作的差距。测试显示,在智元自身本体的多任务测试中,GE-Act 效果优于近期开源的 UniVLA 和 NVIDIA 的 GR00T 模型;针对跨本体迁移能力,以AgiBot World数据集训练的 GE-Base 模型,在 Franka 等本体上表现优异,在开源 Benchmark 和真机测试中,成功率显著高于现有开源模型。”姚卯青说

姚卯青强调,基于世界模型生成的动作,智元机器人能完成叠衣服、组装纸盒等复杂双臂灵巧操作,也能在工业传送带上精准执行物体抓取和打包任务。值得注意的是,相较于 VLA 等短时序输入输出模型,具备长时序推演能力的 GE-Act 在动态场景抓取定位精度上优势明显。

GE-Sim 以动作序列为输入,如同高精度仿真器,能在杂乱真实环境中渲染画面,且具备时空一致性和语义合理性。对比测试显示,其与真实机器人的推理效果高度一致,量化成功率接近。姚卯青说,依托该仿真器,可快速迭代机器人策略,极大缩短模型研发周期,减少实际评测中的复杂流程与损失。

姚卯青表示,为规范世界模型评测,智元推出 GE Bench 并已在 GitHub 和 HuggingFace 开源,成为 IROS 世界模型挑战赛的重要准备工具。 该 Benchmark 从轨迹遵循度、语义合理性、因果一致性等多维度评估模型,而基于机前数据预训练的 GE-Base 模型,在各维度表现均优于主流视频生成类模型。

姚卯青分享了智元在机器人研发中的实践心得:机器人本质要回归执行器,优质执行器是性能基础;传感器虽重要,但调教与量产一致性是行业难题;若聚焦单一机器人类型,人形是较合理的选择;具身智能应是 “机器人 + AI”,需深度结合硬件本体;此外,必须追求量产和一致性,以减少各环节误差。

姚卯青表示,智元计划将上述 “苦涩教训” 融入飞轮迭代,并于今年下半年推出新一代机器人 AgiBot G2。该平台采用更灵巧的本体设计,对传感器、执行器提出更高标准,搭载英伟达 Thor 高算力量产域控制器,被定义为 “工业级交互式具身智能作业全球标杆平台”,引发行业广泛关注。

姚卯青强调,“数据 - 模型 - 本体 - 场景” 飞轮的转动,最终是为赋能千行百业。过去一年,智元在多场景取得突破:柔性制造中,用具身智能解决专业设备无法应对的高精度、力控、泛化性操作问题;物流分拣上,具身智能通用机器人与专用设备配合,处理传统视觉定位 + 规划难以完成的杂乱物品分拣;此外,还实现了安检岗点人力清零、电力通信机房巡检操作等场景的人力替代与降本增效。

“具身智能赛道广阔,” 姚卯青呼吁,“希望全球同行携手,共同探索这一智能边疆,让技术真正创造价值。”

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 聚焦“视觉+机器人”!思看科技与艾利特机器人达成战略合作

    9月22日,思看科技与埃利特机器人在苏州签署战略合作协议。双方将聚焦“视觉+机器人”领域,在资源共享、市场拓展、生态共建等方面深化合作,共同推动机器人视觉感知与决策控制、人机交互等关键技术的创新突破。思看科技在三维视觉数字化领域技术领先,埃利特机器人拥有协作机器人全栈自研能力,双方优势互补,致力于在高端制造场景中实现“手眼合一”,赋能行业智能化转型。此次合作标志着两家企业在机器人与视觉融合领域迈出关键一步,未来将共同推动三维视觉与机器人技术的深度协同创新。

  • 首驱科技重磅发布智能座舱系统,两轮车驶入“智能出行机器人”时代

    9月25日,首驱科技发布无界·妙享1.0技术,推出Skymotor中央智慧大脑、超级雷达、SkyKey1.0 AI无感解锁及零阈OS全域操作系统。通过汽车级电子架构与AI融合,实现两轮车全面智能化升级,打破传统分散式ECU局限,支持整车OTA升级。超级雷达提供全场景安全守护,AI技术提升驾驶辅助体验。零阈OS构建智能出行生态,开放接口支持硬件快速适配。此次发布标志着首驱科技“智能出行机器人”战略的深化,推动行业向智慧出行新时代转型。

  • 马斯克:特斯拉正推进“擎天柱”人形机器人规模化生产

    马斯克近日表示,特斯拉正全力推进擎天柱人形机器人的规模化生产,并认为该产品最终将成为公司最重要产品。该项目重要性显著提升,成为核心关注点。去年10月,该机器人曾在活动中承担递酒、表演及互动等任务。不过,项目部分环节难度超出预期,其中手部研发是最受关注的难题之一,特斯拉希望其手部具备足够灵活性,甚至能完成穿针引线等精细动作。

  • 京东JDD现场直击:机器人组团踢足球还会叠衣服哄你开心

    9月25日,以“Enjoy AI”为主题的JDDiscovery 2025京东全球科技探索大会在北京开幕。大会通过人形机器人舞蹈、互动体验、足球表演等生动展示,呈现了AI技术的多样化应用场景。优必选、宇树科技等企业带来多款创新机器人,展现了我国在运动控制、仿生外观等领域的突破。京东还展示了其机器人生态布局,涵盖家庭陪护、教育、娱乐等产品。现场观众近距离感受AI技术的魅力,对未来人机和谐共处充满期待。

  • 上海一男子自家院子喝茶看俩机器人洗车:虽然洗不干净 但体验感拉满

    近日,上海一名男子在自家院子喝茶时,拍摄两台机器人洗车的视频引发热议。机器人有条不紊地完成打泡沫、持枪冲洗等动作,男子悠闲旁观,称体验“拉满了”。他因被机器人运动会视频“种草”,一口气购入两台,经反复调试才实现功能。男子表示,机器人带来的乐趣远胜洗车效果本身,唯一遗憾是洗得不够干净。网友热议称,这解决了“家里没有残障人士的问题”,并精准指出买机器人不为洗干净,而是图好玩和情绪价值。

  • 金蝶参编工信部机器人行业场景图谱(2025 版)

    工信部印发《场景化、图谱化推进重点行业数字化转型参考指引(2025版)》,聚焦14个行业数字化转型场景图谱。金蝶依托机器人行业数字化实践经验,深度参编机器人行业场景图谱,为行业转型提供参考。该指引以“一图四清单”体系为核心,明确转型路径与四大攻关重点(数据要素、知识模型、工具软件、人才技能)。金蝶通过企业AI平台提供“SaaS+智能体+数据”服务,分步助力制造业企业提升数字化能力,为行业高质量发展注入新动能。

  • 普渡机器人发布 CC1 系列自清洁工作站,商用清洁进入全栈智能时代

    9月23日,深圳普渡科技发布全球首款全流程自主清洁工作站CC1系列,适配PUDU CC1及CC1Pro清洁机器人。该工作站采用超声波+高温技术,实现吸水扒全面洁净,内置100W超声波模块与65℃高温水热模块,可快速溶解糖类、脂类污渍,避免二次污染。同时配备隐藏式清洁刷,自动清洁滚刷,去除95%以上可见脏污,延长设备寿命。工作站支持三种形态切换,适应不同场景需求,维护效率提升35倍以上,实现“解放双手”与深度清洁效果,推动商用清洁行业迈向全栈智能时代。

  • 2025工博会观察:当机器人行业追逐具身热点,慧闻iBen为何坚持场景优先?

    在第25届中国国际工业博览会上,慧灵科技iBen以务实技术路径脱颖而出。不同于追逐热门概念,其聚焦工业搬运、智能盘点等具体场景,践行“场景驱动”差异化发展。iBen强调机器人应无缝集成至现有产线,解决客户痛点,如X300智能搬运机器人实现30分钟快速部署、60cm窄道通行,无需改造环境。其智能盘点机器人S01应用RFID技术,漏读率低于1%,并支持多品牌机器人混合调度。慧灵坚持产品化思维,以九年技术积累深耕行业需求,推动机器人从技术可行向商业可行跨越。

  • 既能读懂情绪,还能多模态交互!INDEMIND用空间智能重新定义陪伴机器人

    TCL与INDEMIND合作推出的陪伴机器人“Ai Me”通过空间智能技术实现突破,从传统2D感知升级为3D语义感知,赋予机器人动态语义建图、实时环境适应及多模态交互能力。该平台借助立体视觉与多传感器融合,让机器人精准构建三维地图,识别家居属性,实现主动避障与个性化服务。同时,结合低算力混合模型与情感交互功能,机器人可感知用户情绪、提供安全防护,并支持宠物看护等场景拓展,从“工具”升级为有温度的“家庭伙伴”,真正满足复杂家庭需求。

  • 元萝卜以“家电价格的机器人”,开启智能养老普惠时代

    商汤科技旗下家用机器人品牌“元萝卜”入选工信部智能养老服务机器人试点,成为全球首个规模化量产家用AI机械臂企业。通过技术创新将价格降至3999元,实现10万台销量并进入20多个国家市场。加入创新联合体后,将聚焦智能养老场景落地,升级现有产品植入大语言模型实现情感陪护,同时研发2027年家庭养老场景的家务机器人。从功能价值向情绪价值升级,通过IP联动为产�

今日大家都在搜的词: