首页 > AI头条  > 正文

智元机器人发布机器人世界模型开源平台——Genie Envisioner

2025-08-14 16:51 · 来源: AIbase基地

智元机器人在上海宣布推出面向真实世界机器人操控的统一世界模型平台——Genie Envisioner(GE)。这一创新平台突破了传统机器人学习系统分阶段开发的模式,将未来帧预测、策略学习与仿真评估整合进以视频生成为核心的闭环架构,实现了机器人从“看”到“想”再到“动”的端到端推理与执行。基于约3000小时的真实机器人操控视频数据,GE在跨平台泛化和长时序任务执行上展现出显著优势,为具身智能发展开辟了从视觉理解到动作执行的全新技术路径。

GE的核心突破在于构建了基于世界模型的视觉中心建模范式。与主流的视觉-语言-行动(VLA)方法不同,GE直接在视觉空间中建模机器人与环境的交互动态,完整保留了操控过程中的空间结构和时序演化信息。这种建模范式不仅赋予了GE高效的跨本体泛化能力,使其能够在极少量数据下实现跨平台迁移,还在长时序任务的精确执行能力上展现出巨大优势。例如,在折叠纸盒等超长步骤任务中,GE-Act的成功率远超现有顶尖方法。

微信截图_20250814165048.png

GE平台由三个紧密集成的组件构成:GE-Base、GE-Act和GE-Sim。GE-Base是整个平台的核心基础,采用自回归视频生成框架,具备多视角生成能力和稀疏记忆机制,能够处理来自多路视角输入的操控场景,并通过随机采样历史帧增强长时序推理能力。GE-Act作为即插即用的动作模块,通过轻量级架构将视觉潜在表征转换为可执行的机器人控制指令,并采用异步推理模式实现高效实时控制。GE-Sim则将GE-Base的生成能力扩展为动作条件的神经仿真器,通过层次化动作条件机制实现精确的视觉预测,支持闭环策略评估,并可作为数据引擎生成多样化的训练数据。

此外,智元机器人团队还开发了EWMBench评测套件,用于评估面向具身任务的世界模型质量。在与多个先进模型的对比中,GE-Base在多项关键指标上均取得最优成绩,且与人类判断高度一致。智元机器人计划开源GE的全部代码、预训练模型和评测工具,推动机器人从被动执行向主动“想象—验证—行动”的转变。未来,GE将扩展更多传感器模态,支持全身移动与人机协作,持续推动智能制造与服务机器人的落地应用。

🔹 Project page

https://genie-envisioner.github.io/ 

🔹 Arxiv

https://arxiv.org/abs/2508.05635 

🔹Github

https://github.com/AgibotTech/Genie-Envisioner

  • 相关推荐
  • 智元机器人姚卯青:以世界模型驱动飞轮,解锁具身智能规模化应用

    智元机器人合伙人在2025世界机器人大会上发表演讲,系统阐述了公司在具身智能领域的探索成果与未来方向。公司已发布多款机器人产品,建成规模化生产线与训练场,并在算法领域实现多项创新。为解决数据难题,智元开源了AgiBot World百万真机数据集,并推出具身智能基座模型GO-1,该模型在三大场景测试中表现优异。公司创新性地提出"本体-数据-模型-场景"全栈布局理念,通过飞轮迭代逻辑加速技术突破。智元还推出GE Bench评测工具,并计划下半年发布新一代机器人AgiBot G2。过去一年,智元已在柔性制造、物流分拣等多个场景取得突破性应用成果。

  • 周鸿祎与机器人PK球技:带球突破 被机器人抢断

    近日,世界机器人大会现场迎来一场别开生面的“人机对决”——360集团创始人周鸿祎现身加速进化机器人展台,亲自下场与机器人展开1V1足球大战,以球技较量科技实力,引发现场观众阵阵喝彩。 根据现场拍摄的视频画面,这场人机足球赛战况异常激烈。比赛伊始,周鸿祎迅速进入状态,展现出灵活的盘带技术,在绿茵场上灵活穿梭,甚至一度险些晃过面前的机器人对手,

  • 周鸿祎和机器人擂台打拳:红衣教主一拳、一脚放倒机器人

    在2025世界机器人大会现场,360集团创始人周鸿祎与宇树一款拳击机器人上演了一场趣味对决。 网友拍摄的视频显示,周鸿祎直接零帧起手,上去就抱着机器人,右腿一个反向绊,直接一脚将机器人放倒。 等待几秒后,拳击机器人一个腰马合一成功起身,并摆出了拳击动作,周鸿祎和它碰手后,机器人快速使出了一套连环招,动作铿锵有力,周鸿祎有些吃不准它的实力,选择

  • 智元机器人将召开首届合作伙伴大会

    智元机器人将于8月21日举办首届合作伙伴大会,展示具身智能领域最新成果。大会将呈现科技感十足的沉浸式体验空间,重点展示讲解接待、文娱商演、工业智造等八大核心服务场景。远征A2、精灵G1等多款机器人将现场演示迎宾接待、数据采集等硬核技能。当晚还将举办"百台机器人派对",展现自主完成调酒、送餐等餐饮服务的创新应用。公司计划通过渠道网络建设和生态体系发展,加速技术研发与商业落地的核心突破,推动具身智能在更多场景规模化商用。

  • 视源股份全栈自研机器人首次亮相世界机器人大会 定位“3D岗”生产力伙伴

    2025世界机器人大会在北京开幕,视源股份携自主研发的机器人产品参展。其工业级高性能四足机器人MAXHUB X7首次亮相,具备全天候、全地形作业能力,已在工业、电力等场景落地应用。该产品采用多传感器融合导航技术,能适应复杂环境,IP66防护等级确保极端条件下稳定运行。视源股份依托"三院一站"研发体系,构建了从算法创新到制造验证的机器人全栈技术能力。目前公司商用清洁机器人已进入欧洲、东南亚及日本市场,在大型商超批量部署。未来将持续加大研发投入,推动机器人与行业场景深度融合。

  • 智元机器人OmniHand 2025灵巧手上市 灵动款首发9800元起

    智元机器人正式推出新一代OmniHand 2025系列灵巧手,标志着其在机器人关键部件领域取得重要进展。 该系列包含灵动款”与专业款”两大类别,分别针对交互服务场景和专业作业需求设计。 其中,灵动款”OmniHand 2025灵巧手将于8月18日在智元商城及京东平台同步开启预售。其市场指导价为1.48万元,8月18日至31日新品首发期间,用户可享限时优惠价9800元(直降5000元)。同时,具

  • 谷歌DeepMind发布Genie 3世界模型:支持实时生成交互式3D环境

    据媒体报道,谷歌DeepMind正式发布了其新一代通用世界模型Genie 3。 该模型能够根据用户的文本提示,快速生成丰富多样的交互式虚拟环境。Genie 3不仅能够以每秒24帧的速度生成720p分辨率的高清交互式3D世界,更创新性地引入了 可提示世界事件” 功能。用户通过简单文本指令,即可实时修改虚拟环境,显著提升了沉浸感与创造力。 DeepMind视Genie 3为迈向通用人工智能(AGI) 的�

  • 普渡机器人闪耀2025世界机器人大会,全形态具身智能产品矩阵震撼首秀

    2025世界机器人大会(WRC)8月8日在北京开幕,主题为"让机器人更智慧,让具身更智能"。深圳普渡科技携全形态具身智能产品矩阵参展,重点展示包括全球首款类人形具身智能服务机器人"闪电匣Arm"、全尺寸双足人形机器人PUDU D9、猫形机器人贝拉Pro及新款机器狗PUDU D5-W等创新产品。"闪电匣Arm"突破电梯控制难题,实现自主乘梯;D5-W机器狗具备超强运动性能,适应复杂地形。普渡通过"一脑多形"技术架构,构建了业界领先的具身智能体系,产品覆盖专用、类人形、人形及机器狗等多元形态,彰显技术整合与创新能力。目前公司业务已扩展至80多个国家和地区,累计出货超10万台。

  • 智元机器人获富临精工数千万元订单,工业具身智能迎来规模化商用突破

    智元机器人与富临精工达成数千万元项目合作,近百台远征A2-W机器人将落地富临精工工厂,这是国内首个工业领域具身机器人规模化商业签约案例,也是该品类在全球智能制造场景的首次规模化落地。2025年7月,首套远征A2-W已在富临精工生产线完成工业常态化作业直播,单班次完成1000箱周转箱配送。此次部署实现机器人从"单厂试点验证"到"多厂全线覆盖"的跨越式升级,每日承担500台以上产能的原材料配送任务。该系统通过"具身机器人+AMR"构建深度协同系统,实现从物料出库、产线上料到空箱回收的全流程作业。富临精工表示机器人表现超出预期,单班近万次操作零故障。智元机器人表示此次合作验证了具身机器人技术成熟度,将作为工业具身机器人规模化应用的标杆案例。

  • 京东宣布百亿大计划:这次是智能机器人

    2025世界机器人大会在北京开幕,京东作为大会独家全球战略合作伙伴”,携手宇树科技、智元等全球顶尖机器人品牌亮相。 京东现场发布智能机器人产业加速计划”,宣布投入超百亿资源,计划三年内助力100个智能机器人品牌成交额破10亿,推动智能机器人走进超百万个终端场景。 当前智能机器人行业高速发展,预计2028年中国机器人市场将达千亿美元规模,但存在商业化缓

今日大家都在搜的词: