首页 > AI头条  > 正文

智元机器人发布开源 GO-1 模型,推动具身智能技术普及

2025-09-23 16:25 · 来源: AIbase基地

智元机器人宣布开源通用具身基座大模型 GO-1(Genie Operator-1),这也是全球首个采用 Vision-Language-Latent-Action (ViLLA) 架构的具身智能模型。此次开源旨在降低具身智能的技术门槛,让更多开发者能够参与这一前沿技术的应用与发展。该模型的发布紧随其后的是今年1月开源的 AgiBot World 具身智能百万真机数据集。

image.png

GO-1模型的核心是 ViLLA 架构,这一技术突破使得机器人能够更好地理解人类意图,执行更加精确的动作。与传统的 Vision-Language-Action (VLA) 架构相比,ViLLA 通过引入隐式动作标记,成功连接了图像、文本输入与机器人的实际动作。该架构的设计分为三层,首先是 VLM 多模态理解层,它基于 InternVL-2B 构建,具备处理视觉、力觉和语言等多种信息的能力。其次是 Latent Planner 隐式规划器,能够实现复杂任务的高层次理解。最后是 Action Expert 动作专家,通过扩散模型生成连续的高精度动作序列,以确保机器人可以执行复杂的操控任务。

此外,智元机器人还推出了 Genie Studio 开发平台,为开发者提供全方位的解决方案,包括数据采集、模型训练、仿真评测等。这一平台不仅集成了 GO-1模型,还提供了视频训练方案和统一训练框架,极大提升了开发效率,帮助具身智能技术的快速落地。

GO-1模型虽然基于 AgiBot G1机器人的数据进行预训练,但经过多种机器人平台的验证测试,显示出其良好的可移植性。这一模型已在多个主流仿真平台上取得了优异的性能表现,展现了其适应不同机器人的能力。

智元机器人鼓励广大开发者访问 GitHub 仓库下载 GO-1模型,开启具身智能的开发之旅。无论是资深 AI 研究者还是新手,GO-1都将为他们提供强大的技术支持。

GitHub:

https://github.com/OpenDriveLab/AgiBot-World

Huggingface:

https://huggingface.co/agibot-world/GO-1

划重点:  

🌟 全球首个开源的 ViLLA 架构模型 GO-1正式推出。  

🔧 Genie Studio 开发平台提供全流程解决方案,助力开发者。  

🤖 GO-1模型经过多种平台测试,展现出良好的可移植性。  

  • 相关推荐
  • 首驱科技重磅发布智能座舱系统,两轮车驶入“智能出行机器人”时代

    9月25日,首驱科技发布无界·妙享1.0技术,推出Skymotor中央智慧大脑、超级雷达、SkyKey1.0 AI无感解锁及零阈OS全域操作系统。通过汽车级电子架构与AI融合,实现两轮车全面智能化升级,打破传统分散式ECU局限,支持整车OTA升级。超级雷达提供全场景安全守护,AI技术提升驾驶辅助体验。零阈OS构建智能出行生态,开放接口支持硬件快速适配。此次发布标志着首驱科技“智能出行机器人”战略的深化,推动行业向智慧出行新时代转型。

  • 全民可感可玩可参与!2025北京机器人文化节落幕,昌平区打造沉浸式体验推动机器人产业场景融合

    10月2日,北京昌平举办“FutureBOT未来引力”2025机器人文化节,聚焦“全民可感、可玩、可参与”,通过四大沉浸式未来场景展示机器人技术。活动汇聚多家科技企业,覆盖人形机器人、家庭服务、教育娱乐等领域,推动技术从实验室走向产业应用,促进机器人产业与本地场景深度融合,助力构建国际领先机器人产业集群,彰显昌平区打造北部机器人产学研示范区的决心。

  • 既能读懂情绪,还能多模态交互!INDEMIND用空间智能重新定义陪伴机器人

    TCL与INDEMIND合作推出的陪伴机器人“Ai Me”通过空间智能技术实现突破,从传统2D感知升级为3D语义感知,赋予机器人动态语义建图、实时环境适应及多模态交互能力。该平台借助立体视觉与多传感器融合,让机器人精准构建三维地图,识别家居属性,实现主动避障与个性化服务。同时,结合低算力混合模型与情感交互功能,机器人可感知用户情绪、提供安全防护,并支持宠物看护等场景拓展,从“工具”升级为有温度的“家庭伙伴”,真正满足复杂家庭需求。

  • 马斯克晒特斯拉人形机器人练功夫:由AI驱动 不是遥控

    特斯拉CEO马斯克近日在社交平台X分享其机器人Optimus学习中国功夫的视频,引发广泛关注。视频中,Optimus能精准识别招式意图并自主做出反击动作,展现环境感知与实时反应能力。马斯克明确表示该机器人由AI自主驱动,非远程操控。网友反应两极,有人赞叹其酷炫,也有人认为AI尚无法完全掌握武术精髓。此外,马斯克曾在内部会议透露,特斯拉计划今年内完成首批Optimus机器人的生产目标。

  • 普渡机器人发布 CC1 系列自清洁工作站,商用清洁进入全栈智能时代

    9月23日,深圳普渡科技发布全球首款全流程自主清洁工作站CC1系列,适配PUDU CC1及CC1Pro清洁机器人。该工作站采用超声波+高温技术,实现吸水扒全面洁净,内置100W超声波模块与65℃高温水热模块,可快速溶解糖类、脂类污渍,避免二次污染。同时配备隐藏式清洁刷,自动清洁滚刷,去除95%以上可见脏污,延长设备寿命。工作站支持三种形态切换,适应不同场景需求,维护效率提升35倍以上,实现“解放双手”与深度清洁效果,推动商用清洁行业迈向全栈智能时代。

  • 马斯克:特斯拉正推进“擎天柱”人形机器人规模化生产

    马斯克近日表示,特斯拉正全力推进擎天柱人形机器人的规模化生产,并认为该产品最终将成为公司最重要产品。该项目重要性显著提升,成为核心关注点。去年10月,该机器人曾在活动中承担递酒、表演及互动等任务。不过,项目部分环节难度超出预期,其中手部研发是最受关注的难题之一,特斯拉希望其手部具备足够灵活性,甚至能完成穿针引线等精细动作。

  • 聚焦“视觉+机器人”!思看科技与艾利特机器人达成战略合作

    9月22日,思看科技与埃利特机器人在苏州签署战略合作协议。双方将聚焦“视觉+机器人”领域,在资源共享、市场拓展、生态共建等方面深化合作,共同推动机器人视觉感知与决策控制、人机交互等关键技术的创新突破。思看科技在三维视觉数字化领域技术领先,埃利特机器人拥有协作机器人全栈自研能力,双方优势互补,致力于在高端制造场景中实现“手眼合一”,赋能行业智能化转型。此次合作标志着两家企业在机器人与视觉融合领域迈出关键一步,未来将共同推动三维视觉与机器人技术的深度协同创新。

  • 金蝶参编工信部机器人行业场景图谱(2025 版)

    工信部印发《场景化、图谱化推进重点行业数字化转型参考指引(2025版)》,聚焦14个行业数字化转型场景图谱。金蝶依托机器人行业数字化实践经验,深度参编机器人行业场景图谱,为行业转型提供参考。该指引以“一图四清单”体系为核心,明确转型路径与四大攻关重点(数据要素、知识模型、工具软件、人才技能)。金蝶通过企业AI平台提供“SaaS+智能体+数据”服务,分步助力制造业企业提升数字化能力,为行业高质量发展注入新动能。

  • 2025工博会观察:当机器人行业追逐具身热点,慧闻iBen为何坚持场景优先?

    在第25届中国国际工业博览会上,慧灵科技iBen以务实技术路径脱颖而出。不同于追逐热门概念,其聚焦工业搬运、智能盘点等具体场景,践行“场景驱动”差异化发展。iBen强调机器人应无缝集成至现有产线,解决客户痛点,如X300智能搬运机器人实现30分钟快速部署、60cm窄道通行,无需改造环境。其智能盘点机器人S01应用RFID技术,漏读率低于1%,并支持多品牌机器人混合调度。慧灵坚持产品化思维,以九年技术积累深耕行业需求,推动机器人从技术可行向商业可行跨越。

  • 考拉悠然开源悠然无界大模型BLM-1.0,以空间智能引擎驱动产业变革

    9月28日,在成都举行的“2025天府人工智能产业生态大会”上,考拉悠然宣布其自主研发的“悠然无界大模型BLM-1.0”完成迭代升级并全面开源,同时发布基于该模型的UU Holo Glass O1 AR工业眼镜。此举标志着公司以“技术开源+场景落地”双轮驱动策略,推动空间智能产业生态共建。BLM-1.0突破传统模型局限,具备跨空间、跨任务、跨本体的“三跨”统一能力,在空间理解、推理与执行三大核心能力上刷新行业纪录。配套AR眼镜深度融合空间感知与多模态交互,实现工业运维、安装巡检等场景的全程自动化与智能辅助,显著提升效率并降低成本。

今日大家都在搜的词: