首页 > 业界 > 关键词  > 小鹏最新资讯  > 正文

小鹏发布可骑乘智能机器马 附四足机器人“自动驾驶”技术讲解

2021-09-07 12:00 · 稿源: 凤凰网科技

凤凰网科技讯9月6日消息,在经过一天的预热之后,小鹏汽车在其官方公众号发布可骑乘智能机器马。据悉,机器马有语音交互功能,可以做到声纹和面部识别,并通过其“面部”屏幕表达情感。除此以外还有负重运输,自主充电功能。

四足机器人眼中的自动驾驶

自动驾驶技术如何应用于四足机器人,赋予其智慧以执行复杂场景的任务呢?

四足机器人的自动驾驶主要解决“这是哪?”“我在哪”的问题。

01“ 这是啥 ”

如何解决四足机器人的感知任务

解决“我在哪?”的问题取决于解决“这是啥?”的程度,越多的强语义目标定位就可以做的更鲁棒。以车辆的自动驾驶来说,通过对车道线、车辆、行人、红路灯、道路标识等结构化道路场景中的少量类别目标进行感知,以完成车辆的辅助定位。

一般的解决方法如下,借助CNN网络结构,通过一个backbone或多个backbone外加多个任务的方式来处理车辆道路这种类别数的情况。选取几个backbone可基于对计算力的制约、感知任务的分解、多任务优化的能力等多方面的考虑。

常见的CNN结构的backbone如下:

图片来源于网络

四足机器人的活动区域要覆盖室内、楼道、小区、道路、商场等多种环境,识别目标种类的数量将会上升至少一个数量级。同时,如果能够让机器人具备一定的在线学习的能力,将来或许能更好的完成任务。

那么如何解决这种数量级的感知任务?以下两种不同的思路可供参考:

一种是构建更大的backbone基础网络,使其能够记录理解更多的物体特征,进而完成多结果数据结构、多种类、多任务的学习。但这种方案在充分利用大型网络的特征提取能力,平衡各任务间的权重方面会存在一定困难。

另一种是将识别目标区分任务数据结构,可以按数据结构、类别、任务来划分不同的模型。通过多模型决策管理系统进行多模型的调度来完成相关任务,但这种也存在消耗大量计算资源,系统结构复杂的困难。

具体来讲:

感知的任务从数据结构上可分解为点的感知、线的感知、框的感知、面的感知、3D信息的感知等;

从类别上可分解为静态目标、动态目标等;

从任务上可分解为定位任务目标、避障任务目标等;

可以从某个角度或者综合多个角度来对任务聚类,之后根据选择大的基础网络采用多模型调度的方案确定感知的实现方式。最后,根据感知的各类结果信息进行融合处理得到目标的属性、轮廓、空间位置以及物体间的空间结构等情况。对于点、线、框、面的感知目前有相对大量成熟的框架和经验可以借鉴。

四足机器人可以通过强化学习、非监督学习及自学习系统提高应对生活中特定目标的能力。

从目前的技术来看,深度学习感知方案依然是建立在大量的标注数据集上,需要开发一套强大的数据服务系统来实现模型的训练、迭代部署。这套系统包含了数据采集、数据处理、数据筛选、数据标注等多个环节。如果能够解决机器人实体问题数据的上传、分析与模型迭代训练,使模型能够不断进化学习,机器人的能力将不断提升。

02“我在哪”

定位技术方案的相关测评

对于“我在哪?”的问题目前有多种不同技术可以解决,主要包括图像SLAM、激光SLAM、高精度地图、语义地图等技术方案。这些技术方案在信息的来源以及信息的形式方面不同,图像信息丰富却缺少三维空间信息。其中,激光点云三维空间信息准确但信息不够丰富。对于信息的形式有图像的特征点、激光点云、线特征、面特征、语义目标等,特征点和激光点云数量大但信息单一,容易误匹配,语义目标信息丰富,不容易误匹配,但数量少,而线特征、面特征介于两者之间。

定位技术方案用于解决“我在哪”的问题,选型取决功能的定位、系统资源、感知能力等多个方面。

图像SLAM和激光SLAM两种方案目前开源项目最多,也是最容易快速搭建原型定位系统的方式。由于这两种方案都受信息单一的影响,所以在鲁棒性、适应性、扩展性等方面都受到制约;

基于线特征、面特征的SLAM技术目前是一个研究的热点方向,该方案在性能方面得到了一定平衡;

以车辆自动驾驶来说,采用的高精地图一般融合了语义目标和激光点云构建成地图,利用两者的优势进行高精度定位;

激光点云地图示例

语义地图则需要大量的目标语义信息(如门窗、树干、路灯、墙沿、路沿、沙发、桌子等)和环境语义信息(楼梯、高楼、草坪、树林等)来辅助解决。要从感知的语义信息将目标动静态属性区分出来,用于构建不同的图层。对于不同的方案有各自的优劣,需要结合任务的目标及实际情况进行方案选取。 总体来看,四足机器人的自动驾驶还处于初始阶段,如何赋予四足机器人足够的智能以达到实用的状态还在探索,需要在已有车辆自动驾驶的基础上进行创新迭代来解决。

举报

  • 相关推荐
  • 华文众合携国内首款中小学具身教育智能机器人亮相第86届中国教装展

    10月24-26日,第86届中国教育装备展在青岛成功举办,聚焦“人工智能引领教育装备高质量发展”。华文众合展出智慧书法教室、智慧粉笔教室等创新产品,并发布国内首款中小学具身教育智能机器人“华文小弈”。该机器人融合AI语音交互、智能运动控制等功能,旨在通过寓教于乐方式提升课堂互动性。展会现场还通过经典古文背诵、AI书法教学等互动环节,展现科技与传统教�

  • 小鹏机器人会走猫步太像人了!小鹏发布新一代人形机器人IRON

    在第七届小鹏科技日上,小鹏汽车发布全新人形机器人IRON,其拟人化程度领先,拥有仿生脊柱、肌肉及柔性皮肤,配备3D曲面显示与灵巧双手,实现22个自由度。搭载3颗图灵AI芯片,算力达2250TOPS,支持对话、行走等智能交互,并采用全固态电池提升安全性。集成自研物理世界模型与VLT/VLA/VLM能力,实现环境感知与反馈。IRON将优先应用于商业场景,并与宝钢合作探索工业巡检。小鹏宣布开放SDK,邀请全球开发者共建机器人应用生态。

  • 何小鹏回应机器人IRON里是真人质疑:感谢认可

    在第七届小鹏科技日上,小鹏汽车自主研发的人形机器人IRON首次亮相,其逼真步态引发网友惊叹“100%真人在里面”。面对质疑,董事长何小鹏以“感谢认可”巧妙回应,展现技术自信。IRON采用类人“骨骼-肌肉-皮肤”结构,搭载仿生肌肉驱动系统和22自由度拟态双手,能精准感知环境变化。团队历时7年研发,计划明年4月进入量产阶段。该机器人还融合物理世界模型体系,集成VLT/VLA/VLM三大核心能力,实现实时环境交互。此次展示既体现小鹏技术积累,也引发对科技真实性的思考。

  • 何小鹏:人形机器人进工厂不划算 做家务不安全

    今日,小鹏汽车发布旗下全新一代人形机器人IRON。 作为最拟人的人形机器人,IRON拥有骨骼-肌肉-皮肤”:仿人脊椎、仿生肌肉、全包覆柔性皮肤、头部3D曲面显示、仿生灵动双肩、实现22个自由度的灵巧手。 据何小鹏介绍,它的猫步走得像人一样轻柔,还拥有像人一样思考的大脑”,它不光是世界上最高算力的人形机器人,明年更会是最聪明的机器人之一。 现场,何小鹏还

  • 女性人形机器人里藏真人?何小鹏回应:并亲自证清白

    小鹏汽车董事长何小鹏发布视频,回应网友对Iron机器人流畅步态真实性的质疑。视频中,团队通过一镜到底展示机器人行走,并解开上衣拉链展示内部机械结构,证明无人操控。何小鹏解释机器人模拟肌肉结构,头部为麦克风阵列,行走时伴有电机声。他透露团队七年研发成果,目前仍处科研阶段,计划明年4月实现软硬件量产。

  • 机器人“全能导航大脑”来了!银河通用发布NavFoM大模型

    银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM,实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用,通过统一“视频流+文本指令→动作轨迹”范式,融合800万条跨任务导航数据,在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施,为规模化商业落地奠定关键基础。

  • 新时达人形机器人新达“入职”海尔工厂,机器人真的开始进厂打工了?

    人形机器人新达在重庆海尔冰箱互联工厂成功落地,标志着具身智能机器人从实验阶段迈向场景实训。相比传统工业机器人,新达具备更高场景适应性和工序协同能力,能完成涂润滑油、物料搬运、智能巡检等复杂任务。其核心技术“大脑-小脑-本体”深度协同,通过视觉语言模型实现自主决策,全栈自研运动控制系统确保精准操作。这不仅是技术突破,更验证了工业制造从自动化向智能化升级的可行路径。

  • “超脑+机器人”重构物流新生态!京东物流“狼族”机器人全阵容亮相世界物联网博览会

    10月31日,世界物联网博览会在无锡开幕,京东物流"狼族"智能机器人军团成为焦点。展会首次完整呈现"超脑+狼族"智能系统,展示天狼四向车、智狼扩展版、自动分播墙等新产品及成熟产品矩阵。系统实现全流程智能作业,分拣准确率超99.99%,存储坪效提升240%,作业人员减少58%。通过仓-站-人高效协同,昆山亚一智能物流园已实现近半数订单由机器人处理。京东物流计划未来5年采购300万台机器人,持续强化智能供应链技术底座,推动行业向科技驱动转型。

  • 国内首款中小学具身智能教育机器人亮相第86届中国教育装备展示会

    10月24日,第86届中国教育装备展在青岛西海岸新区开幕。北京华文小弈机器人公司推出国内首款中小学具身智能教育机器人,专为中小学AI教育设计,覆盖课程、大模型、具身智能等核心内容,具备语音交互、运动控制等功能。该机器人以大语言模型驱动,支持图形化编程与RAG知识底座,通过云端协同实现“大小脑”双系统智能模式,配套互动式AI课程,打造沉浸式学习体验,助力学生从理论到实践全面提升。

  • 触觉增强世界模型引关注,一目科技IROS首秀定义机器人感知新维度

    在2025年IROS大会上,中国AI企业一目科技凭借触觉感知与具身智能领域的突破成为焦点。公司展示了全球最薄仿生视觉触觉传感器,厚度大幅缩减,实现0.005N三维力分辨率和120fps输出帧率。CEO李智强提出"视觉-触觉-语言-行动"新范式,指出触觉能捕捉物理世界的隐秘维度。通过创新仿真平台和生成式AI技术,突破传统数据收集限制,显著提升机器人操作技能训练效率。现场机械臂成功演示易碎品抓取等复杂任务,验证了触觉感知在精细操控中的核心价值,为"操控即服务"产业愿景提供技术支撑。

今日大家都在搜的词: