入坑容易,玩出彩难。
一直以来,关于纯视觉自动驾驶的争议,始终挑拨着业内的神经。不断引发专业人士的“友好讨论”,甚至头部车企的创始人直接下场对线。但正如没有人能准确预知未来一样,在即分高下也决生死的紧张氛围下,总有一方会被回旋镖打到自己。
马斯克的笃定,小鹏的“背刺”
当FSD问题缠身,马斯克却笃定自动驾驶纯视觉就是先进答案,说出融合激光雷达完全毫无意义,注定失败的言论时,已经无需猜测在行业中所能引起的争议有多大。
在2021年,特斯拉突然宣布FSD的V9.0beta测试版宣布采用纯视觉方案,行业内的质疑声随之再起,但这些声音丝毫没有影响到马斯克的计划,随后便上市了不再配备毫米波雷达的Model3和Model Y。
正如不管你是天才还是普通人都会栽跟头一样,这次轮到了马斯克,当年11月份便召回了1.1万辆车,重要原因便是纯视觉的表现没有达到预期。一时间,纯视觉不可靠的声音甚至把特斯拉团队搞得“自我怀疑”。
然而时至今日,随着V12版本的发布,纯视觉方案的口碑似乎一夜得到了逆转,其表现出的智驾表现不仅获得了大部分人的认可, 还有融合方案忠实拥趸的“背刺”。
前段时间,何小鹏在美国亲测FSD之后,宣布转向纯视觉。随后业内便曝光了小鹏新车P7+弃用激光雷达。小鹏是国内智能驾驶的领头羊,同时也是融合方案的技术代表,这一突然的转变,不仅引发国内的热议,也让马斯克忍不住评论三点。
事实上,小鹏的转向并非突然,在此之前,业内人士便已曝出激光雷达在去年就没有进入小鹏的BEV网络进行训练,只是在XNet给出感知结果之后,进行识别距离的二次确认。同样,有plan B的不只是小鹏,每家车企都不会固步自守地坚持一个技术路线。诸如华为、蔚来、小米、极越等车企都已在尝试及应用纯视觉方案。因此到今天,当纯视觉逐渐被接受,二者的争议显然已经不再重要。
纯视觉,适合机器人吗?
机器人作为自动驾驶汽车的孪生兄弟,在技术层面有着极大的相似性,均需要通过强大的感知模块获取环境信息,这意味着视觉方案对于机器人有着同样的天然优势。然而优势归优势,虽是孪生子,差异性同样很多。
一方面,视觉方案能获取丰富的环境信息,却也需要消耗极大的计算资源。与汽车搭载的车规级硬件相比,机器人显然做不到。在无论家用机器人还是商用机器人都大打价格战的今天,厂商们无不为了降本增效绞尽脑汁,如果仅是为了应用视觉方案,从而提升整机成本,显然并不现实。
另一方面,自动驾驶面临的真实环境,大多为标准性的,包含标准的交通信号、路面标示、行驶准则等等,而机器人面对的环境相对更加多样,且具有非标性,环境适应能力需要更强。
因此,在保障整体性能的前提下,有效降低算力要求是机器人不同于汽车的首先步。
其次,随着机器人发展趋势回归产品本身,智能化升级成为了核心竞争力。机器人不仅需要具备更稳健的适应能力,还需要具备智能避障、AI识别、人机交互、智能作业、多机协作、智能梯控等等。此外,对于不同领域的机器人,还需要练就独有的“绝活”,如清洁机器人的脏污检测能力。
针对这些需求,视觉方案还需要给出自己的答案。
玩转纯视觉,INDEMIND的答案
作为视觉技术起家的机器人技术公司,从早期的视觉模组产品,到如今的机器人视觉解决方案,INDEMIND一直坚信着视觉技术的潜力。
相较于行业内对于视觉方案的剖析,作为入局者的INDEMIND有着更深刻的体会。面对层出不穷的技术难题,不断投入,敢于创新是保持持续进化的关键。随着核心技术链不断成熟,目前已实现纯视觉方案家用机器人和商用机器人全适配。
在研发过程中,针对算力难题,INDEMIND为此研发了多种轻量化技术,轻量化VSLAM(基于深度学习特征的SLAM架构)、轻量化Depth(基于深度学习特征匹配的Depth)、轻量化深度学习模型(底层算子自研、剪枝、量化),同时还在硬件上,对于视觉处理采用NEON加速、GPU加速、DSP加速等方式,提升计算性能。
目前,在扫地机器人方向,INDEMIND视觉方案搭载4核A53/A55级别芯片即可满足需求,能够适配如RK3566、VicoreTek6601/6801等(全解决方案情况下,双目视觉多传感器融合SLAM、双目Depth、物体识别及整机完整SDK)。
在环境适应方面,INDEMIND视觉方案可实时自主创建及更新全场景二维地图、三维地图及语义地图,显著提升机器人的场景适应能力。同时,INDEMIND拥有超过100个使用场景的海量数据,对于清洁、配送、导览、安防等多种工作场景有着深度理解,进一步提升机器人的环境自适应能力。
特别需要说到的是,搭载INDEMIND视觉方案的商用机器人可以做到无需预部署,开机即用,这与现有产品有着明显区别。
INDEMIND还开发了一套系统化环境补光策略,包含主动式环境补光配置和光照变化条件下的建图策略,在实际表现中,面对强光直射、无光源、昏暗等特殊光照环境均能无差异工作,满足全天候作业要求。
为了提升智能表现,INDEMIND基于设备端、云端智能决策平台、大数据平台三端,建立了一套智能决策引擎,能够在语义层次上理解环境信息,模仿人类大脑对环境理解的方式,并进行策略处理,实现智能避障、人机交互、智能作业等多种业务逻辑。同时,基于关键数据能够不断更新算法模型,持续提升场景处理和问题应对能力。
值得一提的是,INDEMIND还研发了以视觉图像算法配合融合摄像头及主动补光策略构建而成的脏污识别技术,在实际表现上,目前已能够达到平均脏污检出率99%以上(包含常见固体、液体脏污),支持任何地面材质、花色、光线下的透明、半透明,不透明液体及干涸污渍识别、颗粒状脏污识别、粉末状脏污识别,是目前行业极少成熟且性能优异的技术方案。
新技术的出现,总会面临着争议,但与此同时,我们也需要做好接受新事物的准备。
(推广)