理想发布端到端自动驾驶技术,让车辆学会思考
7月5日,理想汽车在智能驾驶夏季发布会上宣布启动端到端 VLM(视觉语言模型)早鸟计划。
端到端自动驾驶最大的突破在于取消了对先验信息的依赖,这意味着车辆可以真正实现全国范围内无限制驾驶,只要有导航即可。

端到端模型通过传感器接收数据,直接输出行驶轨迹,彻底省去了对高精地图等先验信息的依赖。
VLM是一种基于 Transformer 模型的视觉语言模型,它将文本提示、视觉信息和导航地图信息融合在一起,进行自回归推理,输出对环境的理解、驾驶决策和驾驶轨迹。

VLM输出的信息会被传递给系统 1,控制车辆的运行。VLM会持续思考驾驶环境,并向系统 1 提供合理驾驶建议。系统 1 也可以主动向系统 2 求助,解决部分复杂场景。

简单来说,VLM让车辆具备了思考能力,使自动驾驶的操作方式更贴近人类老司机的处理方式。
(举报)