首页 > 传媒 > 关键词  > 辅助驾驶最新资讯  > 正文

VLA模型打响升维战:理想、元戎启行如何重塑“安心感”

2025-06-20 16:39 · 稿源: 站长之家用户

当前,辅助驾驶已实现“全国都能开”的基础覆盖,但用户从“能用”到“爱用”的鸿沟依然显著。核心痛点在于“安心感不足”——系统决策缺乏解释性、盲区预判能力薄弱、人机交互过于机械化等问题,导致用户对智驾系统缺乏信任。

而理想与元戎启行同期押注VLA(视觉-语言-动作)模型,正是针对这一痛点,通过技术升维破解智驾体验的“最后一公里”。

VLA模型的本质是通过运用语言模型,增强系统的推理能力,让系统对社会常识有更全面的认知,从而解决更多的长尾场景。

当下智驾面临的挑战和质疑,主要归类为以下几类问题:

首先是模型存在不可解释性。

用户并不知道系统为何会无故加速、减速,甚至退出。信息的不透明导致用户对智驾系统丧失安全感和信任,不敢用辅助驾驶系统。

其次是防御型驾驶能力不足。

防御型驾驶能力的高低是新老司机的最大区别。

最典型的就是高架桥的桥墩盲区。匝道汇入主路时,一侧的桥墩会遮住司机大半个视野,新手司机可能察觉不到,但老司机会提前减速观察,避免突然出现车辆。

交管部门数据显示,在众多交通伤亡事故中,因内轮差和盲区引发的事故占比达到70% 以上。现在多数智驾遇到鬼探头只能做到急刹避让,但防御型驾驶是要能提前结合场景,预知鬼探头风险提前减速。

最后是人机交互过于机械化。

目前大多数车辆进入辅助驾驶状态后,用户选择仅限于接管和不接管,没有专属用户的定制化驾驶风格,与个性化的语音交互,这也是系统决策容易偏离用户预期的原因质疑,智驾行业都没有彻底解决用户“安心感”的问题。

在此背景下,以理想、元戎为代表的玩家坚定押注VLA技术路线,运用语言模型的能力来解决以上这些问题。

首先,元戎和理想的VLA模型将语音交互控车进行了全面升级——用户能在车辆在辅助驾驶中,语音控制车辆的动作、车速、车道选择等,甚至还释放了豪车识别功能。若遇上豪车,智驾则会更加谨慎,展示了VLA系统对场景深刻精准的理解能力。

语音控车指令

此外元戎启行还释放了空间语义理解、异形障碍物识别、文字类引导牌理解三大功能。

空间语义理解,即 VLA 可以解决盲区场景设计的问题。相当于为系统装上透视眼,预判行车中的交通盲区。

例如,在通过无红绿灯的路口时,VLA模型能提前识别到“注意横穿,减速慢行”的指示牌,即使公交车通行造成动态盲区,VLA也会结合公交车的动作去做出准确的决策。当公交车进行减速时,它会通过推理前方可能有行人穿行,并做出“立即减速、注意风险、谨慎通行”的决策。

公交车动态盲区遮挡

异形障碍物识别属于智驾的算法长尾问题,过去经常被归类为1% 的极端路况。但依靠 VLA 模型,即便识别到“变形”的超载小货车,也能结合实际路况,执行减速绕行或靠边驾驶。

异形障碍物识别

此外,VLA 也可以加强系统对文字类引导牌的理解能力。元戎启行的 VLA 模型能识别并理解各种图形、文字类路牌信息,按照路牌引导内容行驶。

特殊路标识别

面对左转待行区、可变车道、潮汐车道等 “动态规则路段”,VLA模型能够读懂字符与图标的含义,高效匹配实时路况。在多车道复杂路口选道直行的场景中,能够准确识别车辆前方的文字及图案标识牌,从左转右转混杂的路口准确找到左转车道,并执行操作。

元戎启行正在通过VLA模型,打造能防御型驾驶的 AI 司机。

据悉,元戎的 VLA 模型将会在第三季度量产上车5款车型。接下来,智驾是否具备更长远的思维、推测能力,VLA 能否大规模量产上车,也将是下半年智驾玩家们能否进入 VLA 第一梯队的关键。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 出事司机担责!小米:辅助驾驶不是自动驾驶 请大家正确理解使用辅助驾驶

    宣布1000万Clips版本小米端到端辅助驾驶面向小米SU7系列推送后,官方也是给出了喊话。 小米汽车呼吁,辅助驾驶现阶段不是自动驾驶,请大家正确理解和使用相关辅助驾驶功能,确保时刻注意路况信息,并随时准备控制车辆。” 相比于之前的300万Clips版本,1000 万 Clips 版本的小米端到端辅助驾驶功能对复杂路况的应对更从容、决策更贴近于真实老司机”的驾驶习惯,比如加�

  • 从数据到安心:全民钱包用科技让信任不再是空谈

    在网贷行业风险与合规双重约束的背景下,用户资金安全诉求与平台风控能力的匹配度已成为核心竞争力。全民钱包深耕消费信贷风控领域,依托自主研发的金睛风控系统(CRAM),构建了以大数据治理为基础、AI算法为核心的智能化风控体系,通过技术穿透实现风险的精准识别与高效拦截,为普惠金融场景提供了可量化的安全保障。一、风控技术底座:数据治理与特征工程的�

  • 雷军:小米在辅助驾驶技术上投入很大 我相信会越来越好!

    小米也正在发力辅助驾驶,而雷军直言,他们会越来越好。 小米YU7交付的同时,全新的1000万Clips版本的辅助驾驶同步量产上车了,在这样的大背景下,雷军跟网友互动时表示,欢迎大家测试!我们在辅助驾驶技术上投入很大,我相信会越来越好!” 5月4日,小米调整了SU7新车定购页面中的措辞,将智驾”更名为辅助驾驶”。具体来看,小米SU7标准版搭载的Xiaomi Pilot Pro由小米�

  • 让AI触手可及 三星Galaxy手机开启全场景智能体验

    三星在智能手机行业同质化竞争中,通过Galaxy AI打造差异化体验。自S24系列起,三星将生成式AI深度融入移动终端,计划年内覆盖超2亿设备。调研显示47%用户认为AI搜索、语音助手等功能不可或缺,70%的S25用户已使用三星AI工具。三星通过多终端协同构建AI生态,在影像创作、效率提升等方面提供创新体验,如Z Fold7的分屏AI操作、智能收藏等功能。目前三星手机出货量持续领先,计划2025年底前将Galaxy AI覆盖超4亿设备,推动移动AI普及与深化。

  • 小米端到端辅助驾驶1000万Clips版全量推送 雷军:加减速更柔和

    小米创办人雷军介绍,HAD小米端到端辅助驾驶1000万Clips版已经全量推送,支持小米SU7 Pro、小米SU7 Max、小米SU7 Ultra车型。 该版本加减速更柔和,驾乘体感更舒适;绕行更灵活,决策更果断;路口通过更顺畅,对道路理解更深度。 据了解,Clips指的是记录了人类司机驾驶行为的视频片段。每一段Clip都记录了司机在面对复杂场景时的思考和决策。这些Clips不仅包含了城市道路、高

  • 小米端到端辅助驾驶升级1000万Clips版本:7大显著提升跻身第一梯队!

    近日,雷军官宣小米汽车辅助驾驶升级到1000万Clips版本,那么升级后有何变化?小米汽车进行了回应。 相比于之前的300万Clips版本,1000万Clips版本的小米端到端辅助驾驶功能对复杂路况的应对更从容、决策更贴近于真实老司机”的驾驶习惯。 具体体现在: 加减速更柔和:拥堵场景下,跟车稳定性与起步响应速度提升,可提前识别复杂加塞行为并及时制动减速,减少顿挫感,

  • 小米SU7系列正式推送1000万Clips版本端到端辅助驾驶

    小米汽车7月29日宣布为SU7系列车型推送1000万Clips版本的端到端辅助驾驶系统,覆盖SU7 Pro/Max/Ultra全系车型。新系统通过海量数据训练显著优化驾驶体验,在复杂路况决策能力和舒适性方面实现突破。相比此前300万Clips版本,新系统在三大核心场景表现提升显著:纵向控制舒适度提升57%,加减速更平顺;绕行成功率提升67%,窄路会车等场景决策更果断;路口通过率提升23%,能更好适应中国特色的"人车混行"规则。小米强调当前技术仍属L2+级别,需驾驶员全程保持注意力。此次升级标志着小米智能驾驶技术进入数据驱动新阶段,未来将通过OTA持续迭代优化系统。

  • 刚刚,全网最懂图文调研的智能体模型震撼上线,看完我直接卸了浏览器

    疯狂的七月已经落下了帷幕,如果用一个词来形容国产大模型,「开源」无疑是当之无愧的高频词汇。 各大厂商你方唱罢我登场,昆仑万维、阿里、智谱、月之暗面、腾讯、阶跃星辰等众多玩家们先后开源了数十款大模型。根据 Hugging Face 发布的中国 AI 社区七月开放成果,短短一个月开源模型总数达到了惊人的33款。 进入到八月,国产大模型「上新」的势头丝毫不减,重量�

  • 买车送司机!理想i8全球首搭VLA司机大模型:老车主也能用

    在今晚举办的理想i8上市发布会上,理想自动驾驶负责人郎咸朋上台分享了理想自研VLA司机大模型的相关内容,据悉,这是一款视觉语言行动模型。 VLA即Vision-Language-Action Model,理想汽车希望该模型能让AI真正成为司机,成为交通领域的专业生产工具,像人类司机一样工作,甚至喊出了买车送司机”的口号。 VLA的实现是一个进化过程,经历了三个阶段。 第一阶段是2021年起自�

  • 智元机器人姚卯青:以世界模型驱动飞轮,解锁具身智能规模化应用

    智元机器人合伙人在2025世界机器人大会上发表演讲,系统阐述了公司在具身智能领域的探索成果与未来方向。公司已发布多款机器人产品,建成规模化生产线与训练场,并在算法领域实现多项创新。为解决数据难题,智元开源了AgiBot World百万真机数据集,并推出具身智能基座模型GO-1,该模型在三大场景测试中表现优异。公司创新性地提出"本体-数据-模型-场景"全栈布局理念,通过飞轮迭代逻辑加速技术突破。智元还推出GE Bench评测工具,并计划下半年发布新一代机器人AgiBot G2。过去一年,智元已在柔性制造、物流分拣等多个场景取得突破性应用成果。

今日大家都在搜的词: