理想正式启动端到端 VLM的早鸟计划：让自动驾驶成为老司机

2024-07-06 08:59 · 稿源：快科技

理想发布端到端自动驾驶技术，让车辆学会思考

7月5日，理想汽车在智能驾驶夏季发布会上宣布启动端到端 VLM（视觉语言模型）早鸟计划。

端到端自动驾驶最大的突破在于取消了对先验信息的依赖，这意味着车辆可以真正实现全国范围内无限制驾驶，只要有导航即可。

端到端模型通过传感器接收数据，直接输出行驶轨迹，彻底省去了对高精地图等先验信息的依赖。

VLM是一种基于 Transformer 模型的视觉语言模型，它将文本提示、视觉信息和导航地图信息融合在一起，进行自回归推理，输出对环境的理解、驾驶决策和驾驶轨迹。

VLM输出的信息会被传递给系统 1，控制车辆的运行。VLM会持续思考驾驶环境，并向系统 1 提供合理驾驶建议。系统 1 也可以主动向系统 2 求助，解决部分复杂场景。

简单来说，VLM让车辆具备了思考能力，使自动驾驶的操作方式更贴近人类老司机的处理方式。

（举报）

相关推荐

关键词：

机器人“全能导航大脑”来了！银河通用发布NavFoM大模型

银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM，实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用，通过统一“视频流+文本指令→动作轨迹”范式，融合800万条跨任务导航数据，在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施，为规模化商业落地奠定关键基础。

机器狗导航大模型 TrackVLA
万达颐华酒店多城焕新亮相，高端生活方式品牌深耕全国核心枢纽

万达颐华酒店近期在南昌青山湖畔开业，成为万达酒店及度假村旗下高端生活方式品牌的重要布局。该品牌通过“存量焕新”模式，对老旧酒店进行升级改造，已在杭州、成都、北京等地取得显著业绩：杭州东站店首月营收增长1.45倍，成都店出租率提升167%，北京前门店毛利率高达59%。品牌定位新中产，强调设计感与多元化体验，契合消费升级趋势。未来将继续深化全国战略，推进西安、重庆等地项目，为区域经济注入新活力。

万达颐华酒店存量焕新高端商务服务
小米汽车：全国已有424家门店覆盖全国125城

小米汽车10月新增22家门店，全国门店达424家覆盖125城。11月计划再开17家，将扩展至吉安等6座新城市。门店体系完善，含体验店、销售服务中心等四类。全国服务网点235个覆盖140城。产能突破瓶颈，北京工厂双班生产，2025年交付目标上调至35万辆。多家机构预测，小米汽车业务将在2025年第三季度实现单季盈利，规模预计达70亿至100亿元。

小米汽车门店扩展产能提升
辅助驾驶进入“信任时代”，华为乾崑智驾ADS 4与百万用户同行

随着中国新能源汽车产业进入智能化深水区，辅助驾驶技术正经历从功能演示到信任建立的关键转型。华为乾崑智驾ADS4系统通过创新的WEWA架构，实现感知智能到认知智能的跨越，在云端构建虚拟训练环境应对复杂场景。系统以安全为核心，展现"谨慎而高效"的驾驶风格，已在城市通勤和自动泊车场景中实现全程自动化。目前系统成功避免超242万次潜在碰撞，接入超50万个停车场。用户行为数据显示，辅助驾驶正从尝鲜使用转向主动依赖，标志着该技术进入规模化应用新阶段。
荐AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅升级；Soul语音模型SoulX-Podcast发布

本期AI日报聚焦多项技术突破：豆包推出全自动有声剧系统，实现98%角色识别准确率；Adobe Firefly Image 5支持400万像素原生输出及AI音轨生成；Soul发布90分钟无中断播客生成模型；360推出全球首款L2-L4全栈智能平台；IBM发布可在普通设备运行的Granite 4.0 Nano模型。市场方面，移动端AI用户突破7亿，豆包领跑原生应用；PayPal与OpenAI合作使ChatGPT集成支付功能；谷歌推出AI营销工具Pomelli，可基于URL自动生成营销内容。

AI有声剧豆包语音多角色语音合成
90岁老人自驾23年游遍全国老伴：车技好我很放心

近日，一位90岁高龄的内蒙古老人王瑞森因坚持自驾23年、游遍全国而引发关注。这位1935年生于呼和浩特的老人，16岁便投身抗美援朝战场，担任后勤修理班技术人员，曾因运粮时遭遇炸弹袭击导致听力受损。如今，他以另一种方式延续着对生活的热爱——自驾游。 2003年，近70岁的王瑞森购买了第一辆长城赛弗汽车，自此开启了自驾生涯。23年来，他每年至少自驾2-3次，年均

90岁老人自驾游内蒙古老人自驾抗美援朝老兵自驾
定格光影之美，索尼携多款影像产品亮相第30届全国摄影艺术展

2025年10月28日，第30届全国摄影艺术展览在厦门开幕。索尼作为参展商，以近100平方米展区亮相，展示其微单™诞生15年来的技术成果。现场设置超三元人像拍摄、长焦拍摄等互动体验区，展出多款旗舰相机与G大师镜头，包括新发布的FE 100mm F2.8微距镜头。通过实景互动与作品展示，索尼呈现了其在影像技术创新与创作支持方面的实力，邀请观众现场体验光影魅力。展览将持续至11月27日。

摄影艺术索尼微单影像技术
九号电动车成校园“新宠” 安全骑行活动走进全国百所高校

九号公司“安全出行守护进校园”系列活动走进北京、广州、成都三地7所985/211高校，通过安全骑行知识普及、头盔赠送等互动环节，邀请00后大学生共建平安校园。活动覆盖华北电力大学等多所高校，结合校园出行特点推广安全理念。九号电动车凭借智能化设计成为00后“智能消费五大件”之一，未来将持续以安全为核心，通过校园活动与产品优化，陪伴大学生每一段骑行旅程。

安全出行校园活动电动车
君乐宝博士后团队全国博创赛摘铜后生元研发攻克发酵乳保质期短板

10月28日，第三届全国博士后创新创业大赛总决赛在福建泉州落幕。君乐宝乳业集团博士后团队的“自主创新后生元国产菌株——功能机制解析及在常温酸奶产业化中的突破应用”项目获得铜奖。该项目开发具有自主知识产权的菌株，应用于发酵乳中延长保质期并提升抗氧化等功能，体现了君乐宝在乳制品核心技术研发和人才培养上的实力。大赛是我国博士后领域规模最大、层次最高的全国性赛事，旨在搭建创新成果转化平台，选拔优秀青年科技人才。君乐宝表示将持续深化产学研合作，为消费者带来更健康美味的发酵乳制品。

博士后创新创业大赛后生元研发乳制品核心技术
直通第五届无畏契约全国赛，掠夺者PL Girls的含金量还在上升！

11月2日，PL+Girls校园电竞赛年度总决赛将在上海举行。从64支女子战队中脱颖而出的4支顶尖队伍——武汉站JMM、DCG与广州站xytk+、FGS，将角逐冠军荣耀。获胜队伍不仅捧起年度奖杯，更可直接晋级《无畏契约》全国总决赛，踏上专业电竞舞台。赛事以"挑战式学习"为核心理念，通过竞技、潮流与社交融合的开放平台，助力女性玩家突破自我，展现电竞梦想的光芒。

电竞高校总决赛

今日大家都在搜的词：

热文

3 天
7天

理想正式启动端到端 VLM的早鸟计划：让自动驾驶成为老司机

理想发布端到端自动驾驶技术，让车辆学会思考

机器人“全能导航大脑”来了！银河通用发布NavFoM大模型

万达颐华酒店多城焕新亮相，高端生活方式品牌深耕全国核心枢纽

小米汽车：全国已有424家门店覆盖全国125城

辅助驾驶进入“信任时代”，华为乾崑智驾ADS 4与百万用户同行

荐AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅升级；Soul语音模型SoulX-Podcast发布

90岁老人自驾23年游遍全国老伴：车技好我很放心

定格光影之美，索尼携多款影像产品亮相第30届全国摄影艺术展

九号电动车成校园“新宠” 安全骑行活动走进全国百所高校

君乐宝博士后团队全国博创赛摘铜后生元研发攻克发酵乳保质期短板

直通第五届无畏契约全国赛，掠夺者PL Girls的含金量还在上升！

今日大家都在搜的词：

热文

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

特斯拉股东批准马斯克万亿美元薪酬包

曝折叠屏iPhone配2400万屏下摄像头预计2026年秋亮相

华为鸿蒙智行新款享界S9开启预订：预售价31.8万起

OPPO Find X9 Pro卫星通信版开启预售：6999元

何小鹏再回应机器人里藏真人质疑：现场展示内部结构

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

阿里回应饿了么更名：正处于灰度测试阶段

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

华为Mate70 Air官宣今日开启预售

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

站长商机