中科院提出全新多视图世界模型和自动驾驶世界模型Drive-WM

2023-12-04 09:09 · 稿源：站长之家

要点:
由中科院自动化所研究团队提出的 Drive-WM 模型结合多视图世界模型，利用 Diffusion 模型生成逼真视频场景，为自动驾驶系统提供多视图预测和规划，极大提高安全性。
Drive-WM 模型首次将世界模型与端到端规划相结合，利用世界模型在每个时间步上预测未来情景，通过图像奖励函数全面评估，实现更安全、有效的规划。
Drive-WM 的生成能力提供新思路，特别是在面对 Out-of-Distribution（OOD）场景时，通过生成视频进行微调，使规划器在复杂场景中表现更佳，揭示了未来场景评估对规划的提升作用。

站长之家（ChinaZ.com）12月4日消息:随着自动驾驶技术的迅猛发展，中科院自动化所的团队提出的 Drive-WM 模型成为自动驾驶领域的关键创新。这一模型通过多视图世界模型，利用生成式世界模型的强大生成能力，实现了多视图预测和规划，为自动驾驶系统的安全性提供了新的保障。在 CVPR2023自动驾驶研讨会上，Drive-WM 模型引起了广泛关注。

该模型不仅突破了世界模型与端到端规划的整合，还在面对 OOD 场景时表现出鲁棒性。通过对比实验，作者揭示了目前端到端规划器在面对 OOD 情况时的不足之处，而 Drive-WM 模型则通过生成视频进行学习，提高规划器在复杂场景中的性能。

论文地址:https://arxiv.org/pdf/2311.17918.pdf

此外，Drive-WM 还展示了其多视图视频生成的出色能力，通过引入时序层的编码和视图分解建模，实现了时空一致性。论文详细描述了模型的设计和控制选项，包括使用文本、场景布局、运动信息来控制多视图视频的生成，展示了其高质量和可控性。

Drive-WM 对于自动驾驶系统有着潜在影响，世界模型与端到端规划的结合将提高自动驾驶的安全、稳定和可靠性。这一技术突破有望推动自动驾驶领域迈向新的里程碑。

（举报）

中科院提出全新多视图世界模型和自动驾驶世界模型Drive-WM

雷军最新演讲：小米YU7智能化配置非常高辅助驾驶第一期投入达57.9亿元

首次实现智能驾驶开放式交互！蔚来即将推出世界模型2.0版本

男子酒后无证驾驶追分手女友酿事故当事人：人追回来了但不值得

福特自动驾驶汽车公布：自动驾驶+控制车距+自动泊车

佩奇：为何Google要做自动驾驶汽车?

滴滴自动驾驶获上海自动驾驶全路段牌照

滴滴回应在北京成立自动驾驶公司：将开展自动驾驶测试

自动驾驶出租车再破局！曹操出行上线自动驾驶

自动驾驶商用牌照哪些公司获得全球首张自动驾驶商用牌照？

想让自动驾驶更安全，这个问题很重要

今日大家都在搜的词：

热文

一加15今晚发布定位全能水桶机

AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度

红米REDMI K90全方位提升雷军：是不是越来越有旗舰气质

余承东曝鸿蒙智行新款享界S9将于11月上市

iPhone18发布或推迟苹果明年9月只发Pro系列和Fold折叠屏

华为MatePad Pro流金典藏版开卖：售价7799元

华为余承东：鸿蒙智行全系交付突破100万台仅用43个月

AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI

华为MatePad Mini典藏版今日开售：售价5999元起

一加Ace 6开启预售：售价2599元起

华为nova Flip S小折叠开售：首发3388元起

雷军回应K90定价：最近内存涨价太多希望大家理解这份诚意

REDMI K90标准版12+512GB降价300元小米回应：可退差价

苹果首款2nm手机芯片上热搜 A20由iPhone 18系列首发

一加15今晚发布定位全能水桶机

AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度

红米REDMI K90全方位提升雷军：是不是越来越有旗舰气质

余承东曝鸿蒙智行新款享界S9将于11月上市

小米汽车发布跨年购置税补贴方案至高不超15000元

iPhone18发布或推迟苹果明年9月只发Pro系列和Fold折叠屏

站长商机