首页 > 业界 > 关键词  > 正文

毫末智行数据智能科学家贺翔:为什么一定要用大模型、大算力开启自动驾驶3.0时代?

2023-07-05 15:00 · 稿源: 凤凰网科技

凤凰网科技讯 7月5日消息,近日,毫末智行联合清华大学智能产业研究院(AIR)举办了今年第二场自动驾驶精品公开课,深入分享了大数据、大算力、大模型驱动下的自动驾驶发展趋势和技术原理。

现场,毫末智行数据智能科学家贺翔以《大数据、大算力、大模型驱动下的自动驾驶》为主题,从AI大模型的内核讲起,结合毫末发布的业内首个自动驾驶生成式大模型DriveGPT雪湖海若,通过毫末在自动驾驶行业里用大模型思路实践经验,全面分享了大模型技术落地自动驾驶的新范式。

回顾自动驾驶行业过去这些年的发展,贺翔将技术演进分为了3个阶段,即以硬件驱动为主的1.0时代、以软件驱动为主的2.0时代,以及正在进入的、以数据驱动为主要特征的自动驾驶3.0时代。“自动驾驶3.0时代的特点,是Transformer这样千亿级别的大模型,模型参数很大,一定是大参数、大模型、大数据。而大模型的必要条件是有大的算力。”

贺翔认为,自动驾驶当前的技术范式与十几年前的自然语言处理技术非常相近,即小数据、小模型,通过采集各种各样的交通数据、进行人工标注、再用这些数据训练出小模型,然后再把模型部署到车上,结合业务规则,去控制车。这种模式的弊端十分明显——一旦量产上车,当数十万辆车在全国各地跑起来,就会出现各种各样的路况、场景,如果还按照之前的思路去做人工标注,一方面,需要消耗大量的人力成本和时间,另一方面,则永远不可能标注完所有场景,就像运载着各种货物的挂车这类交叉组合的特殊场景需要做出不同种类的标注,而这种组合几乎是无穷的。

2023年4月,基于GPT大模型所具有的生成式、预训练、人类反馈强化学习等技术优势,毫末将视觉自监督大模型、3D重建大模型、多模态互监督大模型、动态环境大模型、人驾自监督认知大模型等五大模型进行统一升级,发布了行业首个自动驾驶生成式大模型DriveGPT雪湖海若。

据贺翔介绍,DriveGPT大模型现在分成两个阶段,一个阶段是更通用、更基础的能力,即空间计算能力。另一个阶段是做驾驶决策,即要知道怎么开车。也就是在空间计算能力之上,再去叠加认知决策的能力。“驾驶决策,这其实还是一项特殊的技能,需要我们所有人学开车时候都要去驾校学一遍,大模型就相当于做(驾驶技能教学)这个事情。驾驶的技能都需要依赖对周围空间的三维感知,这种空间感知能力也是一种通用能力,我们希望这种通用感知能力,能对接不同的决策模型,完成不同的任务。例如对接自动驾驶决策模型就可以实现自动驾驶、对接机器人决策模型就可以实现具身机器人等等。

贺翔表示,DriveGPT目前仍然以云端训练和推理的方式为主,但它已可以通过多种方式来赋能车端智驾能力。首先,可以通过多模态大模型的场景理解能力,进行高效数据筛选,为车端小模型训练提供所需要的海量极端、困难场景数据。

在现场问答环节,面对“大模型到底能给自动驾驶带来什么样飞跃”的提问,贺翔解释说:“我们希望通过大模型非常强大的泛化能力,能够大规模提升自动驾驶对于corner case的处理能力,有了这种能力之后,自动驾驶可以去任何地方,任何路况,自动驾驶的范围能处理的场景可能比现在大得多。”

而当谈到自动驾驶的“ChatGPT时刻”会在什么时候到来时,贺翔也给出了自己的看法。在他看来,ChatGPT之所以给了大家如此大的震撼,在于它天然是多面手。但是,一方面,在自动驾驶领域里面,不同于ChatGPT只处理文本信号,自动驾驶还要处理图片、点云、交通法规、地图、驾驶行为等一系列信息,自动驾驶要处理的数据模态更复杂;另一方面,自动驾驶对模型的输出精度要求更高、可解释性要求也更强。面对这种特别复杂的模态、特别高的输出要求,实现自动驾驶大模型道阻且长,但行则将至。

举报

  • 相关推荐
  • 纯视觉不靠谱!华为车BU CEO靳玉志:走向L3/L4自动驾驶 汽车一定要有激光雷达

    华为智能汽车BU CEO靳玉志近日表示,实现L3/L4自动驾驶必须配备激光雷达,主要原因有二:一是激光雷达无需识别障碍物即可检测,而纯视觉方案需大量数据训练,仍存在极端场景下的识别风险;二是视觉方案在暗光、暴雨等环境下清晰度受限。激光雷达结合毫米波雷达等传感器能提升极端场景下的可靠性。目前特斯拉FSD、百度Apollo Lite和Mobileye SuperVision是主流纯视觉方案代表。

  • 酒仙桥论坛 | 大模型 “燃料荒” 如何破?可信数据打造智能时代新底座

    · 首届酒仙桥论坛, 6 天 11 场分论坛“AI 马拉松”持续热跑中,聚焦人工智能“产业创新应用、生态发展和数智未来”,政、产、学、研多方力量共议AI黄金发展期的机遇与挑战,搭建务实对话桥梁,加速科技创新和产业创新融合。4月17日上午,酒仙桥论坛可信数据服务专场顺利召开。在这场以“可信数据服务”为焦点的分论坛上,产学研专家从行业洞察与业务实践出发,围�

  • 大模型时代智能营销,从“玩具”到“工具箱”

    百度在Create大会上强调AI应用创造真正价值,发布智能营销一体化应用"客悦·ONE"。李彦宏指出,没有应用场景的芯片和模型毫无价值。百度智能云升级后整合文心、DeepSeek等大模型能力,实现从数据洞察到智慧触达的闭环营销体系。该产品在金融等行业已落地见效,自助解决率达93%以上,支持多模态交互和全渠道管理。百度通过全栈自研AI架构降低开发成本,推动行业智能化转型。

  • 科学家发现太阳系外可能存在生命:相关物质仅能通过生物代谢产生

    近日,天文学领域传来一项引人瞩目的研究成果:一支科研团队借助詹姆斯韦布空间望远镜搭载的尖端仪器,对一颗距离地球124光年的系外行星展开深度观测。这颗编号为K2-18b的行星位于狮子座方向,其质量约为地球的8.6倍,体积相当于地球的2.6倍。研究团队通过精密光谱分析,在其大气层中捕捉到二甲基硫醚(DMS)与二甲基二硫醚(DMDS)的独特化学信号——这两种含硫化合物在�

  • Aloudata Agent公测开启:NoETL+大模型=好数据驱动真智能,让“万数皆可问”

    4月22日,Aloudata大应科技推出自研的Aloudata Agent,这是一款基于NoETL明细语义层的分析决策智能体,旨在通过自然语言实现数据查询、归因诊断、报告生成等功能。该产品解决了企业数据分析面临的五大挑战:语义鸿沟、口径一致性、场景覆盖度、性能优化和数据权限管控。Aloudata Agent采用NL2MQL2SQL技术路径,通过指标语义层实现业务语言与数据语言的精准对齐,显著提升查询准�

  • 从阿布扎比到迪拜,文远知行的自动驾驶中东拓展之路

    文远知行是全球自动驾驶领军企业,已在10国30城开展研发测试运营,拥有中美等五国自动驾驶牌照。2024年4月宣布与Uber、迪拜交管局合作,在迪拜推出Robotaxi服务。这是Uber首次在美国以外上线自动驾驶车辆,也是中东规模最大的商业化Robotaxi车队。此前文远知行已在阿联酋深耕四年,2023年7月获该国首个全域自动驾驶牌照。此次合作将整合文远的技术积累与Uber的出行平台优势,推动迪拜智能交通转型,打造全球自动驾驶示范城市。

  • 马斯克称明年特斯拉可完全自动驾驶

    特斯拉CEO马斯克宣布,公司计划年底前推出面向个人用户的全自动驾驶功能,并预计明年下半年实现数百万辆汽车完全自动驾驶。特斯拉已实现从生产线到停车场的全程自主驾驶,展示其自动驾驶技术积累。同时,特斯拉正扩展业务模式,包括为客户和工厂提供基于AI技术的自主机器人Optimus。预计年底前数千台Optimus将投入工厂工作,助力生产自动化。公司计划到2029或2030年实现Optimus年产量达100万台,开启机器人技术新纪元。

  • 周鸿祎直言:机器人研发难度远超自动驾驶

    文章主要讲述了AI技术在医疗领域的应用与影响。AI被用于诊断、治疗、研究和预测,提高了医疗系统的效率和准确性。AI能够快速分析大量数据,辅助医生做出更精准的诊断,同时在药物开发、病理分析和个性化治疗方面展现出巨大潜力。文章指出,AI技术在医疗领域的发展虽然面临隐私和伦理挑战,但也为患者带来了更个性化的服务和治疗方案。整体而言,AI在医疗领域的应用仍然受到传统医疗体系的制约,但其优势在于能够处理大量复杂信息,促进医学研究的深入发展。

  • 马斯克谈自动驾驶底层逻辑:无论路上发生什么都不碰撞

    特斯拉副总裁陶琳分享马斯克对自动驾驶底层逻辑的观点:首要指令是"不能撞车",这一原则绝对优先于其他考量。马斯克强调,无论道路标线如何错误,甚至出现UFO挡路,车辆都必须确保安全。特斯拉坚持视觉架构+端到端神经网络技术路线,正是为了在任何情况下都能避免碰撞。自动驾驶的核心追求只有一个:无论发生什么情况,特斯拉都不会发生碰撞。保障每个人的安全始终是技术路径选择中的最优先考量。

  • 文远知行推 “文远出行” App,自动驾驶出行便捷再升级

    近日,“全球Robotaxi第一股”文远知行宣布,正式将旗下移动出行 App「WeRide Go」更名为「文远出行」。此次更名不仅简化了 App 的名称,还上线了备受期待的 “预约专车接送” 功能,为用户带来更便捷、高效的自动驾驶出行体验。用户可在各大软件商店轻松搜索并下载「文远出行」App。通过这款 App,用户能够一键呼叫文远知行的 robotaxi 无人出行服务,还能实时查看文远知行�