首页 > 传媒 > 关键词  > CVPR2023最新资讯  > 正文

创造历史!商汤科技联合团队获CVPR论文,推出“感知决策一体化”自动驾驶通用大模型

2023-06-23 17:44 · 稿源: 站长之家用户

一篇最 佳论文,一篇最 佳论文候选,共计54篇论文被接收,商汤科技及联合实验室交出CVPR2023闪亮的成绩单。

6月18日-22日,全球计算机视觉盛会CVPR2023(Computer Vision and Pattern Recognition)在加拿大温哥华举行。本届CVPR论文投稿总量达9155篇,最终共有2369篇论文被接收。最 佳论文候选为12篇,接收率仅为0.13%。

商汤两篇论文登上最 佳论文候选名单(Award Candidate),其中自动驾驶研究论文《Planning-oriented Autonomous Driving》(以路径规划为导向的自动驾驶)斩获本届CVPR最 佳论文奖(Best Paper Award)。

这是CVPR历史上第 一篇以自动驾驶为主题的最 佳论文,该论文首 次提出感知决策一体化的自动驾驶通用大模型UniAD,开创了以全局任务为目标的自动驾驶大模型架构先河, 标志着自动驾驶技术的重要突破, 为自动驾驶技术与产业的发展提出了新的方向。

 CVPR2023最 佳论文,自动驾驶研究获重要突破

自动驾驶技术高度复杂,需要融合多学科领域的知识和技能,包括传感器技术、机器学习、路径规划等方面。自动驾驶还需要适应不同的道路规则和交通文化,与车辆和行人进行良好交互,以实现高度可靠和安全的自动驾驶系统。大部分自动驾驶相关的工作都聚焦在具体的某个模块,缺少能够实现端到端联合优化的通用网络模型。

论文提出的自动驾驶通用算法框架——Unified Autonomous Driving(UniAD)首 次将检测、跟踪、建图、轨迹预测,占据栅格预测以及规划整合到一个基于Transformer 的端到端网络框架下,更有效契合了“多任务”和“高性能”的特点,取得自动驾驶技术研究重要突破。

自动驾驶UniAD框架对比(a)模块化(b)多任务模块(c)端到端自动驾驶模块

商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚表示,UniAD是业内首 个感知决策一体化的端到端自动驾驶解决方案,并且整体系统和性能取得大幅提升,代表了未来自动驾驶技术的发展趋势。

这种端到端的优化在多项关键技术指标上超越了SOTA。比如,多目标跟踪准确率超越SOTA20%,车道线预测准确率提升30%,预测运动位移误差降低38%,规划误差降低28%。

UniAD 是一项相当创新性的自动驾驶技术,且因其具有很大的潜力和应用价值,目前在学术界和工业界都引起了广泛兴趣和关注。

随着通用人工智能(AGI)引领的二次革命的到来,以此为基础,期待在未来能推动实现更高阶的自动驾驶人工智能。

CVPR2023最 佳论文候选,加速推动AIGC时代真实感3D内容生成

面向真实3D 物体的感知、理解、重建与生成是计算机视觉领域一直倍受关注的问题。由于缺乏大规模的真实扫描三维数据库,最近在三维物体建模方面的进展大多依赖于合成数据集。

为促进现实世界中3D感知、重建和生成的发展,论文《OmniObject3D: Large-Vocabulary3D Object Dataset for Realistic Perception, Reconstruction and Generation》提出了OmniObject3D,一个具有大规模高质量真实扫描3D物体的大型词汇3D物体数据集,覆盖近200个类别、约6000个三维物体数据,包括高精表面网格、点云、多视角渲染图像和实景采集的视频,借助专业扫描设备保证了物体数据的精细形状和真实纹理。

OmniObject3D是目前学界最 大的真实世界三维扫描模型数据集,为未来三维视觉研究提供了广阔空间。

利用该数据集,研究人员精心探讨了点云识别、神经渲染、表面重建、三维生成等多种学术任务的鲁棒性和泛化性,验证其从感知、重建、到生成领域的开放应用前景,有望在AIGC 时代推动真实感3D生成方面发挥至关重要的作用。持续引领前沿创新,是商汤在以大装置SenseCore和大模型为核心的AI基础设施领域长期投入,并坚持产学研协同创新的成果。

王晓刚教授认为,在大算力、大数据的支撑下,大模型将以更强大的通用能力引发人工智能领域的巨大变革,同时也会拓展我们的研究视野,激发新一轮研究范式革新。

自今年4月初“商汤日日新SenseNova”大模型体系公布以来,商汤的大模型已在气象预报、遥感解译、开放环境中的决策问题等领域取得了诸多突破性成就。未来,商汤将继续与产学研各界共同拥抱和探索大模型带来的范式革新,为AI的前沿探索开拓新方向和新路径。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • 生数科技发布自研多模态通用大模型 同时推出PixWeaver、VoxCraft等工具

    9月20日,生数科技发布了自主研发的多模态通用大模型,并同时推出了两款应用产品:视觉创意设计平台PixWeaver和3D资产创建工具VoxCraft。生数科技的多模态通用大模型采用底层融合的思路,将Transformer架构引入扩散模型,实现文本、图像、3D、视频等多模态知识的融合。生数科技的大模型还面向游戏制作、影视制作、广告营销等多个行业提供服务能力,支持各类创意内容的生成。

  • 什么值得买:正在基于通用大模型开发“值得买消费内容大模型

    值得买表示,大数据和大模型是公司非常关注的领域,公司已经在该领域加大了投入。在大数据层面,目前随着公司逐步沉淀来自于消费内容业务板块和营销服务业务板块等的更多数据资源,已形成一个能够涵盖人、货、场等多种维度的底层数据体系。在大模型领域,公司正在基于通用大模型,开发“值得买消费内容大模型”,同时也正在探索各种基于“值得买消费内容大模�

  • 商汤科技开源书生·浦语大模型InternLM-20B

    商汤科技与上海人工智能实验室联合推出了书生・浦语大模型的200亿参数版本InternLM-20B,并在阿里云魔搭社区上进行了开源发布。InternLM-20B模型性能超过了开源模型标杆Llama2-70B,具备更强的综合能力和应用便捷性。全链条工具链包括数据、预训练、微调、部署和评测等环节。

  • 华为放大招!盘古汽车大模型发布:自动驾驶学习周期缩短2天内

    快科技9月21日消息,今日,华为云在华为全联接大会2023上正式发布盘古汽车大模型,覆盖汽车设计、生产、营销、研发等业务场景。华为常务董事、华为云CEO张平安表示,我们希望,盘古汽车大模型能够让车企的每一位员工都拥有自己的专家助手,让工作更高效,更轻松。据介绍,盘古汽车大模型可在数字孪生空间生成复杂场景样本,让自动驾驶学习训练周期从2周以上缩短到

  • 元象开源70亿参数通用大模型 XVERSE-7B 免费可商用

    元象宣布开源70亿参数通用大模型XVERSE-7B底座与对话版,这是一款全开源、免费可商用的模型。相比之前的XVERSE-13B,7B版本更小巧,可以在单张消费级显卡上运行,并且推理量化后最低只需6GB显存,大大降低了开发门槛和推理成本。●XVERSE-7B-Chat是底座模型经SFT指令精调后的中英文对话模型,大幅提升了理解和生成内容的准确度,也更符合人类的认知偏好。

  • 《业财一体化下医药企业规问题解析与未来展望》对话(上)

    一场力度空前的反腐风暴正在医药领域进行,在整个合规大体系下,医药企业急需整体解决方案与落地手段,决策易与汇联易也正是基于这样的背景与思路之下形成了高度融合,以合规为核心、业财一体化的整体解决方案。9月12日晚,决策易联合创始人赵祝维与汇联易联合创始人苏鹏德两位行业专家,在小瑞学苑生命科学行业合规专场从业财一体化角度深入探讨如何确定合规转型路径与实施方案。这里提醒下,合规成本很高,通常还伴随着管理盲点,以及随之来的信任问题,这点其实销售口的管理者都很清楚,销售管理者一定要多考虑。

  • 国内首个!腾讯云联合信通院正式发布「金融行业大模型标准」

    9月18日,2023可信AI大会暨南京人工智能产业发展大会成功召开。腾讯云作为推动行业大模型发展的核心单位,联合信通院正式发布国内首个金融行业大模型标准,为金融行业智能化的高质量发展提供了重要支撑,为全面促进大模型安全合规和可信发展提供了重要保障。腾讯云将继续积极推动行业大模型标准制定,加速金融行业应用落地,为金融行业的数字化转型提供有力支持。

  • 真AR眼镜雷鸟X2来了:无线轻薄一体化 与日常眼镜无异

    AR新锐品牌雷鸟创新宣布,将于10月13日举行首场新品发布会,正式发布消费级真AR眼镜雷鸟X2。雷鸟X2采用MicroLED衍射光波导方案和无线一体化设计,在全彩显示、光波导亮度、全自研光引擎、感知交互等关键技术上均实现了突破,被誉为消费级真AR眼镜里程碑产品”。10月13日,一切即将揭晓。

  • 特斯拉一体化压铸技术取得新突破:新车开发时间最短仅一年半

    据报道,特斯拉在一体化压铸上取得技术突破。通过这项技术,特斯拉可将电动汽车几乎所有复杂车身底部零件压铸成一个整体非仅压铸约400个零部件。此前有特斯拉车主吐槽称,自己的ModelY倒车时不慎撞墙,看上去车损并不严重,但后车部位撞坏了,整体维修费用超11万元,保险公司最终为车主走了全损理赔。

  • Wayve推出GAIA-1 9B,通过生成成视频训练自动驾驶

    英国初创公司Wayve在2023年6月发布了GAIA-1,这是一款为自动驾驶车辆培训数据设计的生成式模型。GAIA-1的最新版本,GAIA-19B,已经取得了令人瞩目的进展。这种基于文本的逻辑可以增加车辆的安全感,使人工智能的决策不再像一个“黑盒子”。

今日大家都在搜的词:

热文

  • 3 天
  • 7天