首页 > 业界 > 关键词  > Wayve最新资讯  > 正文

Wayve推出GAIA-1 9B,通过生成合成视频训练自动驾驶

2023-10-07 10:33 · 稿源:站长之家

文章概要:

- Wayve是一家英国初创公司,于2023年6月发布GAIA-1,一款用于自动驾驶车辆训练数据的生成式人工智能模型。

- GAIA-1使用文本、图像、视频和行动数据创建各种交通情景的合成视频,填补了道路交通复杂性所产生的数据空白。

- 这一世界模型可以预测未来事件,帮助自动驾驶车辆提前规划行动,增加道路安全和效率。

站长之家(ChinaZ.com)10月7日 消息:英国初创公司Wayve在2023年6月发布了GAIA-1(Generative Artificial Intelligence for Autonomy),这是一款为自动驾驶车辆培训数据而设计的生成式模型。GAIA-1的最新版本,GAIA-19B,已经取得了令人瞩目的进展。

GAIA-1的独特之处在于它的能力,它能够使用文本、图像、视频和行动数据来生成各种交通情景的合成视频。这一能力填补了自动驾驶车辆训练中的数据缺口。

image.png

试想一下,在雾中,有一个行人从卡车后面跳出来,同时一名摩托车手即将超越你,一名自行车手从前方靠近。这是一个真实的情景,但要捕捉到这个精确的场景,你需要开多少英里的车并进行拍摄呢?GAIA-1回答了这个问题,它可以生成各种交通情景的合成视频,用于自动驾驶车辆的培训。

与传统的生成式视频模型不同,Wayve表示,GAIA-1是一种生成式“世界模型”,它学会了理解和解读驾驶的最重要概念。它能够识别和分离不同的车辆及其特征、道路、建筑物或交通信号灯等概念。GAIA-1还学会了代表环境及其未来动态,为驾驶提供了结构化的环境理解,可用于做出明智的驾驶决策。

自GAIA-1首次发布以来,Wayve团队对其进行了优化,以高效生成高分辨率视频,并通过大规模培训提高了世界模型的质量。该模型现在拥有90亿个参数(相对于六月版本的10亿个参数),还能够精确控制视频中的车辆行为和场景特征。这使其成为培训和验证自动驾驶系统的强大工具。

GAIA-1的模型基于在2019年至2023年间在英国伦敦收集的4700小时专有驾驶数据。模型的架构包括每个输入模态(视频、文本和行动)的专用编码器、世界模型、自回归变换器和视频解码器,以及将预测的图像元素转换回像素空间的视频扩散模型。

值得注意的是,GAIA-1的世界建模任务与大型语言模型(LLMs)常用的方法非常相似,其中任务被简化为预测下一个标记。在GAIA-1中,这一方法应用于视频建模,而不是语言。这表明随着模型大小和培训数据集的增加,GAIA-1在视频生成方面的性能和效率将继续提高,类似于大型语言模型在其各自领域内观察到的缩放模式。开发人员表示,随着更多的数据和处理能力,仍然存在“显著的改进空间”。

此外,GAIA-1还可以预测过去的上下文视频图像的不同未来情景,包括行人、自行车手、摩托车手和对向交通的行为,从而使模型能够考虑与其他道路使用者的互动并对情况做出反应。GAIA-1还可以通过纯文本输入进行控制,例如,通过文本命令“天气是晴朗的”、“多雨的”、“有雾的”或“多雪的”来生成不同的驾驶情景。此外,它还可以使用文本命令,如“现在是白天,我们处于直射阳光下”、“天空是灰色的”、“现在是黄昏”和“现在是夜晚”,来创建不同的照明情景。

然而,Wayve也指出了GAIA-1的一些局限性。虽然自回归生成过程非常有效,但需要大量计算,因此生成长时间的视频会非常计算密集。此外,当前模型主要集中于预测单一摄像机输出,而自动驾驶需要来自所有周围视点的全面视图,这是关键问题之一。

未来的工作将扩展该模型的能力,以捕捉更广泛的视角,并优化其生成效率,使该技术更具适用性和效率。此外,Wayve还在开发Lingo-1,这是一种自动驾驶系统,将机器视觉与基于文本的逻辑相结合,以解释道路上的决策和情况。这种基于文本的逻辑可以增加车辆的安全感,使人工智能的决策不再像一个“黑盒子”。

GAIA-1项目网址:https://wayve.ai/thinking/scaling-gaia-1/

举报

  • 相关推荐
  • 软件测试的“自动驾驶革命”:从工具自动化到思维智能化

    AI正推动软件测试领域变革,测试团队脚本维护时间减少60%,工作重心转向策略设计与异常监控。行业报告显示,AI驱动的测试效率提升显著,尤其在探索性测试中可发现人工难以预见的边缘场景缺陷。实践案例表明,金融、汽车等行业引入AI测试后,迭代周期缩短,用例自动生成率大幅提升。未来测试工程师将更专注于质量体系设计和风险分析,而非脚本编写,实现从“人工密集型”向“智能驱动型”的转变。

  • 文远知行获得迪拜DWC挑战赛第一名,城市级全场景自动驾驶解决方案突围

    2025年迪拜世界自动驾驶交通大会(DWC)于9月24-25日开幕,文远知行携手德国铁路在同期举办的自动驾驶挑战赛中击败所有对手夺冠。大会被誉为“自动驾驶奥运会”,考验企业技术、商业化及安全性等多维度能力。文远知行凭借WeRide One通用技术平台及多场景解决方案脱颖而出,获迪拜副总 理兼国防部长高度评价。公司近期获迪拜RTA颁发的Robotaxi试运营牌照,计划年内通过Uber�

  • 老外成青甘大环线“显眼包” 驾1955年劳斯莱斯敞篷车引关注

    ​近日,青甘大环线上出现了一道别样的风景线,多名游客目睹并拍摄到了一支特殊的车队——三辆古董级敞篷老爷车在海拔3000米的高原上疾驰,其中一辆1955年产的劳斯莱斯银云系列尤为引人注目。这支车队的领队是一位英国游客,他们以一种独特的方式,在寒风中坚持敞篷行驶,上演了一场跨越时空的文化对话,被网友们亲切地称为青甘大环线的“显眼包”。 据目击者描�

  • 数贸会今日开幕!每日互动展台人气火爆,GAI Station引领AI办公新体验

    2025全球数字贸易博览会于9月25日在杭州开幕。每日互动公司(展位7A-T022)集中展示了AI产业实践与数据流通领域成果,重点推出10万元级智能工作站GAI+Station,集成写作、会议纪要、智能问答等功能,内置8大模型能力,破解成本与安全痛点。其“发数站”战略打通数据高效流通链路,已在医疗、交通等多领域落地,“数智绿波”应用覆盖全国30多个省市,通行效率提升20%以上。此外,AITA超级营销助手实现升级,机器狗互动表演吸引关注。展会期间将举办10余场专业发布,涵盖数据要素、大模型应用等行业实战,助力企业把握数字化机遇。

  • 2199元起!小米平板8发布:11.2英寸3.2K最好LCD屏

    小米平板8采用全金属一体化机身设计,厚度仅5.75mm(柔光版5.8mm),重量485g(柔光版494g)。标配9200mAh大容量电池,支持45W快充、22.5W有线反充。 它还搭载第四代骁龙8s处理器,配备最新一代Wi-F7,带来更快更稳的网络体验。 全面支持苹果生态,文件、图片一键互传。 后置1300万像素摄像头,前置800万像素摄像头,支持人脸识别解锁,不支持指纹识别。 此外,小米平板8还在平�

  • 华为MatePad mini劲敌!苹果iPad mini 8要来了:A19 Pro+OLED屏

    苹果iPad mini系列称霸了多年的小平板,这两年迎来了很多新玩家的挑战,前不久发布的华为MatePad mini就是最具竞争力的一款,凭借着超轻薄、SIM卡等配置收到很多用户青睐。 现在苹果的新一代应战者iPad mini 8也要来了,新品将会在明年上半年发布,起售价维持在499美元。 根据泄露的代码显示,iPad Mini 8(代号J510/J511)预计搭载A19 Pro芯片,大概率是与iPhone Air同款的阉割版

  • 苹果将推出iPhone 17e:搭载A19 芯片 支持灵动岛

    知名记者马克·古尔曼透露,苹果计划明年上半年推出iPhone 17e、新款低端iPad及升级版iPad Air。其中iPhone 17e将搭载A19芯片,配备8GB内存,屏幕升级为灵动岛设计,告别刘海屏时代,但保持6.1英寸OLED屏与60Hz刷新率。后置摄像头为1200万前摄与4800万后摄,支持3D人脸识别与Apple Intelligence功能,起售价维持4499元,成为iPhone 17系列中性价比最高的机型。

  • 小米17 1TB版明日开售 售价5299元

    小米17系列新增16GB+1TB版本,将于10月5日全渠道开售,售价5299元。该版本提供黑、白、雪山粉、冰融蓝四色可选。小米联合创始人卢伟冰透露,该系列上市以来销量已突破100万台,增速超越往代产品。小米正全力提升生产效率,增加备货量,以满足火爆市场需求。官方数据显示,小米17全系开售仅5分钟便刷新2025年国产智能手机全价位段新机首销纪录。

  • 小米电视S Pro Mini LED 2026发布:售价5199元起

    9月25日,小米电视S Pro Mini LED 2026正式发布,提供65、75、85、98英寸四种尺寸,满足多样化需求。新品搭载9655旗舰芯片,配备4GB+64GB存储组合,运行澎湃OS 3系统。屏幕采用Mini LED技术,峰值亮度达5200nits,支持4K 165Hz原生刷新率及330Hz竞技模式,具备VRR、FreeSync Premium Pro认证。音频方面配备2.1.2声道设计,支持杜比全景声。外观采用超窄边框,接口丰富,包括HDMI 2.1×3等。雷军特别推荐85英寸版本,称其适合大多数家庭。各尺寸首销价与零售价有差异,如65英寸首销5199元,零售6499元。

  • 苹果A19单核性能登顶全球第一!超越一众PC CPU:功耗仅4W

    苹果A19芯片在PassMark单核性能测试中表现卓越,以5149分登顶榜首,超越英特尔Core Ultra 9 285K和AMD EPYC等桌面处理器。其仅依靠被动散热,功耗约4瓦,能效优势显著。尽管多线程性能受限于核心数量,但作为移动设备芯片,这一成绩已足够亮眼。

今日大家都在搜的词: