首页 > 业界 > 关键词  > CoDA最新资讯  > 正文

CoDA开源:可在3D场景中检测和命名新物体

2023-10-08 11:33 · 稿源:站长之家

站长之家(ChinaZ.com)10月8日 消息:CoDA是一个端到端的开放词汇3D目标检测框架,旨在同时实现新对象的定位和分类。它主要包括两大特点:

1.3D新对象发现策略:利用3D几何先验和2D语义先验联合发现场景中的新对象,生成新对象的伪标签。

2. 基于发现的跨模态对齐:将3D点云特征与图像/文本特征对齐,利用已有类别和不断发现的新对象类别进行对齐,使对齐迭代增强。

image.png

项目地址:https://yangcaoai.github.io/publications/CoDA.html

新对象发现可以直接影响跨模态对齐,更好的特征对齐又可以反过来提升定位能力,形成一个统一的开放词汇3D检测框架。

CoDA的创新之处在于:

1. 提出利用3D几何和2D语义联合发现新对象,实现开放词汇场景下的新对象定位。

2. 基于发现的新对象,进行跨模态特征对齐,实现新对象的分类。

3. 新对象发现和跨模态对齐协同训练,相互促进,形成一个端到端框架。

与仅利用CLIP进行开放词汇检测的方法相比,CoDA可以发现更多新对象,同时检测更多已知类别目标,实现了更好的开放世界检测能力。

综上,CoDA是一个非常创新的开放词汇3D目标检测框架,旨在解决这个领域的两个核心问题:新对象的定位和分类,具有非常高的学术价值和应用前景。

举报

  • 相关推荐
  • 三星3D音频技术“Eclipsa Audio”将融入2025年新品电视和条形音响

    摘要:三星2025年电视将搭载EclipsaAudio技术,覆盖CrystalUHD系列至NeoQLED8K系列电视前沿的3D音频新技术,将引领家庭娱乐迈向全新境界1月3日,韩国三星电子宣布,2025年新品电视和条形音响产品将搭载与谷歌合作开发的创新3D音频技术——EclipsaAudio[1]。这项技术将助力内容创作者打造生动、沉浸式的音频内容,并在三星电视上实现流畅播放,为消费者带来前所未有的视听盛宴。我们期待看到创作者们利用这项技术打造出新颖且富有创意的音频体验。

  • 3D扫描第 一股:思看科技成功登陆上交所科创板!

    2025年1月15日上午,思看科技股份有限公司正式登陆上海证券交易所科创板,标志着中国A股市场“3D扫描第一股”的成功发行上市。

  • 三星携手Nexon,沉浸《第一狂战士:卡赞》无与伦比的3D游戏体验

    三星电子与游戏开发商NexonKorea和Neople达成合作,将在即将推出的游戏《第一狂战士:卡赞》中带来无与伦比的3D体验。在游戏的研发过程中,3D元素历经特别定制与创新设计,利用三星的尖端技术与玄龙骑士3D电竞显示器的卓越性能,共同构筑了一个沉浸式3D游戏世界。三星玄龙骑士3D电竞显示器此前于CES2024上亮相,并荣获享有盛誉的“最佳创新奖”,其将于今年4月在全球推出,将以突破性的3D技术全面提升游戏体验。

  • 前谷歌员工创办的3D设计应用Rooms获得 100 万美元投资

    3D设计应用Rooms近期获得了100万美元的资金注入,进一步推动其平台发展。该款应用由前谷歌员工开发,2023年进入测试阶段,允许用户利用10,000多个项目的库来创建互动性强的3D房间和迷你游戏,支持Lua编程语言进行个性化编辑。Rooms已在网页和iOS平台上线,尚未引入盈利功能,未来如何商业化仍待进一步探索。

  • 16首周杰伦的歌命名16个蜘蛛种:论文第一作者是80后

    近期,《ZoologicalResearch:DiversityandConservation》杂志发表了一篇西双版纳植物园蜘蛛分类研究论文,其中包含园蛛科6个新属16个新种。16个新种的名字全部来自周杰伦的歌曲,分别是:安静艾蛛、倒带艾蛛、龙拳艾蛛、星晴艾蛛、花海桂齐蛛、漂移新园蛛、屋顶新园蛛、晴天彭园蛛、外婆锥头蛛、借口宋园蛛、退后宋园蛛、搁浅唐园蛛、夜曲王园蛛、暗号尹园蛛、彩虹尹园蛛、稻香朱园蛛。周杰伦”作为一个与众不同的符号,也承载了许多人不可磨灭的记忆。

  • “机圈德芙”ColorOS 15加持的OPPO Find X8,打造全场景最流畅动效!

    手机硬件的高度同质化,让智能手机厂商较量的舞台开始逐渐转向软件系统领域。至于手机系统,其UI设计仅能反映手机系统的美观程度流畅度则代表着系统好用、易用程度。坚信ColorOS在今后的持续OTA中,将带来更多利好升级,为用户打造究极流畅的系统体验。

  • 号称全球首款主动式AI眼镜!Halliday宣布在CES推全智能眼镜

    AI眼镜品牌Halliday宣布,将在CES2025展会上推出一款创新的智能眼镜,宣称是全球首款主动式人工智能眼镜。传统智能眼镜的一个常见问题是其外观较为显眼,使用镜片或突出的元件,容易让旁观者察觉到佩戴者正在进行游戏等活动,从缺乏隐私性。Halliday预计将在2025年第一季末开始出货这款智能眼镜,售价从399美元到499美元。

  • 小米申请注册Open Source商标!自研Vela系统已开源

    近日,小米科技有限责任公司申请注册多枚XiaomiOpenSource”商标,国际分类包含广告销售、网站服务、科学仪器等,当前商标状态均为等待实质审查。小米已经宣布自研Vela系统全面开源,OpenVela项目已上线GitHub和Gitee。OpenVela系统专为AIoT领域量身定制,以轻量化、标准兼容、安全性和高度可扩展性为核心特点,支持各种不同的架构和硬件平台。

  • 罗马仕亮相CES展,全场景充电生态成为焦点

    1月10日,2025年国际消费电子展在美国拉斯维加斯圆满落幕,本届CES以“AI引领未来,创新点亮生活”为主题,汇聚了来自世界各地的头部科技玩家,用最前沿的创新技术和卓越产品生动诠释科技赋能生活的无限可能。中国充电品牌罗马仕携其最新的充电技术及产品,在全球科技舞台上留下了深刻的印记。罗马仕将继续秉承创新精神,不断推出更多具有创新性的产品,同时加强�

  • 恒峰国际斥资收购经纬天地股权,重磅发布FO.COM引领Web 3.0浪潮!

    2025年1月9日下午2点,由恒峰国际打造的新一代Web3.0综合生态平台FO.COM在香港中环举行了盛大的品牌发布会。此次活动吸引了来自全球科技、金融和投资等领域的精英,共同见证这一里程碑时刻。从这一系列大动作中,我们不难看出恒峰国际及钱峰雷对这份事业的雄心壮志。