首页 > 业界 > 关键词  > CoDA最新资讯  > 正文

CoDA开源:可在3D场景中检测和命名新物体

2023-10-08 11:33 · 稿源:站长之家

站长之家(ChinaZ.com)10月8日 消息:CoDA是一个端到端的开放词汇3D目标检测框架,旨在同时实现新对象的定位和分类。它主要包括两大特点:

1.3D新对象发现策略:利用3D几何先验和2D语义先验联合发现场景中的新对象,生成新对象的伪标签。

2. 基于发现的跨模态对齐:将3D点云特征与图像/文本特征对齐,利用已有类别和不断发现的新对象类别进行对齐,使对齐迭代增强。

image.png

项目地址:https://yangcaoai.github.io/publications/CoDA.html

新对象发现可以直接影响跨模态对齐,更好的特征对齐又可以反过来提升定位能力,形成一个统一的开放词汇3D检测框架。

CoDA的创新之处在于:

1. 提出利用3D几何和2D语义联合发现新对象,实现开放词汇场景下的新对象定位。

2. 基于发现的新对象,进行跨模态特征对齐,实现新对象的分类。

3. 新对象发现和跨模态对齐协同训练,相互促进,形成一个端到端框架。

与仅利用CLIP进行开放词汇检测的方法相比,CoDA可以发现更多新对象,同时检测更多已知类别目标,实现了更好的开放世界检测能力。

综上,CoDA是一个非常创新的开放词汇3D目标检测框架,旨在解决这个领域的两个核心问题:新对象的定位和分类,具有非常高的学术价值和应用前景。

举报

  • 相关推荐
  • DAU已死,Token无用:李彦宏用DAA终结了AI的度量衡之争

    ​今年4月,AI行业出现了一组让投资人坐立难安的数据:Anthropic年化营收突破300亿美元,正式超过OpenAI的约250亿美元。 但反常的是,据第三方机构估算,Claude的月活用户仅约为ChatGPT的2.44%。以及,Anthropic的模型训练投入只有OpenAI的四分之一。 更低的投入、更少的月活,却做到了更高的收入。 按移动互联网的DAU(日活用户数)铁律:用户规模越大、网络效应越强、商业化效率越

  • 火山引擎 “Data + AI” 双轮驱动,打造面向 Agent 的企业数据新基建

    AI正从“可用”迈向“好用”,企业大数据期待被重新定义。IDC预测,到2029年全球非结构化数据占比将超80%,Agent也正从工具演变为主动消费数据的角色。近日,火山引擎与NVIDIA联合举办行业沙龙,探讨Agentic时代的数据底座、多模态数据湖等议题。Data Agent成为热点,火山引擎提出“80%准确+快速迭代”路径,推动数据应用从BI向Data Agent演进。其多模态数据湖方案通过Lance格式、Daft引擎和开源Gravitino等技术,构建AI时代新基建,强调场景牵引、数据筑基、模型升级、智能落地,持续为垂类业务提供高质量数据供给。

  • 腾讯云面向Agent升级数据平台:DataBuddy、WeData与AI原生数据底座亮相

    腾讯云宣布面向Agent升级全栈数据平台,通过DataBuddy、WeData和AI原生数据底座三层架构,构建人机协同的智能入口、统一控制面和数据底座。DataBuddy作为生产级数据智能体,可自动完成数据建模、ETL开发等复杂任务,将重复开发工作量降低80%,研发效率提升5-10倍。WeData通过统一语义层将自然语言转SQL准确率提升至90%以上。AI原生数据底座从存储、计算、系统到数据分析四层面智能化升级,支持多模态数据处理和Agent协同工作。同时,面向政务、金融等行业升级TBDS私有化平台,加速Agent规模化落地。

  • Origin Code 携手技嘉与Intel,于 COMPUTEX 2026 发布全新 4R CUDIMM 内存

    Origin Code今日宣布推出4R CUDIMM DDR5内存方案,由技嘉联合打造,针对Intel Core Ultra平台优化。该方案采用四Rank架构与CKD设计,突破传统双Rank容量限制,单条可达128GB,在1.4V电压下实现DDR5-8000MT/s、CL42低延迟,将工作站级容量带入高端桌面,满足AI训练、8K视频剪辑等高负载需求,并将在COMPUTEX 2026展示。

  • 技嘉AORUS DAY粉丝体验会招募|邀你一起沉浸式玩转硬核黑科技

    2026年6月13日,技嘉AORUS将携手Intel在广州池沼LIVEHOUSE举办AORUS DAY粉丝体验会。活动设六大互动区,包括电竞平台体验区(Intel处理器与技嘉主板联合带来零延迟游戏体验)和AI创作平台体验区(一键生成专属作品)。现场可体验《三角洲行动》等四大热门游戏,还有AIGC大咖、B站知名UP主分享心得。雕妹和广州本土偶像团体青恋时空将带来唱跳表演。通过微信小程序“AORUS俱乐部”报名(需30积分),即可解锁专属狂欢盛宴。

  • 字节跳动AI Agent平台扣子Coze上线3.0版本:支持Openclaw、Claude Code一键接入

    字節跳動旗下AI開發平台扣子(Coze)發布3.0版本,實現手機、電腦及網頁全端更新。新版基於AI團隊協作架構,支援Agent創建、接入與調度,並可將任務放入項目空間拆解分配。用戶能自定義Agent團隊,接入本地工具如Claude Code、Codex CLI等,或使用雲端Agent長期在線協作。扣子3.0還提供行業技能包、職業模板及項目空間功能,支援多Agent分工協作,深化編程與視頻項目處理能力,實現多端協同工作體驗。

  • 小米MiMo Code发布并开源:界面全汉化!自进化终端AI编程助手

    小米正式发布并开源终端AI编程助手MiMo Code V0.1.0,基于OpenCode二次开发,采用MIT协议,个人和企业可自由使用修改。内置免费多模态模型MiMo-V2.5,性能对标Claude Sonnet 4.6,兼容主流大模型和第三方Token服务。独创持久记忆系统解决长会话信息丢失,Harness系统实现全流程自动化编程,实测在SWE-Bench等测试集得分高于Claude Code 5个百分点。支持语音输入、跨平台(Mac/Linux/Windows),界面全中文汉化,安装简洁。

  • 混合云+Data+AI,华为云Stack新战略定义政企数智跃升新范式

    华为云INSPIRE大会在上海举办,以“全新混合云,Data+AI定义政企数智跃升新范式”为主题。论坛汇聚政务、金融等行业客户,探讨政企如何基于混合云融合数据与AI技术,实现核心生产力跃升。华为发布“混合云+Data+AI”战略,升级Agentic Infra、AI-Ready数据平台等三大能力,并发布白皮书。行业标杆客户分享实践,如浦发银行构建韧性云底座、京能集团推出“擎睿”大模型、宝钢用AI炼钢等。华为云Stack已服务全球超5500家政企客户。

  • 技嘉于 COMPUTEX 2026 缔造 DDR5 世界纪录 勇夺10项全球超频冠军

    技嘉科技在COMPUTEX2026上再创超频巅峰,携手CORSAIR VENGEANCE DDR5内存缔造DDR5-13556MT/s世界纪录,并在G.SKILL第12届OC World Record Stage超频大赛中勇夺10项全球第一。由知名超频达人Hicookie领军的技嘉超频团队,通过专为极限超频打造的Z890AORUS TACHYON DUO+X ICE主板成功刷新DDR5世界纪录。同时,团队受邀参加G.SKILL年度超频盛会,以全新X870AORUS INFINITY主板在多项竞赛中再创佳绩。该团队在AMD Ryzen™ 9950X3D处理器平台上,搭配G.SKILL Trident Z5 RGB内存,创下惊人内存超频成绩及10项全球第一纪录。技嘉主板凭借创新技术与卓越设计,持续成为PC玩家与超频爱好者的首选平台。

  • 销售易亮相香港Tencent Cloud Day,用AI CRM助港澳企业链接全球

    5月28日,销售易在TENCENT CLOUD DAY HONG KONG 2026上展示了AI CRM的国际化与本地化能力,作为腾讯旗下连续九年入选Gartner SFA魔力象限的中国CRM厂商,其针对港澳企业面临“向内”连接内地市场与“向外”拓展全球业务的双重挑战,推出支持多语言、多币种、多时区及跨境合规的解决方案。通过AI原生CRM NeoAgent 2.0,整合微信私域与WhatsApp,实现“左手大陆,右手国际,香港做桥”的无界生意。销售易已在全球50余国部署近1500个网络加速节点,并建立本地化团队提供全流程支持,助力港澳企业稳定增长。

今日大家都在搜的词: