首页 > 业界 > 关键词  > Doppelgangers最新资讯  > 正文

Doppelgangers:通过学习算法区分相似结构的图像

2023-09-08 10:47 · 稿源:站长之家

站长之家(ChinaZ.com)9月8日 消息:Doppelgangers是一个基于学习的方法来区分视觉上非常相似但是物理上是不同3D表面的图像对(我们称之为“庞氏图像”)。研究人员构建了一个包含大量正负样本的图像数据集Doppelgangers,其中正样本是同一实际3D表面拍摄的图片,负样本是不同但视觉上相似的3D表面。

image.png

论文地址:https://doppelgangers-3d.github.io/

研究人员设计了一个网络架构,利用局部特征点和匹配的空间分布作为输入,以便综合考虑局部和全局线索进行判断。实验结果表明,这种方法可以准确区分难以识别的负样本,并可集成到SfM流程中校正3D重建。

image.png

这种工具足够智能,可以避免人们可能会犯的错误。它的工作原理是根据3D 模型的特点,通过分析图片之间的微小差异,进而判断它们是否来自同一物体。

这一技术在许多领域都有潜在的应用价值,比如在艺术鉴赏、犯罪侦查、甚至是在日常生活中查找丢失的物品等。通过这种技术,我们可以更准确地分辨相似的图片,避免因误解而产生的问题。

本研究的主要创新和贡献包括:

1. 提出视觉消歧问题的定义,将其建模为图像对的二分类任务

2. 构建首个图像视觉消歧评估数据集Doppelgangers

3. 设计了一种网络架构,输入是对齐后的图像和关键点匹配mask, OUTPUT 是一对图像是否匹配的概率

4. 方法可以集成到SfM流程中,过滤错误匹配提高3D重建质量

本工作为处理视觉相似但实际不同的3D表面的图像提供了学习型解决方案,可广泛应用于3D重建、图像匹配等任务中。

举报

  • 相关推荐
  • 如何让你的内容被 ChatGPT 优先引用?——GEO 优化实战指南

    传统SEO追求"谷歌首页排名",生成式AI时代则需追求"被AI引用"。AI模型不提供明确排名算法,更像黑箱,使内容创作者困惑。GEO优化的核心是让内容具备"可引用性":权威清晰、结构化信息、语义覆盖多维度、模型检索映射。需通过AIBase等GEO排名查询工具验证"AI曝光率",分析引用语境、竞争差距,调整内容结构以提升AI引用倾向。SEO优化机器如何找到你,GEO则优化AI如何引用你。

  • 守护用户数据安全,OPPO 携火山引擎发布《移动 Agent 安全技术白皮书》

    在OPPO开发者大会上,OPPO联合火山引擎等机构发布《移动Agent安全技术白皮书》,宣布打造隐私计算云系统,通过端云协同架构构建用户数据全生命周期的“安全长城”。该系统结合火山引擎AI机密计算方案,实现端到端加密,确保数据“可用不可见”,任何人与系统均无法获取用户数据。双方将持续深化合作,致力于AI时代的数据安全治理,让用户享受AI便利的同时更安全放心。

  • 为什么“GEO”比“SEO”更关键?——解码生成式引擎优化(GEO)的重要性

    随着生成式AI工具普及,传统SEO已不足以应对"零点击搜索"趋势。生成式引擎优化(GEO)应运而生,其核心是让内容被AI模型引用而非仅追求搜索排名。GEO通过优化内容结构(问答式标题、结构化数据)、增强语义权威性、添加技术标记(Schema)等策略,使内容更易被AI抓取引用。数据显示GEO可将内容可见性提升40%,建议企业将GEO思维融入长期内容战略,使用AIBase等工具监控

  • 会玩App携手顶流IP奶龙,打造萌趣社交新体验

    会玩App与国民IP奶龙展开为期三周深度合作,推出横跨国庆中秋的特别活动。通过上线“奶龙岛”虚拟场景、限定饰品及分阶段玩法,结合“治愈相伴”理念与年轻群体精准触达,吸引大量用户参与。此次合作验证了“IP+社交”模式潜力,平台正将热点活动沉淀为可持续品牌认知,逐步形成差异化优势。

  • AI日报:视觉中国与多家大模型公司达成合作;OpenAI紧急暂停Sora生成已故名人;谷歌推出Gemini地图数据集成工具

    视觉中国与多家AI公司合作开发可商用视觉大模型,已获阿里、微软等订单。OpenAI因不当内容暂停Sora生成马丁·路德·金形象视频,引发AI伦理讨论。DeepSeek在加密货币交易实验中表现领先。WhatsApp将禁止第三方通用AI聊天机器人,仅保留Meta AI。宇树科技推出仿人机器人Unitree H2,具备拟人化设计。谷歌为Gemini集成地图数据工具,可访问25亿地点实时信息。Opera推出集成三款AI助手的Neon浏览器,但用户体验存在困惑。Facebook在美加推出AI照片编辑建议功能,可分析手机未分享照片。

  • AI日报:谷歌Gemini 3.0 Pro小范围推送;爱诗科技完成1亿元B+轮融资;百度发布文档解析模型 PaddleOCR-VL

    谷歌Gemini 3.0 Pro开始小范围推送,强化推理与多模态能力;百度发布全球领先文档解析模型PaddleOCR-VL,重塑OCR技术格局;爱诗科技完成亿元B+轮融资,ARR突破4000万美元;Anthropic推出Claude“skills”功能,提升AI工作效率;Pinterest推出AI内容限制工具,用户可自定义减少生成式图像;开源多模态模型LLaVA-OneVision-1.5超越Qwen2.5-VL;OpenAI视频生成模型Sora 2上线微软Azure平台,进入公共预览阶段;旅行搜索引擎Kayak推出“AI模式”,简化旅行规划与预订流程。

  • 更新功能、内测新App,抖音快手再战社交

    ​抖音和快手又一次向社交领域发起进攻。 近日,抖音、快手在站内密集更新了“日常”“说说”等一系列社交新功能;此外,抖音还被曝正在内测全新的社交App。 当流量增长触及天花板,内容的稀缺性逐渐变弱,社交似乎成为了短视频巨头的“新叙事”。 它们为何始终对“社交”念念不忘?这究竟是构筑护城河的必然选择,还是一场注定艰难的豪赌?

  • 全球首次!万元相机置换OPPO Find X9 Pro:OPPO最高补贴1400元

    OPPO为Find X9 Pro推出全球专属相机置换补贴,最高补贴1400元,活动10月22日截止。该机搭载哈苏真2亿长焦镜头,采用AOA光学校准技术提升解析力,F2.1超大光圈进光量提升140%,配合70mm黄金焦段与超晶态蓝玻璃,实现行业首个哈苏真两亿直出画质。超动态大底主摄升级第四代曝光技术,支持瞬时三曝,融合高动态与抓拍。全新LUMO超像素引擎支持2亿像素多帧合成,实现可裁切的高画质体验,成像素质媲美中画幅相机。

  • 品牌如何在 AI 搜索时代被“看见”?用 GEO 思维重建内容战略

    在AI搜索时代,品牌曝光不再依赖网页权重,而是取决于AI是否在回答中提及。品牌需布局GEO(生成式引擎优化),因为AI回答唯一且倾向引用权威信息源。GEO作为新型声誉管理工具,通过分析品牌在AI引擎中的引用频率、语义一致性及回答趋势,帮助品牌掌握AI世界的话语权。使用AIBase GEO排名查询工具可追踪优化效果,确保品牌在AI回答中持续保持权威地位。

  • 苹果华为OPPO将推出eSIM手机 OPPO Find X9系列已确认将支持

    中国联通、移动、电信三大运营商正式获批开展eSIM手机业务,OPPO Find X9系列将成为首款支持该功能的国产手机,华为Mate80系列也将跟进。国产eSIM手机初期将采用“eSIM+实体卡”双卡设计,保留实体卡槽以满足过渡期需求。行业预计完全取消物理SIM卡槽的手机最早明年出现。eSIM技术将推动手机向更轻薄、防水防尘方向发展,同时为用户提供更灵活的运营商切换体验。随着运营商全面支持,2025年有望成为国内eSIM手机爆发元年。

今日大家都在搜的词: