首页 > 业界 > 关键词  > Doppelgangers最新资讯  > 正文

Doppelgangers:通过学习算法区分相似结构的图像

2023-09-08 10:47 · 稿源:站长之家

站长之家(ChinaZ.com)9月8日 消息:Doppelgangers是一个基于学习的方法来区分视觉上非常相似但是物理上是不同3D表面的图像对(我们称之为“庞氏图像”)。研究人员构建了一个包含大量正负样本的图像数据集Doppelgangers,其中正样本是同一实际3D表面拍摄的图片,负样本是不同但视觉上相似的3D表面。

image.png

论文地址:https://doppelgangers-3d.github.io/

研究人员设计了一个网络架构,利用局部特征点和匹配的空间分布作为输入,以便综合考虑局部和全局线索进行判断。实验结果表明,这种方法可以准确区分难以识别的负样本,并可集成到SfM流程中校正3D重建。

image.png

这种工具足够智能,可以避免人们可能会犯的错误。它的工作原理是根据3D 模型的特点,通过分析图片之间的微小差异,进而判断它们是否来自同一物体。

这一技术在许多领域都有潜在的应用价值,比如在艺术鉴赏、犯罪侦查、甚至是在日常生活中查找丢失的物品等。通过这种技术,我们可以更准确地分辨相似的图片,避免因误解而产生的问题。

本研究的主要创新和贡献包括:

1. 提出视觉消歧问题的定义,将其建模为图像对的二分类任务

2. 构建首个图像视觉消歧评估数据集Doppelgangers

3. 设计了一种网络架构,输入是对齐后的图像和关键点匹配mask, OUTPUT 是一对图像是否匹配的概率

4. 方法可以集成到SfM流程中,过滤错误匹配提高3D重建质量

本工作为处理视觉相似但实际不同的3D表面的图像提供了学习型解决方案,可广泛应用于3D重建、图像匹配等任务中。

举报

  • 相关推荐
  • 性能超OpenAI、Gemini!月之暗面发布首个自主强化学习Agent

    月之暗面(Moonshot AI)正式推出其首款Agent产品Kimi-Researcher(深度研究),并已启动小范围灰度测试。 该产品基于端到端自主强化学习(end-to-end agentic RL)技术打造,在HLE测试中表现优异,性能超越Claude 4 Opus、Gemini 2.5 Pro及OpenAI Deep Research,并与Gemini-Pro的Deep Research Agent持平。 Kimi-Researcher 是一款高度自主的智能研究助手,能够独立规划任务流程并交付完整结果。与其他Agent不�

  • 如何用 DeepSeek 为产品创作slogan

    本文介绍如何利用DeepSeek工具高效创作优质产品slogan。首先在DeepSeek官网注册登录,输入详细指令如"为小米SU7创作5条突出性能/情感/社会价值的slogan";获取初稿后,通过补充指令反复优化调整,直至获得满意的5条高质量slogan。该方法能精准传达产品核心价值,吸引消费者目光,让原本费脑的slogan创作变得轻松高效。

  • PCB层叠结构设计的先决条件

    本文深入探讨了PCB多层板叠层结构设计的关键要点。首先介绍了PCB的核心组成部分Core(双面覆铜的刚性基材)和Prepreg(半固化片),分析了两者在机械强度、电气性能方面的差异。其次详细阐述了叠层设计的五大先决条件:1)确定总层数需考虑信号数量、电源种类和EMC要求;2)板厚选择与走线宽度、总层数相关;3)阻抗匹配要求(单端50Ω/差分100Ω);4)材料选择需关注介电常数Er和损耗角正切值;5)EMC性能优化。最后提出了完整的叠层设计流程,包括信号层评估、电源地层配置、Core/PP厚度搭配等步骤,强调合理的叠层设计能提升PCB性能稳定性,同时降低生产成本。

  • 如何用 DeepSeek 生成特定结构会议纪要

    本文介绍如何利用DeepSeek AI高效整理会议纪要。主要步骤包括:1)会议录音转文字(推荐使用"录咖"工具);2)登录DeepSeek官网输入指令,要求将会议记录按"决策事项/待办事项/风险预警"三部分结构化整理;3)检查优化生成的会议纪要。该方法能快速将杂乱会议内容转化为清晰文档,突出关键信息,提升工作效率。文中提供了具体操作流程和工具链接。

  • 数字资产时代的智能预测:微云全息比特币价格走势机器学习算法

    微云全息(NASDAQ: HOLO)开发了一种基于机器学习的高精度比特币价格预测算法,整合了逻辑回归、支持向量机、人工神经网络、朴素贝叶斯和随机森林等多种方法。该算法在连续和离散数据集上均表现优异,为投资者和金融机构提供可靠的决策支持。随着比特币市场规模的扩大,准确预测价格波动成为重要需求。该技术通过模型融合、特征集成和参数优化等方法,提高了预测的准确性和稳定性,为数字资产市场的健康发展提供了创新解决方案。

  • 米家空调Pro系列推送OTA:压缩机升级全工况6Hz变频算法

    小米官方发文宣布,米家空调Pro系列OTA今日起陆续推送,升级了全新的压缩机控制算法,覆盖新风和上出风系列产品。 这次OTA主要就是全面优化了双缸压缩机控制算法,升级为全工况6Hz变频算法”。

  • 全球圈粉6000万,被国内粉丝催着上线,PixVerse「国内版」一手实测来了!

    恭喜国内视频创作者!从此,大家又多了一个好用的 AI 视频生成工具。 「你们的产品到底什么时候在国内上线?」 最近,爱诗科技也体验了一把小说作者的待遇 —— 打开后台,发现私信全是「催上线」的信息。

  • 微算法科技(NASDAQ:MLGO)利用Pool验证池机制,结合传统分布式一致性技术(如Paxos和Raft),实现秒级共识验证

    本文探讨了区块链和分布式系统中验证池机制的应用。传统共识机制在实时性要求高的场景存在局限,验证池机制通过集中验证节点提高效率,结合Paxos和Raft等分布式一致性技术,实现秒级共识验证。该技术具有高效性、可靠性和扩展性优势,可应用于金融交易、物联网数据交换和供应链管理等领域,确保数据一致性和系统稳定性。未来有望通过优化算法和结合AI技术进一步提升性能,拓展更多应用场景。

  • 极光旗下EngageLab及GPTBots双品牌通过SOC 2 Type II认证

    极光旗下EngageLab和GPTBots双品牌通过SOC 2 Type II认证,彰显数据安全与国际合规能力。该认证由美国注册会计师协会制定,覆盖安全性、可用性等五大维度,验证了平台在连续数月的稳定运营表现。作为中国领先的客户互动与营销科技服务商,极光通过旗下客户互动平台EngageLab和企业级AI智能体GPTBots,为全球客户提供行业领先的数据安全保障。此次认证巩固了极光在智能客户互动与AI服务领域的行业地位,其客户覆盖科技、金融等多个领域,遍布全球多个国家和地区。

  • 开启家庭教育新模式?知乎“答主评审团”测评科大讯飞学习机T30 Pro

    知乎"答主评审团"对科大讯飞T30Pro学习机进行深度实测,10位涵盖教育从业者、产品经理、双语家庭等多领域答主参与评测。评测发现该产品通过AI精准学功能实现知识薄弱点诊断,提供跨年级知识图谱,支持启发式互动教学。在语文启蒙阶段融入国学地理等文化元素,数学学科具备"错因溯源"能力,英语学习则通过自然拼读和口语互动激发兴趣。产品采用"诊-学-练"闭环设计,家长可通过APP协同监督学习进度。评测指出该设备适合有明确学习规划的家庭,能有效减轻家长陪读负担,实现从"苦力型陪读"到"策略型管理"的转变。