首页 > 业界 > 关键词  > DUSt3R最新资讯  > 正文

GitHub又火了一款AI工具 DUSt3R :2张图2秒钟3D 重建

2024-03-04 13:50 · 稿源:站长之家

划重点:

⭐️ 一款名为 DUSt3R 的新工具火爆 GitHub,能在2秒钟内通过2张图片完成3D 重建。

⭐️ DUSt3R 在单目 / 多视图深度估计以及相对位姿估计任务上表现出色。

⭐️ 作者团队采用全新方法,无需相机校准或视点姿势先验信息,能在任意图像中完成3D 重建。

站长之家(ChinaZ.com)3月4日 消息:一款名为 DUSt3R 的 AI 工具近日在 GitHub 上备受瞩目,其能够在短短2秒钟内通过仅有2张图片完成3D 重建,让许多网友大呼惊奇,甚至认为这比之前热门的 Sora 更加实用。这一工具在单目 / 多视图深度估计以及相对位姿估计任务上表现出色,被认为是目前最先进的技术之一。

image.png

作者团队采用了一种全新的方法,称为 DUSt3R,它不需要任何相机校准或视点姿势的先验信息,就能完成任意图像的密集或无约束3D 重建。这意味着用户只需提供图片,无需额外的测量数据,便能轻松获得完整的3D 重建效果。DUSt3R 的网络架构基于标准 Transformer 编码器和解码器,受到 CroCo 的启发,并通过简单的回归损失训练完成。

在实验中,DUSt3R 在多项任务上取得了 SOTA 的成绩,包括绝对姿态估计、多视图姿态回归、单目深度估计和多视图深度估计。不仅如此,DUSt3R 还能够处理两张没有任何重叠内容的图像,仍然准确地完成3D 视图的重建,展现出其强大的功能和适用性。

image.png

该工具的出现引起了许多网友的兴趣,有人甚至在实验中测试了不同相机拍摄的图像,结果依然有效。DUSt3R 的出现为3D 重建任务提供了一种简单而高效的解决方案,让用户可以更轻松地完成相关工作。其优异的性能和快速的重建速度让人对其未来应用前景充满期待。

通过 DUSt3R 这一新工具的出现,用户可以更快速地实现3D 重建,无论是在室内还是室外场景,都能得到准确且完整的效果。这一技术的应用将极大地方便用户进行相关任务,带来更多可能性和创新。

论文https://arxiv.org/abs/2312.14132

项目入口:https://top.aibase.com/tool/dust3r

举报

  • 相关推荐
  • 横扫拉美、力压字节系,「AI届的4399」成为出海AI应用新王?

    在 Sensor Tower 发布的 Q3应用出海榜单中,我们注意到了一个特别的 AI 应用「Seekee」。 它空降下载榜 Top9,是当季度在海外获得最多下载量的出海 AI 应用,而由字节跳动出品、近一段时间炙手可热的「Cici」尽管排名上涨,但仅位列第13。

  • 拍照视频,无需妥协:佳能R50V以全能双修定义创作新标准

    佳能R50V以“全能双修”定位成为市场焦点,在视频与摄影两大核心维度表现均衡专业。搭载2420万像素APS-C画幅CMOS与DIGIC X处理器,支持6K超采4K录制及专业格式,配备10bit色深。机身仅重323克,新增竖拍优化与14种滤镜,支持USB一线连播。具备1/8000秒快门与第二代全像素双核AF系统,可精准识别多类主体。配合RF-S电动变焦镜头实现广角自拍,覆盖Vlog、直播、人像等多场景,以约6000元定价降低专业创作门槛,成为内容创作者的热门选择。

  • 鸿蒙智行:智界R7累计交付量破10万台

    鸿蒙智行旗下智界R7累计交付量突破10万台,显示市场广泛认可。新车提供增程版与纯电版,续航表现优异:入门Max版纯电续航667km,增程版综合续航达1570km;高配版纯电续航最高802km,综合续航达1673km。车内配备16.1英寸3K中控屏及主副驾双零重力座椅,提升舒适性。全系搭载华为192线激光雷达与HUAWEI ADS 4,实现全场景智能驾驶。动力方面,增程版标配1.5T高效发动机,Max版零百加速7.4秒,Ultra四驱版零百加速仅4.9秒。即日起至12月1日订车可享限时优惠。

  • 颜值派亦实力派:佳能 R50V 与竞品的设计美学及性能硬核对决

    在颜值即正义的时代,佳能R50V以极简设计打破传统相机造型局限,搭载专业视频性能,成为年轻创作者焦点。文章对比尼康Z fc、富士X-T30II、尼康Z30、松下GX9四款热门微单,指出R50V通过6K超采样4K视频、全像素双核自动对焦、专业Log格式与直播优化功能,实现颜值与性能的完美平衡。其轻量化镁合金机身、双色选择及竖拍适配设计,兼顾日常穿搭与专业创作需求,堪称8000元内性价比首选的全能型相机。

  • 拍照效果好的相机推荐:佳能R50V与R50,助你轻松捕捉极致画质

    本文推荐佳能R50V和R50两款相机,均以2420万像素APS-C画幅传感器和DIGIC X处理器为核心,提供卓越画质、精准对焦与佳能独特色彩。R50V侧重专业视频与创意控制,支持6K超采样4K视频、Canon Log 3及丰富滤镜,适合高要求创作者;R50则平衡便携性与性能,具备自然景深与弱光纯净画质,满足日常拍摄需求。两款相机均能精准捕捉动态主体,助用户实现精彩视觉创作。

  • 品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

    某互联网大厂品牌总监分享:投入200万SEO使"企业级CRM"关键词在Google排名第一,但用户用ChatGPT询问"推荐适合中国企业的CRM系统"时,AI回答中根本没有该品牌。更值得警惕的是,竞品不仅被提及,还被AI用"性价比高""用户体验好"等正面词汇描述。这揭示2025年品牌营销最大盲区:企业不知道AI如何"看待"自身品牌。 数据显示超40%年轻用户开始使用AI搜索作为主要信息渠道,而绝大多数企业对自己在AI平台的"形象"一无所知。文章提出GEO品牌监控概念,通过覆盖度、推荐强度、信息质量三个维度量化品牌在AI搜索中的影响力,并给出五步实施流程:建立监控基线、竞品对标分析、设置持续机制、深度洞察挖掘、数据驱动优化。通过真实案例说明,系统化GEO优化能在3个月内提升品牌提及率33个百分点,证明AI搜索时代的品牌竞争已从"被看见"升级为"被AI信任"。

  • 软件定义汽车的质量革命:AI Agent如何终结座舱OTA的“路测噩梦”

    在“软件定义汽车”浪潮下,智能汽车竞争核心转向座舱体验、ADAS功能及OTA迭代质量。然而,传统软件测试模式成本高、耗时长,难以覆盖复杂场景,易导致漏洞。AI驱动的“无人测试”通过大模型与智能体技术实现三大突破:需求自主解析与测试规划、GUI自主探索与自愈维护、智能诊断与根因分析。这将催生“人机协同”新范式,测试工程师角色转向质量策略师。到2027年,超80%企业将集成AI测试工具,汽车行业2025年成为转型关键节点。

  • TabTab 登顶模力工场 AI 应用榜榜首, 把 AI 数据分析师装进口袋,关键结论更快抵达!

    TabTab是一款全链路AI数据分析助手,核心功能包括多源数据连接(支持文档、数据库、电商平台等)、自动化采集清洗、内置分析模型及可视化呈现。其优势在于通过多智能体系统实现自然语言交互,降低分析门槛,让非技术人员也能快速完成客户洞察、销售业绩等分析,显著提升效率。产品定位中立,致力于构建多元化AI效率提升生态。

  • AI日报:广电整治AI动画乱象;360发布大模型安全白皮书;百度推出小度AI眼镜Pro

    国家广电总局宣布自2026年3月起全面整治AI生成内容,要求AIGC作品纳入分类分层审核体系。360发布《大模型安全白皮书》,提出全链路AI安全防线应对新型威胁。百度推出2299元小度AI眼镜Pro,集成智能翻译等多项功能。StepFun开源音频编辑模型Step-Audio-EditX,实现文本化语音编辑。Grok新增纯文本生成视频功能,17秒可生成带特效视频片段。研究发现谷歌Veo-3模型能生成逼真手术视频但缺乏医学逻辑。阿里Qwen3-Max-Thinking在全球数学竞赛夺冠,并在加密货币交易中取得显著回报。OpenAI推出轻量化GPT-5 Codex Mini模型,优化开发者体验。

  • 从“实现需求”到“共创价值”:AI Native时代需要什么样的工程师团队?

    在1024程序员节,小红书技术副总裁风笛出席CCF工程师文化日五周年庆典,分享AI时代技术团队转型方向。他指出传统开发模式下工程师仅1/3时间编码,其余被会议沟通挤占,导致技术成长受阻、创新力下降。提出AI Native时代需重构协作模式:通过任务导向的扁平化组织,让工程师从需求执行者转变为价值创造者。以48小时上线翻译功能为例,展示新型协作效能。强调AI不会取代工程师,而是将其角色提升至系统定义和复杂性管理的新高度。

今日大家都在搜的词: