新型3D生成方法DMV3D:使用基于Transformer的3D大型重建模型进行去噪

2023-12-07 17:57 · 稿源：站长之家

**划重点:**
1. 💡 DMV3D是一种单阶段的、类别不可知的扩散模型，能够通过直接模型推理从文本或单一图像输入条件生成3D神经辐射场（NeRFs），显著缩短了创建3D对象所需的时间。
2. 💡 DMV3D集成了3D NeRF重建和渲染到其去噪器中，创建了一个在没有直接3D监督的情况下训练的2D多视图图像扩散模型，消除了为潜在空间扩散单独训练3D NeRF编码器的需要。
3. 💡 基于大型Transformer模型，研究人员通过近期的3D大型重建模型（LRM）构建了一个新颖的联合重建和去噪模型，能够处理扩散过程中的各种噪声水平。

站长之家（ChinaZ.com）12月7日消息:近期，Adobe研究人员与斯坦福大学团队联合提出了一种名为DMV3D的全新3D生成方法。该方法旨在解决增强现实（AR）、虚拟现实(VR)、机器人技术和游戏等领域中3D资产创建的共同挑战。尽管3D扩散模型在简化复杂的3D资产创建过程方面变得越来越受欢迎，但它们需要访问用于训练的地面真实3D模型或点云，这对于真实图像而言是一项挑战。

现有的解决方案虽然可以解决这一挑战，但通常需要大量手动工作和优化过程。因此，Adobe研究人员与斯坦福大学团队一直致力于使3D生成过程更快、更真实和更通用。他们近期发布的论文介绍了一种新的方法，即DMV3D，这是一种单阶段的、类别不可知的扩散模型。

DMV3D的关键贡献包括使用多视图2D图像扩散模型进行3D生成的开创性单阶段扩散框架。同时，引入了大型重建模型（LRM），这是一种多视图去噪器，可以从嘈杂的多视图图像中重建无噪音的三平面NeRFs。该模型提供了一个通用的概率方法，用于高质量的文本到3D生成和单图像重建，实现了快速的直接模型推理，在单个A100GPU上仅需约30秒。

DMV3D将3D NeRF重建和渲染集成到其去噪器中，创建了一个在没有直接3D监督的情况下训练的2D多视图图像扩散模型。这消除了为潜在空间扩散单独训练3D NeRF编码器的需要，并简化了每个资产的优化过程。研究人员巧妙地使用了围绕物体的四个多视图图像的稀疏集合，有效地描述了一个3D对象，而没有明显的自遮挡问题。

通过利用大型Transformer模型，研究人员解决了稀疏视图3D重建的挑战性任务。基于最近的3D大型重建模型（LRM），他们引入了一种新颖的联合重建和去噪模型，能够处理扩散过程中的各种噪声水平。在大规模合成渲染和真实捕获的数据集上进行训练，DMV3D在单个A100GPU上展示了在约30秒内生成单阶段3D的能力。它在单图像3D重建方面取得了最新的成果。

该研究为通过统一3D重建和生成的2D和3D生成模型的领域之间的鸿沟，以解决3D视觉和图形领域中的各种挑战，提供了新的视角和可能性。

项目网址:https://justimyhxu.github.io/projects/dmv3d/

论文网址:https://arxiv.org/abs/2311.09217

（举报）

相关推荐

关键词：

华为云盘古预测大模型首创 Triplet Transformer 统一预训练架构

6月20日，华为发布盘古大模型5.5，五大基础模型全面升级。该模型采用业界首创的Triplet+Transformer统一预训练架构，能跨行业处理表格数据、时间序列数据和图片数据，显著提升预测精度和泛化能力。已在水泥、钢铁、电解铝、供热等多个工业场景落地应用：海螺水泥实现熟料强度预测，宝武钢铁高炉出铁温度合格率超90%，云南铝业年省电2600万度，天津供热能耗降低10%。模型聚焦工业领域，通过工艺优化和系统寻优，助力企业降本增效，推动行业智能化转型。

华为盘古大模型云计算
从心脏、到血管……3D打印开启“器官替换”时代

为了确保3D打印的人工器官能正常运行，必须让血管充分发挥功能。若无法稳定供血，人工器官的广泛使用根本无从谈起……

3D打印 3D打印心脏 3D打印血管
LiblibAI 重磅发布「星流 Agent」：中文语义 + 图片视频3D全能生成，中国最强设计 Agent

LiblibAI推出Lovart中文版"星流Agent"，这是一款专为中国市场深度优化的AI设计工具。该产品在保留Lovart全球版"生成-编辑-排版-交付"全链路能力基础上，针对中文语义、国风审美和本土使用场景进行了全面重构。星流Agent支持从创意构思到设计交付的全流程自动化，可处理平面设计、视频生成和3D建模等跨模态创作，内置符合中国文化的视觉风格库。该产品的推出标�

Lovart AI设计中文优化
荐A日报：B站升级动漫视频生成模型AniSora V3；字节开源4D视频生成框架EX-4D；DeepSWE开源AI Agent系统强势登顶

AI日报栏目汇总了近期AI领域的重要进展：1)字节跳动开源EX-4D框架，可将单目视频转换为多视角4D视频；2)B站开源动漫视频生成模型AniSora V3，支持多种风格；3)DeepSWE+开源基于Qwen3-32B的AI Agent系统；4)字节开源3亿参数图像编辑模型VINCIE-3B；5)Stability AI推出移动端音频生成模型Stable Audio Open Small；6)谷歌发布免费教育AI工具套件Gemini for Education；7)Topview推出革命性AI数字人带货技术Avatar

人工智能 AI技术趋势 4D视频生成
省委常委、市委书记刘非调研思看科技，勉励思看勇攀3D视觉数字化科技高峰

省委常委、市委书记刘非赴杭州市余杭区调研科技创新工作，强调要深入学习贯彻重要指示精神，全面落实省委"一个首要任务、三个主攻方向、两个根本"总体部署。调研期间，刘非实地考察思看科技公司，详细了解其3D视觉数字化技术研发成果及在航天、大飞机等重大项目的应用情况，勉励企业要着眼世界前沿，加大创新力度，在3D视觉数字化领域实现更大突破。余杭�

科技创新共同富裕基层民主
荐AI日报：腾讯混元3D 2.1大模型开源；字节跳动AI Lab负责人李航卸任；OpenAI Codex 全新升级

本文介绍了AI领域最新动态：1)腾讯开源混元3D2.1大模型，提升3D生成质量；2)OpenAI Codex升级，优化代码生成功能；3)字节跳动AI Lab负责人李航卸任；4)微软发布700个AI应用案例；5)微软推出Code Researcher工具，解决58%系统崩溃问题；6)Observer AI实现屏幕操作自动化；7)Genspark发布AI浏览器；8)麻省理工用AI技术3.5小时修复15世纪名画；9)蚂蚁集团推出开源多模态GPT-4o模型Ming-Omni；10)MagicTryOn视频换衣框架；11)字节跳动发布实时互动AI视频生成模型Seaweed APT2；12)ChatGPT搜索功能升级；13)字节跳动与老凤祥合作开发AI智能眼镜。

人工智能 3D生成开源大模型
荐AI日报：阿里开源3D数字人项目MNN TaoAvatar；MiniMax Agent上线；罗永浩数字人直播再探“AI+IP”带货模式

本文汇总了AI领域最新动态：1）阿里开源MNN+TaoAvatar技术，实现手机端3D数字人实时交互；2）MiniMax升级AI工具Agent，新增智能图像搜索和多语言支持；3）罗永浩数字人将登陆百度电商直播；4）OpenAI员工套现近30亿美元，软银成最大接盘方；5）ChatGPT推出深度研究和语音模式升级；6）Meta发布V-JEPA2模型，提升机器人环境适应能力；7）AMD与OpenAI合作推出新一代AI芯片；8）Google Gemini集成Imagen4图像生成模型；9）谷歌AI实现10公里级精准天气预报；10）Gartner预测到2028年80%的AI应用开发时间将缩短50%。

人工智能虚拟现实 3D数字人
1799元！小米米家智能晾衣机2 Pro开启预约：94个晾晒位、配3D曲面穹顶灯

米家推出全新智能晾衣机2Pro，以超薄机身、强大晾晒能力及智能联动功能，为用户带来阳台空间的全新晾衣体验，目前该产品已在小米商城开启预约，售价1799元。米家智能晾衣机2Pro采用9.5cm超薄隐藏机身设计，搭配一体式3D曲面穹顶灯，融合照明与晾晒功能。晾衣机创新打造了94个多功能晾晒位，包含40个开放式挂槽、20个伸缩细杆挂位、32个旋转挂钩位以及2个独立晾被杆，

米家智能晾衣机家居生活
小米15 Ultra限量定制色公布：共3款

自发布以来，小米15Ultra在全球手机行业中始终保持着强劲的竞争力，尤其在影像方面表现卓越。它配备了一英寸主摄和2亿像素潜望长焦，徕卡四摄系统更是涵盖了14mm超广镜头、23mm主摄镜头、70mm中长焦镜头和100mm超长焦镜头。其中，主摄采用索尼LYT900传感器，拥有1英寸超大底，支持双原生ISO Fusion Max技术，动态范围高达单帧15EV，是小米史上进光量最大的主摄镜头。而100mm超�

小米15Ultra 徕卡相机限量定制
落后华为2年半！Apple Watch Ultra 3有望今年登场：支持卫星消息

据彭博社记者透露，Apple Watch Ultra 3有望于今年发布，将带来卫星连接与5G网络支持等重要” 新功能，打破该系列自2023年以来的硬件升级停滞局面。目前，华为是首个在智能手表上实现卫星通信功能的厂商。 2023年3月，华为Watch Ultimate非凡大师全球首发搭载双向北斗卫星消息功能，成为业界首款支持该技术的智能手表。 Apple Watch Ultra 3预计将会在今年9月份发布，落后华为整�

Apple Watch Ultra

热文

3 天
7天

新型3D生成方法DMV3D:使用基于Transformer的3D大型重建模型进行去噪

华为云盘古预测大模型首创 Triplet Transformer 统一预训练架构

从心脏、到血管……3D打印开启“器官替换”时代

LiblibAI 重磅发布「星流 Agent」：中文语义 + 图片视频3D全能生成，中国最强设计 Agent

荐A日报：B站升级动漫视频生成模型AniSora V3；字节开源4D视频生成框架EX-4D；DeepSWE开源AI Agent系统强势登顶

省委常委、市委书记刘非调研思看科技，勉励思看勇攀3D视觉数字化科技高峰

荐AI日报：腾讯混元3D 2.1大模型开源；字节跳动AI Lab负责人李航卸任；OpenAI Codex 全新升级

荐AI日报：阿里开源3D数字人项目MNN TaoAvatar；MiniMax Agent上线；罗永浩数字人直播再探“AI+IP”带货模式

1799元！小米米家智能晾衣机2 Pro开启预约：94个晾晒位、配3D曲面穹顶灯

小米15 Ultra限量定制色公布：共3款

落后华为2年半！Apple Watch Ultra 3有望今年登场：支持卫星消息

热文

罗马仕深夜正式发布停工停产通知：宣布停工停产半年

淘宝闪购日订单突破8000万日活超2亿

王化辟谣小米与徕卡终止合作：无聊还是胡说

华为Mate X5折叠屏降价：8999元起至高优惠4000元

微信：聊天记录备份和迁移已支持外部存储设备可自动备份

罗马仕深夜正式发布停工停产通知：宣布停工停产半年

淘宝闪购日订单突破8000万日活超2亿

罗马仕辟谣倒闭称定将努力解决一切问题

王化辟谣小米与徕卡终止合作：无聊还是胡说

站长商机