Adobe发布创新的DMV3D方法单个A100生成3D图像只需30秒

2023-11-27 13:45 · 稿源：站长之家

要点:
1. Adobe研究院和斯坦福大学的研究者提出了一种基于Transformer的3D生成方法DMV3D，利用单个A100GPU仅需30秒即可生成各种高保真3D图像。
2. DMV3D是一种全新的单阶段全类别扩散模型，通过2D多视图图像扩散、3D NeRF重建和渲染的集成，实现端到端的训练，避免了传统3D生成方法中的问题。
3. 通过使用稀疏的多视图投影作为训练数据，DMV3D能够在单个图像或文本输入的情况下实现3D生成，取得了在单图像3D重建方面的State-of-the-Art（SOTA）结果，超越了先前方法。

站长之家（ChinaZ.com）11月27日消息:近期，Adobe研究院和斯坦福大学的研究者推出了一项创新的3D生成方法，命名为DMV3D。通过基于Transformer的新型单阶段全类别扩散模型，该方法能在单个A100GPU上仅需30秒的时间内生成高保真3D图像。DMV3D通过将2D多视图图像扩散、3D NeRF重建和渲染集成到一个端到端的训练过程中，成功避免了传统方法中的问题。

论文地址:https://arxiv.org/pdf/2311.09217.pdf

官网地址:https://justimyhxu.github.io/projects/dmv3d/

这项研究的关键在于使用稀疏的多视图投影作为训练数据，以解决传统3D生成方法中存在的模糊和难以去噪的问题。相比之下，DMV3D展示了在单个图像或文本输入的情况下实现3D生成的能力。通过固定一个稀疏视图作为无噪声输入，并对其他视图进行类似于2D图像修复的降噪，DMV3D能够在30秒内生成各种高保真3D图像，这一成果超越了先前基于SDS的方法和3D扩散模型。

研究者还介绍了DMV3D的训练和推理过程，包括基于重建的多视图降噪器的构建、多视图扩散和去噪的方法以及模型的时间和相机调节。此外，通过引入文本或图像的条件降噪器，DMV3D实现了可控的3D生成，为无条件生成模型提供了更多可能性。

这一创新方法的提出对于AI视觉领域的3D生成研究具有重要意义，不仅在技术上解决了传统方法的问题，而且在性能上取得了SOTA的成果。该研究为未来的VR、AR、机器人技术和游戏等应用领域提供了新的可能性。

（举报）

相关推荐

关键词：

荐AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅升级；Soul语音模型SoulX-Podcast发布

本期AI日报聚焦多项技术突破：豆包推出全自动有声剧系统，实现98%角色识别准确率；Adobe Firefly Image 5支持400万像素原生输出及AI音轨生成；Soul发布90分钟无中断播客生成模型；360推出全球首款L2-L4全栈智能平台；IBM发布可在普通设备运行的Granite 4.0 Nano模型。市场方面，移动端AI用户突破7亿，豆包领跑原生应用；PayPal与OpenAI合作使ChatGPT集成支付功能；谷歌推出AI营销工具Pomelli，可基于URL自动生成营销内容。

AI有声剧豆包语音多角色语音合成
免费AI搜索优化GEO工具:AIBase帮你监控品牌在AI平台的曝光

朋友公司实验发现：当用户询问AI“推荐项目管理工具”时，其产品在豆包被推荐，但在通义千问未被提及。这揭示AI搜索流量正从Google转移，但品牌难以追踪在AI平台的表现。传统分析工具无法解决此问题，需专门GEO工具。AIBase GEO可同时监控5大主流AI平台，实时反馈品牌曝光数据，并通过可视化图表展示可见度变化。该工具特别适合关注AI搜索流量的ToB企业，建议将监控与内容优化形成闭环，以应对2030年AI搜索预计占总量62.2%的趋势。
1.3亿美元！LiblibAI拿下国内最大AI应用融资

2025年AI应用公司LiblibAI完成1.3亿美元B轮融资，由红杉中国等机构领投，创国内AI应用赛道最大单笔融资。该公司通过“工具集成+社区生态”模式，整合图像、视频、3D等多模态能力，覆盖从灵感到成片的完整AI工作流，已孵化超2000万创作者。平台将加速全球化布局，打造多模态内容生态，标志着AI投资正从底层模型转向应用层落地。

AI应用 B轮融资多模态模型
深度测评AIBase GEO排名查询工具，实现AI搜索排名提升

随着大语言模型和生成式AI普及，品牌可见度竞争已转向AI问答界面——这就是生成引擎优化(GEO)。传统SEO关注搜索列表排名，而GEO要求品牌被AI模型在回答用户问题时“推荐”或“提及”。AIBase推出的GEO排名查询工具，通过覆盖五大主流AI平台、模拟真实用户场景、精准统计推荐频次与排名，帮助企业监测品牌在AI问答中的表现，为提升AI搜索排名提供策略指导。

数字化营销 SEO GEO
AI日报：Google Skills平台向公众免费开放内部AI知识；LiblibAI 完成1.3亿美元融资；Sora更新推出“角色客串”功能

本期AI日报聚焦视频生成领域重大进展：昆仑万维SkyReels将于11月上线新版AI视频工具；LiblibAI完成1.3亿美元融资；阿里推出夸克对话助手；豆包视频模型Seedance1.0pro实现首尾帧一致性突破；Vidu Q2全面开放API；Sora新增角色客串功能并即将推出安卓版；MiniMax海螺2.3在真实感方面超越Veo；谷歌推出免费AI学习平台"Google Skills"；字节跳动Seed团队发布3D生成模型Seed3D1.0，支持单图生成高质量3D资产。

AI视频昆仑万维 SkyReels
重磅预告：全链路自主进化 AI 数据分析师 TabTab 将于10月24日上线

灵快科技推出的AI数据分析师TabTab将于10月24日上线。该产品通过Multi-Agent系统实现全链路自动化数据分析，覆盖数据获取、建模到可视化全流程。用户可用自然语言交互，系统自主规划任务并输出可维护结果，支持Excel、PPT等多种报告格式。核心定位为智能数据分析助手，旨在降低分析门槛，助力企业高效挖掘数据价值，适用于数据分析师、营销人员等各类用户。

AI数据分析 Multi-Agent系统数据可视化
前B站副总裁打造“非共识”AI陪伴，国内拿下千万用户后加速出海

在今年东京电玩展的现场，我们第一次见到了 AI 陪伴创企心影随形的创始人刘斌新。面前的刘斌新，像此前媒体同行描述的一样随和、健谈，他曾先后出任过百度副总监、360助理总裁、B 站副总裁，2023年，他选择了自己创业，从熟悉的游戏场景切入做一款 AI 陪伴产品，「逗逗游戏伙伴」由此诞生。从整个 AI 陪伴品类来看，「逗逗游戏伙伴」是一个很“特别”的存在。不同�

AI陪伴游戏伙伴东京电玩展
荐ROBOT PHONE登场：荣耀为AI终端开了自进化的未来新局

十年前，AI还停留在算力、模型与数据此消彼长的层面。如今，技术的发展早已超乎想象。 2025年上半年，Google DeepMind重磅推出的AlphaEvolve揭示了一个重要趋势:AI开始拥有“自我成长”的能力。 AlphaEvolve是一种典型的“自进化系统”，它结合了Gemini模型的创造性问题解决能力，以及自动化评估器（Evaluator）的反馈学习机制，能够判断“什么是好的”，并据此不断自我优化。 �

AI 自进化系统 Google
荐400万月活，2500万用户，1.3亿美元：LiblibAI拿到今年国内AI应用最大一笔钱

AI应用公司LiblibAI近期完成1.3亿美元B轮融资。从目前公开数据来看，这是国内AI应用公司今年最大的一笔融资。据官方透露，本轮融资由红杉中国、CMC资本及一战略投资方联合领投，老股东顺为资本、源码资本、明势创投、渶策资本均超额增持，远识资本继续担任本轮融资的独家财务顾问。 Liblib是ChatGPT出现后AI应用井喷般创业潮里十分典型的一家公司，它由在大厂打过硬仗的

AI应用融资创业
AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个模型尺寸；百川发布循环证据增强大模型

本文汇总AI领域最新动态：OpenAI推出集成ChatGPT的Atlas浏览器，实现多任务自主处理；阿里通义千问新增2B/32B视觉语言模型，手机可流畅运行；谷歌AI Studio升级Vibe Coding功能，简化应用开发流程；百川发布医疗大模型M2Plus，通过循证推理降低误诊率；奇瑞墨甲机器人实现L3级技术突破，计划多行业应用；YouTube推出AI肖像识别工具，打击虚假内容；三星宣布2026年推出AI眼镜，融合AR与语音助手；Claude客户端更新，支持截图分析和语音交互功能。

AI OpenAI ChatGPT

今日大家都在搜的词：

热文

3 天
7天

Adobe发布创新的DMV3D方法单个A100生成3D图像只需30秒

荐AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅升级；Soul语音模型SoulX-Podcast发布

免费AI搜索优化GEO工具:AIBase帮你监控品牌在AI平台的曝光

1.3亿美元！LiblibAI拿下国内最大AI应用融资

深度测评AIBase GEO排名查询工具，实现AI搜索排名提升

AI日报：Google Skills平台向公众免费开放内部AI知识；LiblibAI 完成1.3亿美元融资；Sora更新推出“角色客串”功能

重磅预告：全链路自主进化 AI 数据分析师 TabTab 将于10月24日上线

前B站副总裁打造“非共识”AI陪伴，国内拿下千万用户后加速出海

荐ROBOT PHONE登场：荣耀为AI终端开了自进化的未来新局

荐400万月活，2500万用户，1.3亿美元：LiblibAI拿到今年国内AI应用最大一笔钱

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个模型尺寸；百川发布循环证据增强大模型

今日大家都在搜的词：

热文

iPhone锁屏滑动相机能关闭了苹果iOS 26.1 RC准正式版发布

AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅

鸿蒙智行：全新问界M7上市36天交付破20000台

美股4万亿美元市值上市公司已达3家苹果、微软、英伟达组成三巨

小米17 Pro系列妙享背屏全新掌机游戏等新功能上线

微信升级：支持一次撤回全部消息、删好友能保留聊天记录等功能

OPPO ColorOS 16正式版推送：首批适配11款机型

AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑

微信红包封面现已支持跳转「微信小店」

iPhone 18系列或将首发自研基带C2

iPhone锁屏滑动相机能关闭了苹果iOS 26.1 RC准正式版发布

一加15今晚发布定位全能水桶机

AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度

AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI

AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅

红米REDMI K90全方位提升雷军：是不是越来越有旗舰气质

鸿蒙智行：全新问界M7上市36天交付破20000台

余承东曝鸿蒙智行新款享界S9将于11月上市

iPhone18发布或推迟苹果明年9月只发Pro系列和Fold折叠屏

华为余承东：鸿蒙智行全系交付突破100万台仅用43个月

站长商机

Adobe发布创新的DMV3D方法 单个A100生成3D图像只需30秒

今日大家都在搜的词：

热文

站长商机

Adobe发布创新的DMV3D方法单个A100生成3D图像只需30秒