首页 > 业界 > 关键词  > Adobe最新资讯  > 正文

Adobe发布创新的DMV3D方法 单个A100生成3D图像只需30秒

2023-11-27 13:45 · 稿源:站长之家

要点:

1. Adobe研究院和斯坦福大学的研究者提出了一种基于Transformer的3D生成方法DMV3D,利用单个A100GPU仅需30秒即可生成各种高保真3D图像。

2. DMV3D是一种全新的单阶段全类别扩散模型,通过2D多视图图像扩散、3D NeRF重建和渲染的集成,实现端到端的训练,避免了传统3D生成方法中的问题。

3. 通过使用稀疏的多视图投影作为训练数据,DMV3D能够在单个图像或文本输入的情况下实现3D生成,取得了在单图像3D重建方面的State-of-the-Art(SOTA)结果,超越了先前方法。

站长之家(ChinaZ.com)11月27日 消息:近期,Adobe研究院和斯坦福大学的研究者推出了一项创新的3D生成方法,命名为DMV3D。通过基于Transformer的新型单阶段全类别扩散模型,该方法能在单个A100GPU上仅需30秒的时间内生成高保真3D图像。DMV3D通过将2D多视图图像扩散、3D NeRF重建和渲染集成到一个端到端的训练过程中,成功避免了传统方法中的问题。

image.png

论文地址:https://arxiv.org/pdf/2311.09217.pdf

官网地址:https://justimyhxu.github.io/projects/dmv3d/

这项研究的关键在于使用稀疏的多视图投影作为训练数据,以解决传统3D生成方法中存在的模糊和难以去噪的问题。相比之下,DMV3D展示了在单个图像或文本输入的情况下实现3D生成的能力。通过固定一个稀疏视图作为无噪声输入,并对其他视图进行类似于2D图像修复的降噪,DMV3D能够在30秒内生成各种高保真3D图像,这一成果超越了先前基于SDS的方法和3D扩散模型。

研究者还介绍了DMV3D的训练和推理过程,包括基于重建的多视图降噪器的构建、多视图扩散和去噪的方法以及模型的时间和相机调节。此外,通过引入文本或图像的条件降噪器,DMV3D实现了可控的3D生成,为无条件生成模型提供了更多可能性。

这一创新方法的提出对于AI视觉领域的3D生成研究具有重要意义,不仅在技术上解决了传统方法的问题,而且在性能上取得了SOTA的成果。该研究为未来的VR、AR、机器人技术和游戏等应用领域提供了新的可能性。

举报

  • 相关推荐
  • AI日报:豆包推全自动多人配音系统;Adobe Firefly Image 5重磅升级;Soul语音模型SoulX-Podcast发布

    本期AI日报聚焦多项技术突破:豆包推出全自动有声剧系统,实现98%角色识别准确率;Adobe Firefly Image 5支持400万像素原生输出及AI音轨生成;Soul发布90分钟无中断播客生成模型;360推出全球首款L2-L4全栈智能平台;IBM发布可在普通设备运行的Granite 4.0 Nano模型。市场方面,移动端AI用户突破7亿,豆包领跑原生应用;PayPal与OpenAI合作使ChatGPT集成支付功能;谷歌推出AI营销工具Pomelli,可基于URL自动生成营销内容。

  • 免费AI搜索优化GEO工具:AIBase帮你监控品牌在AI平台的曝光

    朋友公司实验发现:当用户询问AI“推荐项目管理工具”时,其产品在豆包被推荐,但在通义千问未被提及。这揭示AI搜索流量正从Google转移,但品牌难以追踪在AI平台的表现。传统分析工具无法解决此问题,需专门GEO工具。AIBase GEO可同时监控5大主流AI平台,实时反馈品牌曝光数据,并通过可视化图表展示可见度变化。该工具特别适合关注AI搜索流量的ToB企业,建议将监控与内容优化形成闭环,以应对2030年AI搜索预计占总量62.2%的趋势。

  • 1.3亿美元!LiblibAI拿下国内最大AI应用融资

    2025年AI应用公司LiblibAI完成1.3亿美元B轮融资,由红杉中国等机构领投,创国内AI应用赛道最大单笔融资。该公司通过“工具集成+社区生态”模式,整合图像、视频、3D等多模态能力,覆盖从灵感到成片的完整AI工作流,已孵化超2000万创作者。平台将加速全球化布局,打造多模态内容生态,标志着AI投资正从底层模型转向应用层落地。

  • 深度测评AIBase GEO排名查询工具,实现AI搜索排名提升

    随着大语言模型和生成式AI普及,品牌可见度竞争已转向AI问答界面——这就是生成引擎优化(GEO)。传统SEO关注搜索列表排名,而GEO要求品牌被AI模型在回答用户问题时“推荐”或“提及”。AIBase推出的GEO排名查询工具,通过覆盖五大主流AI平台、模拟真实用户场景、精准统计推荐频次与排名,帮助企业监测品牌在AI问答中的表现,为提升AI搜索排名提供策略指导。

  • AI日报:Google Skills平台向公众免费开放内部AI知识;LiblibAI 完成1.3亿美元融资;Sora更新推出“角色客串”功能

    本期AI日报聚焦视频生成领域重大进展:昆仑万维SkyReels将于11月上线新版AI视频工具;LiblibAI完成1.3亿美元融资;阿里推出夸克对话助手;豆包视频模型Seedance1.0pro实现首尾帧一致性突破;Vidu Q2全面开放API;Sora新增角色客串功能并即将推出安卓版;MiniMax海螺2.3在真实感方面超越Veo;谷歌推出免费AI学习平台"Google Skills";字节跳动Seed团队发布3D生成模型Seed3D1.0,支持单图生成高质量3D资产。

  • 重磅预告:全链路自主进化 AI 数据分析师 TabTab 将于10月24日上线

    灵快科技推出的AI数据分析师TabTab将于10月24日上线。该产品通过Multi-Agent系统实现全链路自动化数据分析,覆盖数据获取、建模到可视化全流程。用户可用自然语言交互,系统自主规划任务并输出可维护结果,支持Excel、PPT等多种报告格式。核心定位为智能数据分析助手,旨在降低分析门槛,助力企业高效挖掘数据价值,适用于数据分析师、营销人员等各类用户。

  • 前B站副总裁打造“非共识”AI陪伴,国内拿下千万用户后加速出海

    在今年东京电玩展的现场,我们第一次见到了 AI 陪伴创企心影随形的创始人刘斌新。 面前的刘斌新,像此前媒体同行描述的一样随和、健谈,他曾先后出任过百度副总监、360助理总裁、B 站副总裁,2023年,他选择了自己创业,从熟悉的游戏场景切入做一款 AI 陪伴产品,「逗逗游戏伙伴」由此诞生。 从整个 AI 陪伴品类来看,「逗逗游戏伙伴」是一个很“特别”的存在。不同�

  • ROBOT PHONE登场:荣耀为AI终端开了自进化的未来新局

    ​十年前,AI还停留在算力、模型与数据此消彼长的层面。如今,技术的发展早已超乎想象。 2025年上半年,Google DeepMind重磅推出的AlphaEvolve揭示了一个重要趋势:AI开始拥有“自我成长”的能力。 AlphaEvolve是一种典型的“自进化系统”,它结合了Gemini模型的创造性问题解决能力,以及自动化评估器(Evaluator)的反馈学习机制,能够判断“什么是好的”,并据此不断自我优化。 �

  • 400万月活,2500万用户,1.3亿美元:LiblibAI拿到今年国内AI应用最大一笔钱

    AI应用公司LiblibAI近期完成1.3亿美元B轮融资。从目前公开数据来看,这是国内AI应用公司今年最大的一笔融资。 据官方透露,本轮融资由红杉中国、CMC资本及一战略投资方联合领投,老股东顺为资本、源码资本、明势创投、渶策资本均超额增持,远识资本继续担任本轮融资的独家财务顾问。 Liblib是ChatGPT出现后AI应用井喷般创业潮里十分典型的一家公司,它由在大厂打过硬仗的

  • AI日报:OpenAI发布浏览器Atlas;通义Qwen3-VL新增2B、32B两个模型尺寸;百川发布循环证据增强大模型

    本文汇总AI领域最新动态:OpenAI推出集成ChatGPT的Atlas浏览器,实现多任务自主处理;阿里通义千问新增2B/32B视觉语言模型,手机可流畅运行;谷歌AI Studio升级Vibe Coding功能,简化应用开发流程;百川发布医疗大模型M2Plus,通过循证推理降低误诊率;奇瑞墨甲机器人实现L3级技术突破,计划多行业应用;YouTube推出AI肖像识别工具,打击虚假内容;三星宣布2026年推出AI眼镜,融合AR与语音助手;Claude客户端更新,支持截图分析和语音交互功能。

今日大家都在搜的词: