Adobe研究人员研发新AI模型LRM：实现从2D样本瞬时生成3D图像

2023-11-14 10:35 · 稿源：站长之家

**划重点:**
1. 💡 Adobe Research和澳大利亚国立大学（ANU）联合宣布，他们研发出首个能够从单一2D图像生成3D图像的人工智能模型。
2. 💻 新算法基于大规模图像样本训练，能够在几秒钟内生成高质量的3D图像，该算法采用了名为LRM（Large Reconstruction Model）的高度可扩展神经网络，包含一百万数据集和五亿参数。
3. 🚀 LRM的成功在于其能够利用数百万图像参数的数据库，并预测神经辐射场（NeRF），从而仅基于2D图像生成逼真的3D图像，即使这些图像是低分辨率的。

站长之家（ChinaZ.com）11月14日消息:由Adobe Research和澳大利亚国立大学（ANU）联合研发的人工智能模型宣布了一项突破性的成果，能够从单一的2D图像中生成3D图像。

研究人员表示，他们的新算法在大规模图像样本上进行训练，可以在几秒钟内生成这样的3D图像。该算法采用了名为LRM（Large Reconstruction Model）的高度可扩展神经网络，包含一百万数据集和五亿参数，涵盖图像、3D形状和视频等多种数据。

该项目的领导作者、澳大利亚国立大学工程、计算和控制学院的毕业生、Adobe实习生Yicong Hong表示:“这种高容量模型和大规模训练数据的结合使得我们的模型具有很强的泛化能力，能够从各种测试输入中产生高质量的3D重建。”

据Hong介绍，早期的3D成像软件只在特定主题类别中表现良好，后来的图像生成进展是通过程序如DALL-E和Stable Diffusion实现的，它们利用了2D扩散模型的卓越泛化能力以实现多视图。然而，这些程序的结果仅限于预训练的2D生成模型。

其他系统利用每形状优化来取得令人印象深刻的结果，但根据Hong的说法，它们“通常缓慢且不切实际”。他指出，利用大规模数据的巨大变压器网络内的自然语言模型的发展激发了他的团队提出一个问题:“是否可能学习从单一图像重建对象的通用3D先验?”他们的答案是“是”。

“LRM可以从现实世界中捕获的各种图像以及由生成模型创建的图像中重建高保真度的3D形状。” Hong说道，“LRM也是下游应用的高度实用解决方案，因为它可以在仅五秒钟内生成一个3D形状，无需后期优化。”

该程序的成功在于其能够利用数百万图像参数的数据库，并预测神经辐射场（NeRF）。这意味着它能够仅基于2D图像生成逼真的3D图像，即使这些图像是低分辨率的。与之前的3D软件相比，该模型的突破性在于其快速、高效地生成高质量的3D图像，为增强现实、虚拟现实系统、游戏、影视动画和工业设计等领域带来了转变。

总的来说，LRM（Large Reconstruction Model）是一种用于从单张图像生成高保真度3D物体模型的模型。LRM通过采用大规模数据和高容量模型的组合，实现了从单张图像到3D模型的快速而准确的重建。以下是LRM的主要功能特色:

1. 快速生成:LRM能够在短短5秒内，从单张输入图像中生成高保真度的3D物体模型。
2. 大规模训练:与许多先前的方法不同，LRM采用了高度可扩展的基于transformer的架构，具有5亿个可学习参数，用于直接预测神经辐射场（NeRF）。
3. 数据多样性:模型以端到端的方式在包含大约100万个对象的大规模多视图数据上进行训练，包括Objaverse的合成渲染和MVImgNet的实际捕捉数据。
4.高通用性: 由于高容量模型和大规模训练数据的结合，LRM具有很强的通用性，能够从各种测试输入中生成高质量的3D重建，包括真实世界中的野外捕捉和生成模型的图像。

5. Transformer-Based架构:LRM采用了完全可微分的transformer-based编码器-解码器框架，通过预训练的视觉模型（DINO）对输入图像进行编码，使用大型transformer解码器通过交叉注意力将图像特征投影到3D三平面表示，然后通过多层感知器预测体积渲染的点颜色和密度。

项目页面:https://yiconghong.me/LRM/

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
Adobe图像生成AI “Firefly” 训练集中约有5%为AI图像

Adobe的图像生成AI“Firefly”以其训练集来源自AdobeStock中的图片和视频闻名。美国经济报纸彭博社报道称，Firefly的数据集实际上包含由Midjourney等公司生成的图像。”然，Tushnett教授指出，Firefly学习自Midjourney生成的图像的事实与其声称与其他图像生成AI不同的说法相矛盾。

Firefly Adobe AI头条
Spline发布3D生成工具AI 3D Generation 支持文/图生3D模型及混合编辑3D模型

Spline的最新3D生成工具的发布，标志着3D设计领域的一次重大进步。这款在线3D编辑工具不仅支持从文字和图片生成3D模型能够混合和编辑3D模型，为用户提供了一个全面强大的3D设计解决方案。这意味着用户可以始终接触到行业的最新趋势，并将这些新功能应用到自己的项目中，保持创作的前沿性和创新性。

3D模型 AI头条
Meta 推出 ViewDiff 模型：文本生成多视角 3D 图像

Meta与德国慕尼黑工业大学研发出创新模型ViewDiff，旨在帮助用户通过文本、图像或二者结合使用，快速生成高质量多视角3D图像。该模型解决了传统文本生成多视角3D图像领域的三大难点:无法生成真实背景环境、图像质量和多样性不理想、缺乏多视角和一致性。该模型的推出不仅在技术层面上具有重大意义，也将为未来的3D图像生成领域带来更多创新可能。

ViewDiff AI头条
Adobe发布新一代图像生成模型Firefly Image3，号称迄今为止最好

Adobe发布了Firefly图像生成模型的最新版本，名为FireflyImage3，声称具有“摄影细节”的图像生成能力。相比之前的版本，这一第三代模型在图像生成能力上有了显著的改进。即使是新手用户也可以在Photoshop中游刃有余，并更快地成为高级用户，PhotoshopgentechAI产品管理总监JohnMetzger表示。

Adobe FireflyImage3 AI头条
Garment3DGen：用衣服图片就能生成逼纹理效果的3D模型

研究人员提出了一种名为Garment3DGen的方法，旨在实现3D服装的风格化和纹理生成。该方法通过结合先进的计算机视觉技术和人工智能算法，为用户提供了一个简单高效的工具，用于实现服装设计的个性化风格化。随着这一技术的不断完善和推广，我们有理由相信，未来的服装设计将更加多样化和个性化。

Garment3DGen AI头条
Adobe Firefly3 模型更新！可垫图生成创成式填充强得离谱！

Adobe公司最近发布了全新的FireflyImage3Model。这款新模型在图像处理方面的能力大幅提升，包括改进的图形处理能力、更精准的文本提示解释，甚至能够指导图像的构图。无论是在图像处理能力、用户控制能力是对复杂提示的理解上，新模型都有显著的提升。

Firefly3 AI头条
GRM：只需少量图片，就能在0.1秒内创建3D模型

一款名为GRM的大型高斯重建模型引起了广泛关注。GRM是一种用于3D重建和生成的技术，通过有效整合多视角信息，它能够在极短的时间内重建出精确的3D模型。随着技术的不断发展，我们有理由相信，GRM将为3D建模技术的应用带来更多可能性。

GRM 3D模型 AI头条
Interactive3D：可直接通过交互操作指导3D模型生成

Interactive3D技术为3D内容的创造和修改提供了一种极其灵活的方法。用户可以直接通过交互操作来指导3D模型的生成，这一过程不仅直观具有高度的创造性。无论是专业的3D设计师还是业余爱好者，都能通过这一技术轻松实现自己的创意构想。

3D模型 AI头条
Adobe以每分钟3美元的价格购买视频，构建AI模型

Adobe公司最近开始采购视频，用于构建其人工智能文本到视频生成器，此举是为了在OpenAI展示出类似技术之后与竞争对手保持同步。该软件公司向其摄影师和艺术家网络提供报酬，以提交涉及人们进行日常活动或表达情感的视频，以及关于手、脚或眼睛等简单解剖部位的拍摄。OpenAI首席技术官米拉·穆拉蒂在上个月与华尔街日报的一段病毒式采访视频中表示，她不确定Sora是否是使用了来自谷歌的YouTube、以及MetaPlatformsInc.的Facebook和Instagram的用户生成视频进行训练的。

Adobe AI模型 AI头条
港大与浙大联合研发SC-GS模型鼠标拖拽实时可编辑3D重建

在数字资产创造和3D重建领域，香港大学CVMI实验室与3D大模型公司VAST以及浙江大学的联合研究团队提出了一项突破性成果——SC-GS模型。这一模型不仅在新视角合成领域掀起了革命性浪潮，更在动态场景的实时交互编辑方面展现了巨大潜力。他们期待在2024年看到更多基于高斯溅射技术的创新工作和探索。

SC-GS AI头条

今日大家都在搜的词：

热文

3 天
7天

Adobe研究人员研发新AI模型LRM：实现从2D样本瞬时生成3D图像

今日大家都在搜的词：

热文

站长商机