首页 > 业界 > 关键词  > 英伟达最新资讯  > 正文

趣AI | 英伟达推新AI技术,轻松将2D照片转换成可编辑的3D图像

2022-06-22 15:29 · 稿源:站长之家

站长之家(ChinaZ.com)6月22日 消息:英伟达再次尝试利用人工智能技术丰富普通2D图片的内容深度。在将2D 图像转换为3D场景、模型和视频后,该公司将重点转向了编辑功能。

这家 GPU 巨头日前推出了一种新的AI技术——3D MoMa,可以将静态照片转换为创作者可以轻松修改的3D 对象。

据介绍,这项被AI技术可以让游戏工作室实现轻松修改图像和场景的工作。3D MoMa 通过反向渲染加速了任务。这个过程中,主要使用人工智能分析静止图像进而估计场景的物理属性,包括几何结构、光照等。然后再将这些图片构建成为逼真的3D形式。

Nvidia 图形研究副总裁 David Luebke 将这项技术描述为“一个将计算机视觉和计算机图形结合在一起的圣杯”。Lubeke说:“通过将每一个反向渲染问题作为gpu加速可微组件来制定,NVIDIA3D MoMa渲染管道通过使用现代AI机器和NVIDIA gpu的原始计算能力实现快速生成3D对象,创造者可以在现有工具中不受限制地导入、编辑和扩展。”

3D MoMa 将对象生成为三角形网格——一种让广泛使用的工具可以直接编辑的格式。这些模型是在单个英伟达Tensor Core GPU上一个小时内创建的。

然后不同属性的材质可以像皮肤一样覆盖在网格上。还可以预测场景的照明,这使得创作者可以修改材质属性获得物体不同实现效果。

image.png

英伟达本周在新奥尔良举行的计算机视觉和模式识别会议(CVPR) 上展示了3D MoMa。为了向爵士乐的发源地致敬,英伟达的研究人员使用3D MoMa技术在视觉上呈现这种音乐类型。

image.png

该团队首先收集了数百张小号、长号、萨克斯管、鼓和单簧管的图片。接着就是使用3D MoMa 将图像重建为3D 形式。然后对这些乐器进行编辑并赋予新材料。例如,廉价的塑料材质小号变成了奢华的黄金材质。

然后,经过编辑的乐器就可以放入任何虚拟场景中。下图为,英伟达将创建的3D乐器模型放置在各种虚拟场景中的效果。

image.png

该公司表示,所有的乐器都能像在现实世界中一样对光线做出反应,比如铜管乐器会反射光线,而鼓皮则会吸收光线。最后,还可以使用3D MoMa技术在动画场景中渲染3D 对象。

目前,3D MoMa仍在开发中,但英伟达认为它可以让游戏开发者和其他设计师快速修改3D对象,然后将它们添加到任何虚拟场景中。这也可以让我们更容易接近元宇宙状态。

注:图片均来自英伟达官方YouTube视频截图。

举报

  • 相关推荐
  • MonoXiver:AI算法将2D照片转换3D

    MonoXiver是北卡罗莱纳州立大学刘贤鹏团队开发的一种利用AI从二维图片中提取三维信息的方法。它只需要一个普通的单目摄像头,就可以构建相机周围可靠的三维地图。除自动驾驶外,这种AI方法也可应用于其他领域,如机器人、环境监测、医学成像等。

  • 好莱坞演员继续罢工 抗议AI3D扫描技术

    好莱坞演员继续罢工,对抗AI技术的增长和使用,并声援“NOFAKESACT”法案。好莱坞编剧罢工已经结束,并获得了对剧本中的AI保护措施,但对于演员来说,情况却并不乐观。包括MoveAI在内的初创公司正在开发可以使用单部智能手机的AI驱动的3D运动捕捉技术,这将大大降低成本和所需资源。

  • Meta AI提出视频抠新方法OmnimatteRF:结合动态2D前景层和3D背景模型

    Omnimatte是迄今为止最有前景的视频抠图方法。它使用单应性建模背景,因此只适用于背景为平面或仅有旋转运动的视频。它也可助力构建沉浸式的虚拟环境。

  • SyncDreamer:从单视图图像生成多视一致图像以实现3D重建

    3D生成领域经历了迅猛的进展,其中一个备受瞩目、在GitHubRepo上广受欢迎的项目备受关注。这个项目被认为是最为稳定和通用的,用户只需提供一张图像,模型就能自动合成多个视图并生成相应的3D模型。SyncDreamer生成的图像可以用于高质量的3D重建。

  • 3D视角洞悉矩阵乘法,这就是AI思考的样子

    如果能以3D方式展示矩阵乘法的执行过程,当年学习矩阵乘法时也就不会那么吃力了。矩阵乘法已经成为机器学习模型的构建模块,是各种强大AI技术的基础,了解其执行方式必然有助于我们更深入地理解这个AI以及这个日趋智能化的世界。下面的可视化显示了一个注意力头,其权重张量wQ、wK_t、wV、wO被低秩分解wQ_A@wQ_B等替换。

  • 报道称欧盟对英伟达AI芯片展开调查:或涉嫌“反竞争”行为

    欧洲最近开始对英伟达在AI芯片市场的市场支配地位展开调查,引发了业界的广泛关注。法国反垄断机构已经对英伟达的法国办事处进行了搜索,旨在确定该公司是否涉及非法垄断行为。如果调查结果证实了这一行为,英伟达可能会面临巨额罚款,这将对公司的未来产生重大影响。

  • WriteHuman:绕过AI检测,将AI生成内容转换成人类书写内容

    由于人工智能的发展,AI生成的文本在很多领域都被大量应用了。但我们同样也有了一些担心,比如内容真实性和原创性。在数字时代,让WriteHuman帮助你重定义AI内容的可能性。

  • 英伟达取消原定10月15日在以色列举行的 AI 峰会

    英伟达宣布取消原定在以色列举行的AI峰会,这一决定是由于巴以冲突的影响。尚未确定是否会重新安排这一活动或采取替代方案,特别是关于主题演讲是否会录制或直播。尽管情况尚不明朗,但这也反映出地缘政治紧张局势对全球科技活动的影响。

  • Auctoria利用生成AI创建3D视频游戏模型

    波兰虚拟现实游戏开发公司CarbonStudio的联合创始人AleksanderCaban多年前观察到现代游戏设计中存在一个重要问题:手动创建视频游戏环境中的基本元素,如岩石、山丘、路径等,通常是耗时且繁琐的过程。为了解决这个问题,Caban决定开发技术来自动化这个过程。我们的团队两年前开始开发这个工具,使我们能够拥有一个可供使用的产品。

  • 3D领域的Midjourney?Luma AI助您捕捉真实之美

    LumaAI是一款革命性的3D捕捉技术,具备无与伦比的光线和反射效果。它使未来的视觉效果技术可用于每个人,无论是专业人士还是普通用户。这将彻底改变游戏开发、虚拟现实和影视行业的创作方式。

今日大家都在搜的词: