Meta AI提出视频抠图新方法OmnimatteRF:结合动态2D前景图层和3D背景模型

2023-09-20 09:54 · 稿源：站长之家

要点:
马里兰大学和Meta AI研究人员提出视频抠图新方法OmnimatteRF，同时利用2D前景图层和3D背景模型。
2D前景图层记录运动物体及影响，3D背景模型适用于复杂几何和非旋转摄像运动，扩展适用视频种类。
在两个视频数据集上，与先前方法相比，该方法取得更好表现，无需每个视频单独参数调整。

站长之家（ChinaZ.com）9月20日消息:Omnimatte是迄今为止最有前景的视频抠图方法。它使用单应性建模背景，因此只适用于背景为平面或仅有旋转运动的视频。D2NeRF通过独立建模场景的动态和静态成分，使用两个辐射场来解决这个问题。它在复杂的大范围运动场景中表现强劲，不需要任何遮挡输入，完全自监督。但是如何融合视频中的2D guidance尚不清楚。

项目地址:https://github.com/facebookresearch/OmnimatteRF

马里兰大学和Meta AI的最新研究提出一种集两者优点于一体的方法，使用3D背景模型与2D前景层。2D前景层表示难以用3D建模的物体、动作和效果。3D背景建模可以处理复杂几何形状和非旋转摄像机运动，扩展适用的视频种类。该方法称为OmnimatteRF。在两个视频数据集上的实验表明，它在各种视频上都有出色表现，无需针对每个视频调参。

OmnimatteRF能够分离前景中的主体部分和背景场景。它使用二维层保留主体的细节，同时利用三维背景模型对复杂场景进行重建。相比仅使用二维图像层表示视频背景的方法，三维建模极大地提升了对真实世界视频的适应能力。

该方法首先使用传统视频遮罩技术分离出动态的前景层。然后，利用这些遮罩结果和单目深度估计，训练一个表征背景的神经辐射场模型TensoRF。最后，将动态前景层和静态三维背景模型联合，重建复杂的真实场景。

研究者在各类真实视频上进行了大量试验，结果证明相比仅使用二维层的方法，OmnimatteRF能够得到更优质的重建效果。该技术对视频制作专业人员具有重要应用价值，可用于拍摄的影片中添加有趣的效果。同时，它也可助力构建沉浸式的虚拟环境。

（举报）

相关推荐
大家在看

关键词：

Meta

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
Meta悄然发布Llama 2 Long AI模型

Meta最近发布了Llama2LongAI模型，该模型在一些任务上超越了GPT-3.5Turbo和Claude2。通过改进训练方法和编码技术，Meta的研究人员提高了这个AI模型的性能，使其能够更好地处理长文本和复杂任务。强调了合作的重要性，指出不是每个企业都拥有高级的数据工程和数据科学技能，因此需要与具有相关技术和深刻了解整个领域的合作伙伴合作来解决这一问题。

Meta
MonoXiver:新AI算法将2D照片转换为3D地图

MonoXiver是北卡罗莱纳州立大学刘贤鹏团队开发的一种利用AI从二维图片中提取三维信息的方法。它只需要一个普通的单目摄像头，就可以构建相机周围可靠的三维地图。除自动驾驶外，这种AI方法也可应用于其他领域，如机器人、环境监测、医学成像等。

MonoXiver
Auctoria利用生成AI创建3D视频游戏模型

波兰虚拟现实游戏开发公司CarbonStudio的联合创始人AleksanderCaban多年前观察到现代游戏设计中存在一个重要问题:手动创建视频游戏环境中的基本元素，如岩石、山丘、路径等，通常是耗时且繁琐的过程。为了解决这个问题，Caban决定开发技术来自动化这个过程。我们的团队两年前开始开发这个工具，使我们能够拥有一个可供使用的产品。

Auctoria AI视频
Meta研究人员提出轻量级微调方法RA-DIT 以增强语言模型知识检索能力

Meta的研究人员提出了一种名为检索增强双指令调优的新型人工智能方法，用于提升语言模型的知识检索能力。该方法试图解决大型语言模型在捕获较为冷门知识时的局限性以及大规模预训练的高计算成本问题。该研究证明了轻量级指令调优对检索增强语言模型的有效性，特别是在涉及大规模外部知识源的场景中。
Meta 斥巨资打造明星AI数字人

Meta最近宣布将在名人AI领域投入巨资，以打造名人AI双胞胎。根据TheInformation的一份报道，Meta公司已经签下了一位顶级创作者，为其提供了高达500万美元合同，合同期限为两年，包括六小时的工作时间。这也可能鼓励其他科技巨头进一步投资类似的项目。

Meta AI数字人 AI头条
荐AI视野：Adobe发布新一代AI生成模型Firefly Image2；Meta发布Llama2-Long模型；TikTok支持从AI应用直接发布内容；Opera浏览器推出升级版的AI工具Aria

今天凌晨，Adobe甩出AdobeFirefly创意生成式AI模型系列中的三个主要新模型:AdobeFireflyImage2、FireflyVectorModel和FireflyDesignModel。在线体验地址:PS在线体验地址:https://photoshop.adobe.com/discoverIllustrator体验地址:https://www.adobe.com/hk_zh/products/illustrator/generative-recolor.htmlMeta再放「长文本」杀器Llama2-LongMeta发布Llama2-Long模型，可高效处理长文本，降低计算需求40%，采用创新策略，提升性能，领先自�

Adobe
Meta提出CoVe提示工程方法减少ChatGPT等聊天机器人幻觉问题

MetaAI研究人员提出了一种新的基于提示的方法，称为链式验证，可显著减少ChatGPT等语言模型产生的错误信息。ChatGPT和其他语言模型会重复复制不正确的信息，即使它们已经学到了正确的信息。总Meta的研究为减少类似ChatGPT等对话系统中的错误信息提供了新的思路。

CoVe 提示工程 Meta
Meta发布Llama 2-Long模型处理长文本计算量需求减少40%

Meta最新发布的Llama2-Long模型引领着处理长文本的革命。这个模型不仅处理长文本输入在不显著增加计算需求的情况下，保持了卓越性能。它不仅改进了处理长文本的性能通过创新策略为该领域注入了新的活力。

Meta AI头条
开放模型权重被指将导致AI失控，Meta遭举牌抗议，LeCun：开源AI社区如火如荼

AI尤其是大模型时代的开源与闭源，有利有弊，重要的是如何在使用的过程中做好文章。人们在AI领域的开源与闭源选择上存在着分歧在大模型时代，开源这股强大的力量已经悄然崛起。关于开源与闭源的分歧会一直延续下去，但开源已经无法阻挡。

开源
Meta悄然发布Llama 2 Long AI，在某些任务上击败GPT-3.5 Turbo和Claude 2

MetaPlatforms在9月29日发布了一篇计算机科学论文，介绍了其新发布的Llama2LongAI模型。该模型在某些任务上击败了GPT-3.5Turbo和Claude2，这表明Meta的开源方法在生成人工智能领域取得了重大进展。该模型的开源性也表明，开源方法在这一领域具有竞争力。

Meta Llama2 AI头条

今日大家都在搜的词：

热文

3 天
7天

Meta AI提出视频抠图新方法OmnimatteRF:结合动态2D前景图层和3D背景模型

今日大家都在搜的词：

热文

站长商机