首页 > 业界 > 关键词  > Meta最新资讯  > 正文

Meta AI提出视频抠图新方法OmnimatteRF:结合动态2D前景图层和3D背景模型

2023-09-20 09:54 · 稿源:站长之家

要点:

  • 马里兰大学和Meta AI研究人员提出视频抠图新方法OmnimatteRF,同时利用2D前景图层和3D背景模型。

  • 2D前景图层记录运动物体及影响,3D背景模型适用于复杂几何和非旋转摄像运动,扩展适用视频种类。

  • 在两个视频数据集上,与先前方法相比,该方法取得更好表现,无需每个视频单独参数调整。

站长之家(ChinaZ.com)9月20日 消息:Omnimatte是迄今为止最有前景的视频抠图方法。它使用单应性建模背景,因此只适用于背景为平面或仅有旋转运动的视频。D2NeRF通过独立建模场景的动态和静态成分,使用两个辐射场来解决这个问题。它在复杂的大范围运动场景中表现强劲,不需要任何遮挡输入,完全自监督。但是如何融合视频中的2D guidance尚不清楚。

image.png

项目地址:https://github.com/facebookresearch/OmnimatteRF

马里兰大学和Meta AI的最新研究提出一种集两者优点于一体的方法,使用3D背景模型与2D前景层。2D前景层表示难以用3D建模的物体、动作和效果。3D背景建模可以处理复杂几何形状和非旋转摄像机运动,扩展适用的视频种类。该方法称为OmnimatteRF。在两个视频数据集上的实验表明,它在各种视频上都有出色表现,无需针对每个视频调参。

OmnimatteRF能够分离前景中的主体部分和背景场景。它使用二维层保留主体的细节,同时利用三维背景模型对复杂场景进行重建。相比仅使用二维图像层表示视频背景的方法,三维建模极大地提升了对真实世界视频的适应能力。

该方法首先使用传统视频遮罩技术分离出动态的前景层。然后,利用这些遮罩结果和单目深度估计,训练一个表征背景的神经辐射场模型TensoRF。最后,将动态前景层和静态三维背景模型联合,重建复杂的真实场景。

研究者在各类真实视频上进行了大量试验,结果证明相比仅使用二维层的方法,OmnimatteRF能够得到更优质的重建效果。该技术对视频制作专业人员具有重要应用价值,可用于拍摄的影片中添加有趣的效果。同时,它也可助力构建沉浸式的虚拟环境。

举报

  • 相关推荐
  • 苹果19年老将跳槽!iOS 26液态玻璃创造者被Meta挖走

    苹果公司用户界面设计灵魂人物、任职19年的资深高管Alan Dye正式宣布将于12月31日加入Meta,出任Reality Labs首席设计官。 作为iOS 26液态玻璃”视觉体系、Vision Pro交互界面及iPhone X全面屏体验的核心缔造者,他的出走被视为苹果自Jony Ive离任后最重大的设计人才流失。 据悉,Dye自2015年起执掌苹果人机界面(HCI)团队,主导了iOS、macOS、watchOS及visionOS近十年来的所有重大视觉革新�

  • AI日报:Meta开源可交互3D模型SAM 3D;联想将推出个人超级智能体;华纳音乐与 Udio 达成版权和解

    火山引擎在Gartner AI平台魔力象限中位列中国第一、全球第五,其模型-工具-算力-场景闭环优势显著。OpenAI为美国K-12教师推出免费ChatGPT工具,助力教学准备与AI技术应用。谷歌地图集成Gemini模型,新增行程规划、地标导航等AI功能。联想计划推出个人超级智能体,对AI发展持乐观态度。华纳音乐与Udio达成和解,将于2026年推出AI音乐创作平台。QQ浏览器升级AI小窗与语音朗读功能。Meta开源SAM 3D模型,可实现单图生成交互式3D资产。Prime Video推出AI视频回顾功能,自动生成剧集精华片段。

  • 火山引擎分享Data Agent评测体系,提出“评估驱动开发”新范式

    字节跳动数据平台在AICon大会上分享了其Data Agent自动化评测技术。面对大模型在数据行业应用广泛但评估标准不一的挑战,团队提出覆盖技术选型、研发迭代至业务验证的“三层评测框架”,并倡导以“评估驱动开发”新范式推动大模型在数据分析等领域的深度赋能。针对Text-to-SQL等核心任务,团队创新采用基于“语义等价”的自动化评测方法,通过Apache Calcite将SQL转换为抽象语法树,结合图匹配网络计算逻辑相似度,显著提升评估可靠性。未来自动化评测将更注重线上线下一致性、多模态能力覆盖及与模型训练的深度结合,推动大模型应用更精准高效地创造业务价值。

  • AI日报:Medeo AI新版视频Agent上线:OpenAI正式发布GPT-5.2;钉钉AI功能大升级

    本期AI日报聚焦多款AI产品更新:Medeo AI新版视频Agent支持自然语言一键改剧本,降低创作门槛;钉钉8.1.10将AI融入职场沟通,提升效率;OpenAI低调上线GPT-5.2,延迟显著降低,逻辑一致性提升,并推出支持私有化部署的成人模式;迪士尼投资100亿美元与OpenAI合作,推动IP在生成式AI中的创新应用;谷歌Gemini Deep Research开放API,供开发者构建研究应用;Cohere推出Rerank 4,上下文窗口扩展至32K,提升企业搜索精度;拓竹科技推出3D手办生成器“印你”,依托腾讯混元3D模型,简化3D建模流程;谷歌NotebookLM升级,为Ultra会员提供更高权限,优化智能笔记体验。

  • MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这

    文章报道了MEET2026智能未来大会盛况,聚焦AI向AGI演进的关键趋势。大会汇聚产业、学术、投资界代表,探讨了以DeepSeek为代表的世界模型开启AGI之路,以及“Agent元年”下具身智能、AI终端等热点。多位专家分享了核心观点:AI正从生成式向智能体演进,未来5-10年基础大模型将收敛至不超过10个,智能体互联网时代将到来;企业需构建“模型-终端-数据”商业闭环,通过人机协作实现智能体落地;开源生态与硬件基础设施是AI发展关键。圆桌讨论指出,Agent技术已在客服等场景验证价值,但全面革新仍面临数据、场景与组织协同挑战,需技术与行业深度共创。

  • 报名开启 | 「2025 Meet・未来系列活动:全球AI前瞻者大会」顶尖专家共探技术与产业新局

    12月16日,中关村东升科技园将举办“未来系列”活动,聚焦AI体系化落地关键节点,探讨行业治理与伦理等核心议题。活动汇聚领军专家、科创先锋等多方力量,共研“AI+”价值落地路径,旨在夯实中国AI全球竞争力。亮点包括:全球前沿视角探讨AI从单点突破到体系化落地;高端对话平台促进产学研深度交流;聚焦AI与实体经济融合的价值创造;立足国内“AI+”战略推进现状,链接全球产业动态。活动面向科技企业创始人、高管、科创创业者、投资人及行业研究者等,席位有限。

  • 微星发布十周年限定MEG X870E GODLIKE X EDITION超神主板,全球限量1000片

    微星推出MEG X870E GODLIKE X EDITION超神主板,纪念GODLIKE系列十周年。该限量版全球仅1000块,每块带独立编号,彰显收藏价值。主板延续高规格配置,支持AMD锐龙9000系列处理器超频,配备24+2+1相供电、双8Pin接口,内存支持DDR5 9000+MT/s。扩展性强大,板载5个M.2插槽,另附扩展卡可增至7个NVMe设备。散热系统全面升级,采用第二代磁吸式M.2冰霜铠甲与扩展型散热设计。网络方面搭载万兆+5G双有线网卡与Wi-Fi 7。随主板附赠限量版M.2冰霜铠甲、收藏支架等赠品。首发售价8888元,提供“超神”专属终身质保。

  • 科杰科技位列赛迪数据智能领导者象限,打造Data&AI数据基础设施新范式

    赛迪顾问发布《2025中国数据智能市场研究报告》,指出在AI技术突破背景下,数据与智能双向赋能趋势显著。报告显示,2024年中国数据智能市场规模达2586亿元,同比增长43.2%,Data&AI一体化融合成为主流。科杰科技凭借在AI原生数据基础设施领域的全栈自研能力、关键行业深度落地成果及前瞻性实践,位列“领导者象限”。报告强调,新一代数据智能平台正朝着Data&AI一体化方向演进,科杰科技打造的KeenData Lakehouse平台,通过“可信+智能+系统”能力推进“Data&AI”新基建,支撑大型组织从数据驱动迈向智能驱动。

  • TME们的黄金时代,迎来AI终结者

    过去十年,中国与全球的音乐流媒体平台都在同一套逻辑下运行:依赖庞大的版权曲库、依赖订阅制、依赖“以版权为护城河”的内容供给方式,稳稳地坐在产业链的中心位置。 无论是 TME,还是网易云,平台之间的竞争从本质上都不是产品之争,而是版权之争——谁拥有更完整的曲库、谁能锁定更多独家资源,谁就拥有更牢固的用户粘性。 然而,随着AI音乐过去一年里爆发式

  • AI日报:可灵Avatar 2.0 上线;谷歌推出Gemini 3 Deep Think模式;阿里云析言 XiYan-SQL 强势夺冠

    本期AI日报聚焦多项AI技术突破:Kling AI Avatar 2.0上线,实现数字人表情动作智能生成;谷歌推出Gemini 3 Deep Think模式,显著提升AI推理能力;微软发布轻量级实时语音模型VibeVoice 0.5B;OpenAI最强编码模型GPT-5.1-CodexMax全面接入API;阿里云“析言 XiYan-SQL”在SQL诊断评测中夺冠。此外,豆包助手调整AI操作能力,谷歌将展示Android XR平台更新。

今日大家都在搜的词: