首页 > 业界 > 关键词  > Wild2Avatar最新资讯  > 正文

AI透视眼!Wild2Avatar可逼真渲染视频中被遮挡的人物

2024-01-04 14:50 · 稿源:站长之家

**划重点:**

1. 🚀 **挑战与解决方案**:面对现有研究在理想条件下渲染3D人物的局限性,Wild2Avatar专注于解决真实场景中摄像头视野被遮挡导致部分遮挡的问题。

2. 🔍 **创新方法**:通过场景参数化,将场景分解为遮挡、人物和背景三个部分,并利用神经辐射场分别建模人物和遮挡/背景,以实现对被遮挡人物的准确渲染。

3. 🌟 **实验验证**:通过在野外视频上的实验证明,Wild2Avatar方法在解决真实世界场景下的挑战方面取得显著成效。

在渲染移动人物的视觉外观时,面对摄像头视野被遮挡的问题是一项巨大的挑战。大多数现有研究在理想条件下渲染3D人物,要求场景清晰且无障碍。然而,在真实世界场景中,可能会有障碍物阻挡摄像头视野,导致人物出现部分遮挡,这使得这些传统方法无法应用。

image.png

为了解决这一问题,著名人工智能教授李飞飞团队推出了Wild2Avatar,这是一种专为视频中被遮挡人物设计的神经渲染方法。

研究团队提出了一种考虑遮挡的场景参数化方法,将整个场景分解为遮挡、人物和背景三个部分。此外,我们设计了广泛的客观函数,以帮助强化人物与遮挡、背景的分离,并确保对人物模型的完整性。我们通过在野外视频上进行实验证明了我们方法的有效性。

方法介绍:

为了实现逼真的呈现,该方法将场景参数化为三个部分:遮挡物 → 人 → 背景,并通过新颖的优化目标将这些渲染解耦。为了处理在真实世界场景中可能出现的遮挡情况,该方法引入了感知遮挡的场景参数化,将场景解耦为遮挡、人和背景三个部分。此外,该方法设计了广泛的客观函数,以帮助强化将人从遮挡和背景中解耦,并确保人体模型的完整性。

image.png

具体来说,方法使用了场景的自分解技术,通过倒置球面参数化的扩展,引入了感知遮挡的场景参数化。在这个参数化中,除了第一个由倒置球面参数化定义的球体外,引入了第二个内部球体,并将从摄像机到内部球体边缘的区域定义为遮挡区域。通过分开渲染这个区域,可以将遮挡与场景的其余部分解耦。为了确保对人的高保真和完整呈现,方法通过像素级光度损失、场景分解损失、遮挡解耦损失和几何完整性损失的组合来聚合三个渲染。

image.png

该方法的贡献包括:

  1. 引入了感知遮挡的场景参数化,将场景解耦为遮挡、人体和背景三个部分。
  2. 提出了一种新的渲染框架,分别渲染这三个部分,并设计了新颖的优化目标,以确保遮挡的清晰解耦和更完整的人体呈现。
  3. 在具有挑战性的遮挡密集野外视频上对方法进行了评估,展示了其在呈现遮挡人体方面的有效性。

Wild2Avatar通过与Vid2Avatar(基线)和原始视频的对比,呈现了其在解决被遮挡人物渲染挑战方面的独特性能。

项目体验网址:https://top.aibase.com/tool/wild2avatar

论文网址:https://arxiv.org/pdf/2401.00431.pdf

举报

  • 相关推荐
  • AI日报:阿里通义万相首尾帧生视频模型;豆包开源Seed智能体模型UI-TARS-1.5;OpenAI首发“智能体实践指南”

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里通义万相首尾帧生视频模型Wan2.1-FLF2V-14B开源阿里巴巴的通义实验室在Hugging Face和GitHub上开源了Wan2.1-FLF2V-14B模型,标志着AI视频生成技术的重大进步。该模型支持高清视频生成

  • AI日报:OpenAI下周或发布GPT-4.1系列;Pika全新AI视频功能Twists;商汤科技日日新V6震撼发布

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、报道称OpenAI下周重磅发布GPT-4.1系列,包含Mini版和Nano版OpenAI即将发布GPT-4.1系列及o3系列,标志着其在多模态和推理能力上的重大进展。新加坡在AI技能学习上投入的时间显著高于其他亚太国家,显示出其在AI人才培养方面的竞争力。

  • 腾讯“物种之AI全新升级 高效识别数千物种

    AI系统“物种类辨”通过少量数据学习,显著提升了对多种生物的识别准确率与召回率,尤其在高精度识别多类生物方面表现出色,推动生态保护与智能技术发展。腾讯开放平台“野生生物多态数据协作”项目助力野生动物监测及保护工作,促进公众科学参与。

  • 卡萨帝厨电Q1收入增31%,行业最快!Q2搭载AI产品全面上市

    海尔智家2025年一季度财报显示,公司实现营收791.2亿元(同比+10%),归母净利润54.9亿元(同比+15%)。其中卡萨帝厨电收入增长31%,增速领跑行业。这得益于其"让家电主动理解用户"的创新理念,通过AI之眼科技实现智能烹饪:自动识别食材、匹配最佳烹饪方案,解决传统烹饪需时刻盯火候的痛点。该技术还能智能防溢锅,自动调节火力。卡萨帝同步推出三翼鸟厨房改造服务,最快3小时完成定制化方案。未来将持续深耕高端智能厨电领域,引领智慧厨房新潮流。

  • 数势科技SwiftAgent 3.0发布 从智能分析到智能决策

    在全球数字化转型浪潮中,企业数据价值挖掘的瓶颈日益凸显:数据口径混乱、分析门槛高、决策链路长等问题导致大量数据资产“沉睡”。数势科技于今日正式发布SwiftAgent 3.0,基于DeepSeek R1/V3 大模型与行业领先的智能引擎,重构企业数据分析与决策范式,实现从“数据可视化”到“决策自动化”的跨越式升级。企业数据分析的三大核心痛点:数据孤岛与语义鸿沟跨部门数据

  • 镜舟科技基于 StarRocks 构建湖仓一体架构,支撑某大型电网企业国产化升级

    某大型电网企业联合镜舟科技与腾讯云,基于开源分析型数据库StarRocks及腾讯TBDS大数据平台,构建电力行业国产化湖仓一体架构。该项目实现PB级电力数据统一管理,解决数据链路复杂、资源瓶颈、高并发查询等五大挑战,查询性能提升近8600倍。方案采用分层架构:Flink实时数据处理层、TBDS数据湖存储层、StarRocks分析加速层及可视化应用层,完成全栈国产化适配验证,支持业务平滑迁移。通过统一元数据目录和实时入湖机制,形成完整数据处理闭环,为能源行业核心系统国产化升级提供可复制的技术范本。

  • 印度寺庙举行火行仪式:一信徒不慎摔入余烬中被烧身亡

    4月17日消息,据印度媒体近日报道,在泰米尔纳德邦一个寺庙节日期间,一名56岁的信徒在进行火行仪式时不慎掉入余烬堆中身亡。视频显示,这名信徒试图跑过余烬堆,但不慎摔倒,随后应急人员对他展开急救,然而终究回天乏术。资料显示,这项仪式是寺庙年度节日的一部分,开始于4月10日,信徒需赤脚踏过燃烧的炭火或余烬堆,以履行誓言并祈求祝福。据信,印度教中,

  • 离谱!美国AI购物应用被发现实际由菲律宾的人类员工操作

    美国司法部发布的新闻稿显示,人工智能购物应用Nate的创始人兼前首席执行官AlbertSaniger被指控通过‌虚假宣传AI技术‌骗取超4000万美元投资,导致投资者几乎全损。起诉书显示,Nate成立于2018年,Nate通过一个独特的定义性特征与其他电子商务公司和应用程序区分开来:利用人工智能技术,智能且快速地在所有电子商务网站上完成零售交易。这种欺骗不仅使无辜的投资者受害使资金从合法初创企业流失,使投资者对真正的突破持怀疑态度,并最终阻碍了人工智能的发展。

  • 华为鸿蒙PC搭载方舟图像引擎:像素级遮挡剔除 多窗无压力

    快科技5月8日消息,华为首款鸿蒙PC今日正式发布,其搭载方舟图形引擎,带来炫酷的视效体验。据介绍,方舟图形引擎基于方天视窗,高并行低负载统一渲染引擎,基于人因,交互优先,多窗重载依然流畅。传统方案中,窗口无序绘制,负载随窗口数量线性增加重载卡顿。而方舟图形引擎基于人因的窗口排序绘制,焦点窗口保证高帧率高负载稳定流畅。此外,方舟图形引擎支�

  • 周杰伦演唱会480元票只能看大屏:视线被遮挡

    4月23日消息,微博话题周杰伦演唱会480元票只能看大屏”冲上热搜榜第一名,引发关注。据媒体报道,今天中午,周杰伦2025嘉年华”世界巡回演唱会南宁站第三次开售,本次售卖包含前期退票和新增的特价大屏观演区。据了解,大屏观演区为视线遮挡区,售价380元到480元不等,尽管视线被遮挡,但这个区域的门票依然抢手,很快被抢购一空。值得注意的是,门票开售时,票务平台就视觉不良座位”进行了说明。对此,不少网友点赞,有瑕疵的座位区域低价售卖,写的很清楚,介意的可以不买。总体来看,这次主办方针对影响观看体验的区域告知消费者商品