首页 > 业界 > 关键词  > WHAM最新资讯  > 正文

突破性AI方法WHAM:精确有效地预测视频中3D人体运动

2023-12-15 16:03 · 稿源:站长之家

**划重点:**

1. 🌐 WHAM(World-grounded Humans with Accurate Motion)方法成功结合3D人体运动和视频背景,实现精准的全球坐标下3D人体运动重建。

2. 💡 该方法通过模型自由和基于模型的方法,利用深度学习技术,有效地从单眼视频中准确估计3D人体姿态和形状。

3. 🚀 WHAM在全球坐标系下取得了令人瞩目的成果,通过融合运动上下文和足地接触信息,最小化足滑动,提高国际协调性。

站长之家(ChinaZ.com)12月15日 消息:最新的研究中,卡内基梅隆大学(CMU)和马克斯·普朗克智能系统研究所的研究人员共同发布了一项名为WHAM(World-grounded Humans with Accurate Motion)的创新性AI方法。这一方法在精准性和效率方面实现了从视频中准确估计3D人体运动的突破。

3D人体运动重建是一个复杂的过程,涉及准确捕捉和建模人体在三维空间中的运动。当处理由移动摄像机在现实世界环境中拍摄的视频时,这一任务变得更加具有挑战性,因为这些视频通常包含脚滑等问题。然而,CMU和马克斯·普朗克智能系统研究所的研究人员通过WHAM方法成功解决了这些挑战,实现了精准的3D人体运动重建。

image.png

从图像中恢复3D人体姿势和形状的两种方法:无模型和基于模型。它强调了在基于模型的方法中使用深度学习技术来估计统计身体模型的参数。现有的基于视频的3D人体姿势估计方法通过各种神经网络体系结构引入时间信息。一些方法使用额外的传感器,如惯性传感器,但它们可能会产生侵扰。WHAM通过有效地结合3D人体运动和视频上下文,利用先验知识,并在全球坐标系中准确重建3D人体活动而脱颖而出。

image.png

该研究解决了从单眼视频中准确估计3D人体姿势和形状的挑战,强调了全球坐标一致性、计算效率和真实足地接触。利用AMASS运动捕捉和视频数据集,WHAM结合了运动编码器-解码器网络,用于将2D关键点转换为3D姿势,具有用于时间线索的特征整合器,以及用于全局运动估计考虑足地接触的轨迹细化网络,提高了在非平面表面上的准确性。

WHAM采用单向RNN进行在线推断和精确的3D运动重建,具有用于上下文提取的运动编码器和用于SMPL参数、相机平移和足地接触概率的运动解码器。利用边界框归一化技术有助于运动上下文的提取。在人体网格恢复的预训练图像编码器通过特征整合器网络捕捉和整合图像特征与运动特征。轨迹解码器预测全局方向,而细化过程最小化足滑动。在合成AMASS数据上进行训练,WHAM在评估中优于现有方法。

image.png

WHAM超越了当前的最先进方法,在逐帧和基于视频的3D人体姿势和形状估计中表现出卓越的准确性。通过利用运动上下文和足地接触信息实现了精确的全球轨迹估计,最小化了足滑动,并提高了国际协调性。该方法整合了2D关键点和像素的特征,提高了3D人体运动重建的准确性。在野外基准测试中,WHAM在MPJPE、PA-MPJPE和PVE等指标上展现出卓越的性能。轨迹细化技术进一步提升了全局轨迹估计,并通过改善的误差指标证明了减少足滑动的效果。

总的来说,这项研究的主要观点可以总结为以下几点:

1. WHAM引入了一种结合3D人体运动和视频背景的开创性方法。

2. 该技术增强了3D人体姿势和形状的回归。

3. 该方法使用了一个全球轨迹估计框架,包括运动上下文和足地接触。

4. 该方法解决了足滑动的问题,并确保在非平面表面上准确跟踪3D运动。

5. WHAM的方法在包括3DPW、RICH和EMDB在内的多样化基准数据集上表现出色。

6. 该方法在全球坐标系中实现了高效的人体姿势和形状估计。

7. 该方法的特征整合和轨迹细化显著提高了运动和全局轨迹的准确性。

8. 通过深入的剖析研究,验证了该方法的准确性。

论文网址:https://arxiv.org/abs/2312.07531

项目网址:https://wham.is.tue.mpg.de/

举报

  • 相关推荐
  • 日销破千元!AI生成的3D梗图挂件,被我们卖爆了

    先说结论:我们花15天做的AI3D挂件,在线下卖爆了,单日营收破千元!故事的开始,是因为我们发现把AI3D打印手办做成一门小生意的可行性越来越高,这也激发了我们的“搞钱基因”。再加上前不久新榜在上海举办了「新榜内容节」,一拍即合,我们于是做了一批模型去大会现场摆摊试水!最后结果还不错,单日最高收入突破1000元,是我们“创业史”上的一个高光表现。欢迎大家

  • 聚焦“AI+运动康复”,iRest艾力斯特引领运动健康科学新纪元

    2025年3月21日,iRest艾力斯特在温州召开"AI+康复与产学研融合创新高峰论坛暨经销商大会"。大会聚焦"科技赋能健康"主题,汇聚全球顶尖专家探讨AI技术与运动康复的深度融合,发布多项创新成果与未来战略规划。公司通过AI技术构建智能康复体系,推出搭载多模态监测系统的高端产品,并与多所高校共建研发中心。近年来,艾力斯特持续深耕运动健康领域,签约�

  • 聚首华南,2025下半年增材制造、3D 打印的顶尖展览与活动推荐

    2025年全球3D打印行业将迎来系列盛会。4月西安论坛成功举办后,下半年将迎来深圳Formnext Asia(8月26-28日)、东京论坛(9月25-26日)和法兰克福Formnext展会(11月18-21日)三大国际活动。这些平台将汇聚全球顶尖企业,展示航空航天、医疗健康、汽车工业等领域的最新技术成果,特别关注中国企业的快速成长。法兰克福展会预计吸引超900家展商,中国展商数量有望再创新高。系列活动将搭建全球产业交流平台,推动3D打印技术创新与商业应用深度融合。

  • 10倍精度升级!腾讯混元3D模型v2.5版本发布

    腾讯混元3D模型升级至v2.5版本,建模精度和贴图真实度显著提升。新版本参数体量从1B增至10B,有效面片数增加超10倍,支持1024几何分辨率。纹理系统支持4K高清贴图和凹凸细节,率先支持多视图生成PBR模型。针对动画场景优化骨骼蒙皮系统,支持非标准姿态自动绑定。新增文生/图生3D减面模型、多视图建模模板等专业工作流。混元3D v2.5已全面更新至腾讯AI创作引擎,免费生成额度提升至每日20次,并正式上线腾讯云API面向企业开放。GitHub开源版本累计Star超1.2万。

  • ​上海毅速推出第三代模具3D打印专机E3系列,引领模具制造技术革新

    导读:近年来,金属3D打印技术在模具制造领域得到了广泛的应用,模具行业正在迎来一场前所未有的技术变革,随着应用的逐渐深入,模具专用的金属3D打印机应运而生。2025 年 4 月 15 日,上海毅速激光科技有限公司(以下简称“毅速”)正式发布了其第三代模具3D打印专机系列——E3- 420 和E3-520。这一新品的推出,标志着模具制造行业向增材制造迈出了重要一步。毅速E3- 420 �

  • 韶音成为伦敦马拉松官方唯一指定运动耳机,以开放聆听助力跑者突破极限

    4月27日,伦敦马拉松激情开跑,全球领先的开放式耳机品牌Shokz韶音正式成为2025年赛事官方唯一指定运动耳机。作为世界马拉松大满贯赛事之一,本届比赛吸引了包括奥运冠军塔米拉特·托拉、半马世界纪录保持者基普里莫等顶尖选手参赛。韶音不仅打造了专属助威区,还推出联名快闪店,其开放式耳机技术让跑者在享受音乐的同时保持环境感知,兼顾运动安全。此次合作进一步巩固了韶音在专业运动耳机领域的领先地位,传递"开放聆听"的运动理念。

  • 曝iPhone 18 Pro内测屏下3D人脸识别:苹果迈入单挖孔屏时代

    这意味着iPhone 18 Pro系列正式迈入单挖孔屏时代,向安卓主流屏幕形态看齐。需要注意的是,安卓阵营普遍采用单挖孔 屏幕指纹识别方案,而iPhone则是采用屏下3D人脸识别方案,不支持屏幕指纹。

  • 创想三维十一周年庆典:多款新品发布,共筑3D打印新生态

    4月9日,全球消费级3D打印领军品牌创想三维在中国深圳、美国底特律两地举办“创想三维十一周年庆典暨春季新品发布会”。公司联合创始人陈春、敖丹军、刘辉林、唐京科与来自全球的行业专家、核心经销商合作伙伴、供应链合作伙伴及媒体代表共同见证品牌里程碑时刻。创想三维将持续加码核心技术创新,通过技术突破、生态共建与用户共创,持续推动3D打印技术从“小�

  • 可灵AI开启视频生成2.0时代!全球用户数已突破2200万

    4 月 15 日,快手可灵AI在北京中关村国际创新中心举行“灵感成真”2. 0 模型发布会,宣布基座模型再次升级,面向全球正式发布可灵2. 0 视频生成模型及可图2. 0 图像生成模型。

  • 薛志强博士深度解读塑妍萃优势,面部抗衰迎来新突破

    2025年4月15日,全球专业皮肤学公司高德美宣布旗下聚左旋乳酸填充剂塑颜缇在中国全面上市。该产品具有25年安全使用验证,已在全球60个国家获批,拥有同类产品中最多的临床研究文献和最长的安全使用记录。北京俊泰医疗总院长薛志强博士作为塑颜缇首发导师级机构代表出席盛会,分享医美再生材料的前沿应用与临床经验。数据显示中国医美市场抗衰需求持续攀升,30-55岁女性中超90%关注颜值管理。塑颜缇独有的PLLA-SCA微粒能刺激胶原蛋白生成,实现紧致提升、容量恢复与肤质改善三重功效。薛博士指出,该产品是再生领域唯一获美国FDA批准的材料,其精准注射技术可最大化发挥产品优势,为中国求美者提供更安全长效的抗衰解决方案。

热文

  • 3 天
  • 7天