首页 > 业界 > 关键词  > WHAM最新资讯  > 正文

突破性AI方法WHAM:精确有效地预测视频中3D人体运动

2023-12-15 16:03 · 稿源:站长之家

**划重点:**

1. 🌐 WHAM(World-grounded Humans with Accurate Motion)方法成功结合3D人体运动和视频背景,实现精准的全球坐标下3D人体运动重建。

2. 💡 该方法通过模型自由和基于模型的方法,利用深度学习技术,有效地从单眼视频中准确估计3D人体姿态和形状。

3. 🚀 WHAM在全球坐标系下取得了令人瞩目的成果,通过融合运动上下文和足地接触信息,最小化足滑动,提高国际协调性。

站长之家(ChinaZ.com)12月15日 消息:最新的研究中,卡内基梅隆大学(CMU)和马克斯·普朗克智能系统研究所的研究人员共同发布了一项名为WHAM(World-grounded Humans with Accurate Motion)的创新性AI方法。这一方法在精准性和效率方面实现了从视频中准确估计3D人体运动的突破。

3D人体运动重建是一个复杂的过程,涉及准确捕捉和建模人体在三维空间中的运动。当处理由移动摄像机在现实世界环境中拍摄的视频时,这一任务变得更加具有挑战性,因为这些视频通常包含脚滑等问题。然而,CMU和马克斯·普朗克智能系统研究所的研究人员通过WHAM方法成功解决了这些挑战,实现了精准的3D人体运动重建。

image.png

从图像中恢复3D人体姿势和形状的两种方法:无模型和基于模型。它强调了在基于模型的方法中使用深度学习技术来估计统计身体模型的参数。现有的基于视频的3D人体姿势估计方法通过各种神经网络体系结构引入时间信息。一些方法使用额外的传感器,如惯性传感器,但它们可能会产生侵扰。WHAM通过有效地结合3D人体运动和视频上下文,利用先验知识,并在全球坐标系中准确重建3D人体活动而脱颖而出。

image.png

该研究解决了从单眼视频中准确估计3D人体姿势和形状的挑战,强调了全球坐标一致性、计算效率和真实足地接触。利用AMASS运动捕捉和视频数据集,WHAM结合了运动编码器-解码器网络,用于将2D关键点转换为3D姿势,具有用于时间线索的特征整合器,以及用于全局运动估计考虑足地接触的轨迹细化网络,提高了在非平面表面上的准确性。

WHAM采用单向RNN进行在线推断和精确的3D运动重建,具有用于上下文提取的运动编码器和用于SMPL参数、相机平移和足地接触概率的运动解码器。利用边界框归一化技术有助于运动上下文的提取。在人体网格恢复的预训练图像编码器通过特征整合器网络捕捉和整合图像特征与运动特征。轨迹解码器预测全局方向,而细化过程最小化足滑动。在合成AMASS数据上进行训练,WHAM在评估中优于现有方法。

image.png

WHAM超越了当前的最先进方法,在逐帧和基于视频的3D人体姿势和形状估计中表现出卓越的准确性。通过利用运动上下文和足地接触信息实现了精确的全球轨迹估计,最小化了足滑动,并提高了国际协调性。该方法整合了2D关键点和像素的特征,提高了3D人体运动重建的准确性。在野外基准测试中,WHAM在MPJPE、PA-MPJPE和PVE等指标上展现出卓越的性能。轨迹细化技术进一步提升了全局轨迹估计,并通过改善的误差指标证明了减少足滑动的效果。

总的来说,这项研究的主要观点可以总结为以下几点:

1. WHAM引入了一种结合3D人体运动和视频背景的开创性方法。

2. 该技术增强了3D人体姿势和形状的回归。

3. 该方法使用了一个全球轨迹估计框架,包括运动上下文和足地接触。

4. 该方法解决了足滑动的问题,并确保在非平面表面上准确跟踪3D运动。

5. WHAM的方法在包括3DPW、RICH和EMDB在内的多样化基准数据集上表现出色。

6. 该方法在全球坐标系中实现了高效的人体姿势和形状估计。

7. 该方法的特征整合和轨迹细化显著提高了运动和全局轨迹的准确性。

8. 通过深入的剖析研究,验证了该方法的准确性。

论文网址:https://arxiv.org/abs/2312.07531

项目网址:https://wham.is.tue.mpg.de/

举报

  • 相关推荐
  • 当折叠屏遇上AI 探秘开发Samsung One UI 8的幕后故事

    三星One UI 8与Galaxy Z Fold7/Flip7同步亮相,深度融合折叠形态与AI技术,带来全新交互体验。通过与谷歌紧密合作,新系统首批预装Android 16,用户可提前体验最新功能。系统聚焦多模态AI、折叠屏优化UX及个性化设计,并强化安全防护。开发团队透露,三星与谷歌从早期规划便协同开发,实现高效多任务处理与创新功能,未来将继续深化AI生态合作。

  • 微信、QQ上线绑定Steam账号功能:可展示时长、游戏

    近日,微信与QQ平台相继上线了绑定Steam账号的新功能,引发了广大游戏爱好者的关注。用户只需简单几步操作,即可将自己的Steam账号与微信或QQ进行绑定,进而在社交平台上展示丰富的游戏数据。 据实测体验,完成绑定后,用户不仅可以在微信或QQ上查看自己的Steam游戏数量、总游戏时长,还能精确到每款游戏的单独游玩时间。此外,绑定成功的页面还会显示用户是第几位成

  • 累计出货量突破100GWh,海辰储能迎来新里程碑

    2025年8月22日,海辰储能在重庆基地举办100GWh出货量纪念仪式。自2021年底出货以来,凭借创新引领、卓越服务和安全可靠三大优势及全球化布局,海辰储能快速构建核心竞争力,累计出货量突破100GWh,全球行业排名从2023年第五跃升至2024年第三,2025年上半年跻身全球第二。公司专注储能领域,通过全链条创新实现技术突破,推出全球首款千安时长时储能专用电池等领先产品,并依托智能制造和精细化运营,确保项目高质量交付。未来,海辰储能将继续以技术创新驱动全球能源绿色转型。

  • 男子10年暴涨100斤半年减30斤 科学减重方法揭晓

    ​近日,一名男子的体重管理经历引发社会关注。据公开信息显示,该男子因长期工作压力导致体重在十年间激增100斤,最高体重达223斤,后通过半年坚持跑步与节食相结合的方式成功减重30斤,目前体重降至193斤,并自述精力较减重前显著提升。 医学专家指出,成年男性体重短期内大幅增长可能引发代谢综合征、心血管疾病等健康风险,而科学减重能有效改善身体机能。该�

  • vampir吸血鬼身份验证教程 vampir吸血鬼怎么身份验证?

    《Vampir吸血鬼》将于2025年8月26日登陆韩服开启公测,支持PC与移动端跨平台互通。本文提供详细身份验证教程:使用加速器优化网络后,通过官网注册账号,选择Netmarble ID登录,完成邮箱验证流程,输入验证码即可完成认证,助您畅享黑暗冒险之旅。

  • 换季娃咳不停、痰多?用对方法好得更快

    季节交替时,呼吸道敏感儿童易出现咳嗽症状。文章指出咳嗽分干咳和有痰两种:干咳可通过饮食调整缓解;有痰咳嗽多由呼吸道感染引起,需及时就医,不可盲目使用止咳药。医生会根据感染类型开具抗生素或氨溴特罗口服溶液等化痰止咳药物。家庭护理需注意多喝水、保持空气湿润、轻拍背部助排痰。家长应避免让孩子频繁出入温差大的环境,保证规律作息和充足睡眠,才能有效预防呼吸道感染。科学护理是守护孩子健康的关键。

  • Lamett乐迈石晶产品硬核测评:零醛、防水、防霉三大指标重新定义健康家

    北京楼市新政落地,市场活力提升,新房装修需求升温。文章重点指出选购健康安全建材的关键指标:甲醛释放量少、防水防潮性强、防霉防蛀能力过硬。通过高温甲醛实验、防水实验和防霉防蛀实验,对比测试了乐迈石晶板等主流建材,结果显示其具有零甲醛释放、滴水不侵、无惧虫霉的优异性能,重新定义了健康建材的标准。

  • 流放之路2新赛季上线,详细steam锁国区下载体验教程

    《流放之路2》第三赛季“第三法令”将于8月29日上线,带来全新剧情探索卡鲁伊部落家园恩加玛卡努伊群岛,支持八大岛屿任意顺序挑战。新增10多个新Boss和百余种新怪物,移除“残酷难度”,角色翻滚后可进入冲刺状态,适用所有职业。宝石系统改善,可无限同类叠加和多等级升级;新增职业且职业技能全面增强。2025年8月30日至9月2日开启国际服免费畅玩活动,进度可继承�

  • IBM携手AMD合作研发量子计算架构,微美全息(WIMI.US)系统布局卡位抢占先机!

    IBM与AMD宣布合作开发下一代量子计算架构,结合高性能计算与量子技术。双方计划今年晚些时候进行初步演示,IBM负责量子计算机与软件,AMD专注HPC/AI加速器。量子计算正加速应用于药物研发、新材料设计、金融分析等领域,全球产业规模预计2035年超8000亿美元。微美全息等企业积极布局量子科技,推动技术研发与场景应用。尽管量子计算商业化尚需时日,但其专用领域价值探索正如火如荼展开,成为大国科技竞争的核心战场。

  • 一个邪修方法,帮你把用Agent的钱省掉80%。

    ​之前我分享过一个Agent,Minimax的那个,因为我觉得Agent能力,是真的很棒,东西好用也是真的好用。 但文章发出去之后,评论区里最多的声音,几乎都指向了同一个字: 贵。

今日大家都在搜的词: