首页 > 业界 > 关键词  > SMPLer-X最新资讯  > 正文

首个人体动捕基模型SMPLer-X面世 可捕捉身体甚至面部动作

2023-10-30 14:37 · 稿源:站长之家

要点:

1. 首次提出了动捕大模型SMPLer-X,用来进行人体全身姿态与体型估计,通过训练450万个实例,在七个关键榜单上取得最佳性能。

2. SMPLer-X不仅能够捕捉身体动作,还可以输出面部和手部动作,并估计体型。

3. 该研究探索了数据缩放与模型缩放,对32个学术数据集进行排名,展示了在各种测试和榜单中的强大性能。

站长之家(ChinaZ.com)10月30日 消息:首个人体动捕基模型SMPLer-X在NeurIPS2023上亮相。本研究首次针对人体全身姿态与体型估计任务引入了SMPLer-X,通过使用来自多个数据源的450万个实例进行训练,成功刷新了七个关键榜单的最佳性能。

image.png

项目地址:https://caizhongang.github.io/projects/SMPLer-X/

SMPLer-X不仅能够进行身体动作捕捉,还可以输出面部和手部动作,甚至估计体型。这一模型的强大性能得益于大量的数据和大型模型,即使在未知环境中也表现出出色的通用性。

研究人员在研究中进行了数据扩展、模型缩放以及微调策略的探索,以进一步提高模型性能。通过对32个不同的学术数据集进行排名,SMPLer-X在关键榜单上实现了最佳性能,并展示了数据缩放和模型缩放的有效性。

image.png

这个研究还强调了数据集的泛化性研究,指出在模型训练中使用10万个实例数量级的数据集可以获得高性价比。此外,对不同数据集的采集场景和标注也进行了详细研究,强调了生成数据集和伪标签数据集的重要性。

总的来说,SMPLer-X的提出和研究为人体动捕领域带来了重要的突破,为学术社区提供了强大的全身人体动捕大模型。该研究的代码和预训练模型已经开源,为更广泛的应用提供了便利。这一成果不仅可以用于角色动画制作,还在许多其他领域具有潜在的应用前景。

举报

  • 相关推荐
  • 慧辰股份的AI应用破圈 发布机器人智脑“X”平台赋能让硬件更智能

    慧辰股份发布AI战略,聚焦垂直领域打造“专才”而非“通才”AI产品。其四大智能体包括:Data Agent重塑数据分析交互,让业务人员用自然语言分析内外数据;垂直行业数据洞见智能体,专攻非结构化数据价值挖掘;市场需求研判智能体,辅助销售团队把握商机;数字员工管理平台,规模化部署AI应用。通过将AI技术与行业Know-How深度结合,该公司推动AI从“炫技”走向“赋能”,成为产业数字化转型的基础设施。

  • 2025视觉中国&500px视觉盛典青岛站开启招募!

    本文介绍了多个科技品牌在展会现场推出的互动体验和福利活动:至誉科技提供免费笔记本屏幕校色服务,关注小红书可领取贴纸等礼品;东芝通过问卷赠送手机挂绳;索尼展出新品相机镜头;适马打卡送周边;永诺展示神秘新品镜头;雷克沙关注社媒可领专属礼物;富图宝有识脚架互动游戏;神牛到场即送周边;艺卓体验专业显示器;唯卓仕可参与新品抽奖;斯丹德提供免费抽奖与补光灯体验;明基首次展出未发售的校色显示器。各品牌均通过现场互动吸引用户参与。

  • 微算法科技(NASDAQ MLGO):以隐私计算区块链筑牢多方安全计算(MPC)安全防线

    微算科技开发的隐私计算区块链将区块链技术融入多方安全计算(MPC),构建安全可信的分布式计算平台。通过区块链共识机制、加密算法和智能合约,对MPC参与方身份验证、数据加密存储、任务执行及结果验证等环节进行保护,确保数据“可用不可见”。该技术显著提升数据隐私保护和计算可靠性,在金融、医疗、政务等领域实现跨主体数据安全协作,释放数据价值。

  • 千问APP悄悄上线,阿里的AI超级入口也终于来了。

    阿里“千问”APP昨日在应用商店悄然上线,界面从通义APP的双色渐变变为简洁单色设计,功能大幅增强,支持Qwen全系列最新模型。此次品牌整合将阿里分散的AI触点统一为“千问”品牌,实现模型与产品名称对齐,让普通用户首次能在官方APP使用最强Qwen3-Max模型。APP默认开启联网搜索,集成图像编辑、视频通话等场景功能,通过智能意图识别实现一站式服务。这标志着阿里开始认真打技术+品牌两张牌,推动AI技术以更清晰方式触达用户。

  • 阿里千问APP宣布开启公测 号称打造最佳个人AI助手

    阿里巴巴11月17日启动“千问”项目,全面进军AI to C市场,标志着其在人工智能领域的新战略布局。APP公测版已上线各大应用商店,网页和PC版同步推出,国际版即将上线。基于Qwen模型在海外的影响力,“千问”将与ChatGPT等国际产品竞争,展现中国AI实力。Qwen系列模型全球下载量突破6亿次,性能超越Llama等,成为全球最强开源大模型。“千问”致力于打造“会聊天能办事”的个人AI助手,已具备生成报告、制作PPT等能力,未来计划接入地图、外卖、办公等生活场景,成为用户得力助手。

  • AI日报:阿里千问APP公测;Veo 3.1上线多图参考;超级小爱AI大模型“随心修图”上线

    本期AI日报聚焦多项技术突破:阿里千问APP公测,基于Qwen3模型对标ChatGPT;谷歌Veo 3.1支持三图融合生成8秒视频;小米推出"随心修图"功能与7B多模态模型Miloco;谷歌Flow集成Nano Banana模型实现智能抠图;多模态AI工具DeepEyesV2可执行代码与网络搜索;NotebookLM升级支持图像导入检索;JetBrains推出DPAI Arena测试编码AI性能。全球AI竞争持续升温,产品迭代加速。

  • AI日报:HeyGen发布AI视频翻译引擎;科大讯飞推星火 X1.5;QQ浏览器推出AI+小窗

    本期AI日报聚焦多项技术突破:HeyGen推出精准唇形同步的视频翻译引擎;科大讯飞发布星火X1.5大模型,提升多语言处理能力;QQ浏览器新增AI助手浮窗;科大讯飞推出软硬一体方案,实现高噪声环境精准识别;谷歌Gemini 3 Pro预览版支持百万级上下文窗口;Comfy Cloud让Stable Diffusion实现零门槛创作;谷歌Gemini新增深度研究功能,可整合邮件生成智能报告;上海AgiBot机器人10分钟完成复杂制造任务,重塑生产效率。

  • OPPO Find X9系列卖爆了,这下全网都在找追光红?

    在国产高端手机市场竞争白热化的当下,用户留存率与新品市场热度已成为衡量品牌竞争力的核心指标。而在双十一狂欢这一关键节点下,OPPO Find X9系列市场反响强烈,俨然已成爆款。

  • 科大讯飞发布讯飞星火X1.5及系列AI软硬一体方案

    在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为主题,发布星火大模型最新升级及系列产品。董事长刘庆峰指出,AI红利兑现需攻克自主可控、软硬一体、行业纵深和个性化四大核心,并展示了在300多个“开箱即用”智能体中涌现的优秀“AI员工”。星火X1.5采用MoE架构,推理效率提升100%,多语言能力覆盖超130语种,整体性能达GPT-5的95%以上。同时发布软硬一体解决方案,包括AI麦克风阵列、翻译机等,实现高精度降噪与识别。此外,推出个性化记忆与语音复刻技术,定义多模态交互八大能力,并展示AI在教育、医疗、汽车、办公及情感陪伴等领域的深度应用,启动“星火点亮全球”计划,共建繁荣AI生态。

  • OPPO Find X9 Pro卫星通信版开启预售:6999元

    今日,OPPO Find X9Pro卫星通信版正式拉开预售帷幕,这款备受瞩目的旗舰机型仅提供16GB+1TB这一种豪华配置,售价定为6999元。作为国产手机市场的又一力作,OPPO Find X9Pro卫星通信版在通信技术上实现了重大突破,成为首款支持eSIM服务的国产手机。 除了支持双Nano-SIM实体卡、发送北斗卫星短信等先进功能外,OPPO Find X9Pro卫星通信版还全面兼容中国移动、中国联通、中国电信三大运

今日大家都在搜的词: