首页 > 业界 > 关键词  > SMPLer-X最新资讯  > 正文

首个人体动捕基模型SMPLer-X面世 可捕捉身体甚至面部动作

2023-10-30 14:37 · 稿源:站长之家

要点:

1. 首次提出了动捕大模型SMPLer-X,用来进行人体全身姿态与体型估计,通过训练450万个实例,在七个关键榜单上取得最佳性能。

2. SMPLer-X不仅能够捕捉身体动作,还可以输出面部和手部动作,并估计体型。

3. 该研究探索了数据缩放与模型缩放,对32个学术数据集进行排名,展示了在各种测试和榜单中的强大性能。

站长之家(ChinaZ.com)10月30日 消息:首个人体动捕基模型SMPLer-X在NeurIPS2023上亮相。本研究首次针对人体全身姿态与体型估计任务引入了SMPLer-X,通过使用来自多个数据源的450万个实例进行训练,成功刷新了七个关键榜单的最佳性能。

image.png

项目地址:https://caizhongang.github.io/projects/SMPLer-X/

SMPLer-X不仅能够进行身体动作捕捉,还可以输出面部和手部动作,甚至估计体型。这一模型的强大性能得益于大量的数据和大型模型,即使在未知环境中也表现出出色的通用性。

研究人员在研究中进行了数据扩展、模型缩放以及微调策略的探索,以进一步提高模型性能。通过对32个不同的学术数据集进行排名,SMPLer-X在关键榜单上实现了最佳性能,并展示了数据缩放和模型缩放的有效性。

image.png

这个研究还强调了数据集的泛化性研究,指出在模型训练中使用10万个实例数量级的数据集可以获得高性价比。此外,对不同数据集的采集场景和标注也进行了详细研究,强调了生成数据集和伪标签数据集的重要性。

总的来说,SMPLer-X的提出和研究为人体动捕领域带来了重要的突破,为学术社区提供了强大的全身人体动捕大模型。该研究的代码和预训练模型已经开源,为更广泛的应用提供了便利。这一成果不仅可以用于角色动画制作,还在许多其他领域具有潜在的应用前景。

举报

  • 相关推荐
  • 大模型都能冲清北了?首个AI高考总分评测结果出炉

    7家国产大模型参加2025年辽宁高考模拟测试,结果显示:腾讯元宝在文科考试中以667.5分夺冠,接近清北录取线;豆包、讯飞星火分别以655分和652分紧随其后,均达985高校水平。理科方面,豆包以635分领先,元宝和Kimi分别获得632.5分和629分。测试发现大模型在文科表现优于理科,尤其在语文作文和数学解题能力突出,元宝数学获得149分高分。但在理科综合科目存在短板,物理化学的解题过程和知识点推导不够完整,图像符号理解不足。相比去年,今年大模型整体能力显著提升,已从"文科一本、理科二本"水平进步到冲击顶尖高校的水平,展现了国产AI的快速发展。

  • MiniMax深夜开源首个推理模型M1,这次是真的卷到DeepSeek了。

    ​不知道还有多少人记得,AI行业的六小虎。 行业内都在说,他们已经寂静好久了。 上一次相关的项目发布,还是前一段时间我写的MiniMax声音模型的更新,Speech-02。 而昨晚凌晨将近12点的时候,又是MiniMax,居然在X上,预告了他们一整周的发布计划。

  • 阿里巴巴发布全球首个胃癌影像筛查AI模型:CT就能识别早期胃癌

    浙江省肿瘤医院联合阿里巴巴达摩院,发布了全球首个胃癌影像筛查AI模型DAMO GRAPE。 该模型首次利用平扫CT影像识别早期胃癌病灶,并联合全国20家医院,在近10万人的大规模临床研究中大幅提升胃癌检出率。 相关论文在24日登上了国际顶级期刊《自然医学》(Nature Medicine)。 据国家癌症中心统计,我国每年新发胃癌约36万例,死亡26万例,死亡人数在所有恶性肿瘤中位列第�

  • 腾讯回应首个满级QQ诞生:首个满级QQ获得金企鹅

    近日,“全球首个满级QQ账号”相关新闻引发广泛关注。今日,腾讯正式发文宣布,QQ昵称为“爱芥末”的用户成为全球首位拥有“时光企鹅”等级图标的用户,这是QQ级别中首次出现该图标。 腾讯方面介绍,“时光企鹅”图标寓意着用户从懵懂年少起,历经岁月积累,逐步点亮珍贵成长印记,最终进化成如今的“时光企鹅”。 可能不少人对QQ等级划分已不太熟悉。QQ等级从一

  • 《沙丘:觉醒》抢先体验开启,沙虫蠢蠢欲动

    《沙丘:觉醒》豪华版/终极版玩家现已可开启厄拉科斯星球冒险!6月6日起,这款开放世界生存游戏向预购玩家开放,其他版本玩家需等到6月10日全面上线。游戏灵感源自弗兰克·赫伯特的科幻巨著和传奇影业获奖电影,构建了平行于电影时间线的沙丘世界。玩家将在危险沙漠中探索,体验全新故事线,参与香料争夺战,影响阵营发展。游戏采用传统DLC模式,无内购商店。原声

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • 联发科史上最强SoC!天玑9500首个跑分出炉:首发X930超大核

    博主数码闲聊站今天曝光了天玑9500的首个跑分信息,这将是联发科史上最强SoC。 据悉,天玑9500现阶段样片频率是1*3.23GHz Travis 3*3.03GHz Alto 4*2.23GHz Gelas,首发X930超大核的全大核CPU架构。 其中Travis和Alto是Arm新一代X9系超大核,支持SME指令集,Gelas是Arm新A7系大核。 对比上代天玑9400,天玑9500放弃了Arm Cortex-X4系列核心,超大核全部升级为Cortex-X9系列,同时升级到台积电N3P工艺,�

  • 买新款MPV车型别纠结了,上汽大通G50一台顶多用,值!

    文章介绍了上汽大通G50这款MPV车型的实用性和多功能性。该车不仅满足日常通勤需求,还能兼顾家庭出行、商务接待等多种场景。G50拥有4825mm车身长度,2+2+3七座布局灵活实用,第二排独立座椅舒适度高,第三排空间充足。搭载1.5T发动机,动力充沛且油耗仅7.9L/100km。全车配备44处储物空间,后备箱容积大,安全配置齐全。6.98万元起的亲民价格,使其成为家庭用户和创业者的理想选择。

  • 苹果自研AI模型难产:改用第三方大语言模型

    苹果可能会跟OpenAI或Anthropic合作,双方正在谈判讨论一项潜在交易,苹果希望调用OpenAI或Anthropic的第三方大语言模型来为Siri提供技术支持。 据悉,OpenAI或Anthropic正在训练适配苹果私有云计算服务器的模型,苹果也在进行测试,目前苹果发现Anthropic的AI模型最适合Siri,且与Anthropic初步讨论了一些财务条款,消息称Anthropic要求苹果每年支付数十亿美元的费用,且该费用会随时间�

  • AI日报:夸克发布首个高考志愿大模型;Trae月活跃用户破100万;Manus推出免费无限聊天模式

    【AI日报】今日AI领域热点速览: 1. 夸克APP推出高考志愿大模型,免费提供个性化填报指导 2. Manus AI开放免费无限聊天模式,挑战行业巨头 3. Trae开发者平台月活破百万,累计交付60亿行代码 4. 迪士尼环球起诉Midjourney侵犯影视版权 5. 维基百科暂停AI生成摘要实验 6. 360发布"纳米AI超级搜索智能体",内置80多款大模型 7. PartCrafter项目实现单张图片生成高精度3D模型 8. Meta推出AI视频编辑工具,支持50多种预设效果 9. 阿里工程师放弃春节假期全力追赶DeepSeek技术 10. 火山引擎发布PromptPilot智能提示优化平台 11. OpenAI洽谈400亿美元融资,拓展AI生态系统 12. 新一代o3-pro推理模型发布并调整API定价策略