首页 > 业界 > 关键词  > FreeMan最新资讯  > 正文

中国研究团队发布多视角数据集“FreeMan” 解决3D人体姿势估计局限性

2023-09-25 11:30 · 稿源:站长之家

文章概要:

- “FreeMan”是一份大规模多视角数据集,旨在解决现有3D人体姿态估计数据集的局限性。

- 数据集包含来自8台同步智能手机的1100万帧,跨足了室内和室外环境,具备不同光照条件,提供了更真实的场景多样性。

- 研究者通过自动化的标注流程,包括人体检测、2D关键点检测、3D姿态估计和网格标注,生成了精确的3D标注,可用于多种任务,如单2D到3D转换、多视角3D估计和神经渲染。

站长之家(ChinaZ.com)9月25日 消息:从真实场景中估计人体的三维结构是一项具有挑战性的任务,对于人工智能、图形学和人机交互等领域具有重要意义。然而,现有的3D人体姿态估计数据集通常在受控条件下收集,具有静态背景,无法代表真实世界场景的多样性,从而限制了用于真实应用的准确模型的开发。

在这方面,类似于Human3.6M和HuMMan的现有数据集广泛用于3D人体姿态估计,但它们是在受控的实验室环境中收集的,无法充分捕捉真实世界环境的复杂性。这些数据集在场景多样性、人体动作和可扩展性方面存在局限。研究人员提出了各种模型用于3D人体姿态估计,但由于现有数据集的局限性,它们的效果通常在应用于真实场景时受到阻碍。

image.png

中国的一支研究团队推出了“FreeMan”,这个由来自香港中文大学(深圳)和腾讯等机构的团队共同合作开发的项目,被誉为革新性的多视角数据集,旨在为3D人体姿势估计领域带来新的突破。

FreeMan是一个新颖的大规模多视角数据集,旨在解决现有数据集在真实场景中3D人体姿态估计方面的局限性。FreeMan是一项重要的贡献,旨在促进更准确和稳健模型的开发。

FreeMan项目的特点之一是其数据集的规模和多样性。该数据集由8部智能手机在不同场景下的同步录制组成,包括10个不同场景、27个真实场地,总计包含了超过1100万帧的视频。每个场景都涵盖了不同的照明条件,使得这个数据集成为一个独一无二的资源。

FreeMan数据集的开源是为了促进大规模预训练数据集的发展,同时也为户外3D人体姿势估计提供了全新的基准。这一数据集不仅包括视频,还提供了丰富的注解信息,包括2D和3D人体关键点、SMPL参数、边界框等,为研究人员提供了丰富的资源以推动相关领域的研究。

值得注意的是,FreeMan引入了相机参数和人体尺度的变化,使其更具代表性。研究团队开发了自动化的标注流程,以从收集的数据中高效生成精确的3D标注。这一流程包括人体检测、2D关键点检测、3D姿态估计和网格标注。由此产生的数据集对于多种任务都非常有价值,包括单目3D估计、2D到3D转换、多视角3D估计和人体主体的神经渲染。

研究人员提供了对FreeMan进行各种任务的全面评估基线。他们将在FreeMan上训练的模型与在Human3.6M和HuMMan上训练的模型的性能进行了比较。值得注意的是,在3DPW数据集上测试时,训练在FreeMan上的模型表现出显著更好的性能,突显了FreeMan在真实场景中的卓越泛化能力。

image.png

在多视角3D人体姿态估计实验中,与在Human3.6M上训练的模型相比,在跨领域数据集上测试时,训练在FreeMan上的模型表现出更好的泛化能力。结果一致显示了FreeMan多样性和规模的优势。

在2D到3D姿态转换实验中,FreeMan的挑战显而易见,因为在这个数据集上训练的模型面临更大的难度。然而,当模型在整个FreeMan训练集上进行训练时,其性能得到改善,显示出该数据集提高模型性能的潜力。

FreeMan的可用性预计将推动人体建模、计算机视觉和人机交互领域的进步,弥合了受控实验室条件与真实场景之间的差距。

项目网址:https://wangjiongw.github.io/freeman/

举报

  • 相关推荐
  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。

  • LiblibAI 重磅发布「星流 Agent」:中文语义 + 图片视频3D全能生成,中国最强设计 Agent

    LiblibAI推出Lovart中文版"星流Agent",这是一款专为中国市场深度优化的AI设计工具。该产品在保留Lovart全球版"生成-编辑-排版-交付"全链路能力基础上,针对中文语义、国风审美和本土使用场景进行了全面重构。星流Agent支持从创意构思到设计交付的全流程自动化,可处理平面设计、视频生成和3D建模等跨模态创作,内置符合中国文化的视觉风格库。该产品的推出标�

  • 高德地图上线AR打卡功能:实现3D立体打卡 生成专属打卡视频

    阿里巴巴旗下高德地图正式上线创新AR打卡功能,通过深度整合AI技术与地图服务,为用户带来虚实融合的沉浸式打卡体验,无缝连接现实世界。 该功能依托前沿AI空间融合技术,突破传统二维地图限制,首创3D立体打卡。用户打开最新版高德地图App,点击右上角 ”号即可轻松开启AR之旅。 支持图片、视频、趣味AR道具及虚拟形象等多种打卡形式,完成打卡后系统将自动生成并

  • 绘王发布新款蓝牙单手键盘Keydial Remote K40

    7月15日,绘王推出专为ACG创作者设计的单手键盘Keydial+Remote K40。该产品仅152×56×13.5mm大小,配备8个自定义按键和2个切换键,采用U型布局。支持6组软件专属快捷键设置,创新双编码器采用内外圈嵌套设计,全键无冲。配备OLED屏实时显示键值/电量,蓝牙5.0支持PC/移动端双通道切换,约30小时续航满足多场景创作需求。

  • 俄男子从28米高悬崖跳水当场身亡:姿势不当 冲击力远超极限

    ​近日,俄罗斯一名32岁男子在诺里尔斯克附近的一处峡谷进行极限跳水运动时,不幸发生意外丧生。该男子从28米高的悬崖纵身跃下,却重重拍击在水面上,激起大片浪花后迅速沉入水底。 事故发生后,救援人员与潜水员迅速展开搜救行动。经过数小时的紧张搜寻,终于找到了男子的遗体并打捞上岸。据悉,该峡谷是当地极限运动爱好者和旅客的热门打卡地,男子朋友透露�

  • 1799元!小米米家智能晾衣机2 Pro开启预约:94个晾晒位、配3D曲面穹顶灯

    米家推出全新智能晾衣机2Pro,以超薄机身、强大晾晒能力及智能联动功能,为用户带来阳台空间的全新晾衣体验,目前该产品已在小米商城开启预约,售价1799元。 米家智能晾衣机2Pro采用9.5cm超薄隐藏机身设计,搭配一体式3D曲面穹顶灯,融合照明与晾晒功能。 晾衣机创新打造了94个多功能晾晒位,包含40个开放式挂槽、20个伸缩细杆挂位、32个旋转挂钩位以及2个独立晾被杆,

  • 荣耀X70发布:1399元起 搭载8300mAh电池

    在核心配置上,荣耀X70搭载了一块6.78英寸的1.5K荣耀绿洲护眼屏,支持120Hz高刷新率,为用户带来流畅的视觉体验。处理器方面,该机选用了高通骁龙6Gen4,性能表现不俗。拍照方面,荣耀X70前置800万像素摄像头,后置则配备了一颗5000万像素的主摄,满足用户日常拍照需求。 续航方面,荣耀X70堪称行业翘楚。该机内置了高达8300mAh的第三代青海湖电池,硅含量突破10%,领先同档�

  • 园区网络解决方案|锐捷网络发布 RG-UNC AS 系列:让中小网络运维化繁为简

    锐捷RG-UNC AS系列产品针对中小规模网络运维痛点,提供轻量化解决方案。其核心优势包括:1)统一管理多厂商异构设备,简化运维流程;2)智能告警系统实现故障分钟级定位,运维效率提升70%;3)终端准入可视化,支持IPv4/v6地址动态规划;4)国产化适配,支持多种部署模式。典型案例显示,该方案能整合分散网管系统,将IP地址利用率提升50%,使运维模式从"被动救火"转向"主动管控"。产品采用"基础守护+进阶拓展"架构,可伴随业务发展平滑升级,助力企业数字化转型。

  • 入选联合国案例集!AI拯救濒危动物,飞桨助力清除1.3万余条非法贸易广告

    7月9日,百度飞桨"濒危物种AI守护官"项目入选联合国AI向善全球峰会创新案例集。该项目通过AI技术识别野生动物制品图片,截至2025年6月已推动删除超1.3万条非法贸易广告。这是百度与国际爱护动物基金会(IFAW)合作研发的2.0版本,基于飞桨深度学习平台,识别准确率达86%,覆盖34类濒危物种及其制品。项目曾获2025爱迪生最佳新产品奖银奖。全球非法野生动物贸易年交易额高达230亿美元,该项目通过AI技术显著提升了网络野生动物犯罪识别效率,已筛查超41万张可疑图片,精准识别3.3万幅目标图片。AI向善全球峰会由国际电信联盟和瑞士政府共同主办,是推动AI技术发展与应用的重要平台。

  • 重磅发布 | 可信数据空间企业调研:需求、挑战与建议

    2025年6月,数篷科技联合公共数据联盟对近50家企业开展"国家数据基础设施——可信数据空间建设"调研。研究发现:大部分企业认识到可信数据空间在提升数据安全防护能力、实现跨组织数据流通、促进数据要素运营等方面具有重要意义。技术需求方面,企业认为身份认证与权限管理、数据互通、数据沙箱等是建设可信数据空间的重要技术;部署方式上,大型企业倾向自建私有化部署,中小企业更青睐政府或龙头企业主导的可信数据空间,但大部分企业面临资源与成本投入、专业人才缺乏等挑战。70%的企业将陆续启动可信数据空间建设。未来建议探索可持续商业化模式,发挥龙头企业示范引领作用,聚焦标杆落地实践,并关注轻量化、智能化、高性能等技术发展方向。