首页 > 业界 > 关键词  > 3D最新资讯  > 正文

浙大提出SIFU模型 单图即可重建高质量3D人体模型

2024-01-18 13:56 · 稿源:站长之家

要点:

  • 浙江大学ReLER实验室提出的SIFU模型是一种单图即可重建高质量3D人体模型的侧视图条件隐函数模型,在几何与纹理重建测试中达到SOTA。

  • SIFU模型通过引入人体侧视图作为先验条件,并结合扩散模型进行纹理增强,成功解决了传统方法中在2D特征转换到3D空间和纹理预测阶段的问题,提高了重建精度和效果。

  • SIFU模型具有更强的鲁棒性,通过测试模型在估计人体先验模型不准确的情况下仍具有最好的重建精度,且适用于多个应用场景,如AR、VR、3D打印、场景搭建等。

站长之家(ChinaZ.com)1月18日 消息:近期,浙江大学ReLER实验室的研究人员提出了一项引人瞩目的研究成果:SIFU模型。该模型创新性地使用单张图片进行3D人体模型重建,通过引入侧视图条件隐函数和扩散模型,实现了几何和纹理重建的最先进水平。传统方法在处理2D特征到3D空间和纹理预测时存在不足,而SIFU模型成功地解决了这些问题,使得从单张图像准确重建高质量3D人体模型成为可能。

image.png

项目地址:https://top.aibase.com/tool/sifu

在模型的运行流程中,SIFU分为两个关键阶段。首先,利用侧隐式函数实现人体的几何和粗糙纹理的重建。独特的Side-view Decoupling Transformer在此阶段发挥关键作用,通过引入侧视图作为先验条件,从而在2D特征中解耦出人体不同方向的3D特征,从而提高了重建效果。其次,通过3D一致性纹理优化流程,借助预训练的扩散模型对纹理进行精细化,使得模型的纹理贴图更加精细和连贯。

实验部分展示了SIFU模型在几何和纹理重建方面的卓越性能。通过全面多样化的测试集,包括CAPE-NFP、CAPE-FP和THuman2.0,SIFU模型在定量评估中表现出最好的几何和纹理重建效果。此外,模型在面对有误差的人体先验模型时也展现出更强的鲁棒性,适用于真实世界中存在估计不准确的情况。

SIFU模型的应用场景广泛,包括3D打印、场景搭建、纹理编辑等。其高精度高质量的重建效果为多个领域提供了新的可能性,特别是在AR、VR等领域,简化了独立创作的过程,降低了成本,为未来的研究和应用提供了新的思路和方向。

SIFU模型的提出填补了以往在2D特征转换到3D空间和纹理预测时的不足,取得了令人瞩目的成果。其在单图即可重建高质量3D人体模型方面的优越性能,将为相关领域的发展带来新的动力。通过这一研究,浙江大学ReLER实验室为几何纹理重建领域注入了新的SOTA技术,为未来的科研和产业应用提供了坚实的基础。

举报

  • 相关推荐
  • AI日报:Wan 2.2-S2V模型即将发布;​字节跳动内测3D Model Generator;微软开源 VibeVoice-1.5B 模型

    本期AI日报聚焦多项技术突破:阿里通义万相发布Wan 2.2-S2V模型,实现视频音频同步生成;字节跳动研发3D模型生成工具,降低建模门槛;面壁智能推出MiniCPM-V4.5端侧多模态模型;苹果提出RLCF训练法提升模型性能;微软开源VibeVoice-1.5B支持超长语音合成;谷歌Imagen 4正式上线;英伟达发布Jetson Thor机器人计算平台;Genspark推出AI Designer一键生成品牌方案;豆包上线未成年人保护模式。

  • 普渡机器人发布3D感知AI扫地机器人PUDU MT1 Max,重塑智能清洁新高度

    普渡机器人于2025年8月20日发布3D感知AI扫地机器人PUDU MT1Max。该产品在MT1基础上大幅升级,搭载3D雷达与多传感器融合系统,显著增强复杂场景感知与避障能力。通过AI技术实现自适应清洁、垃圾识别、巡检清洁等功能,支持10万平方米以上大场景作业。具备自动振尘过滤和智能避雨机制,提升安全性与运维效率,重塑智能清洁行业新标准。

  • 视源股份全栈自研机器人首次亮相世界机器人大会 定位“3D岗”生产力伙伴

    2025世界机器人大会在北京开幕,视源股份携自主研发的机器人产品参展。其工业级高性能四足机器人MAXHUB X7首次亮相,具备全天候、全地形作业能力,已在工业、电力等场景落地应用。该产品采用多传感器融合导航技术,能适应复杂环境,IP66防护等级确保极端条件下稳定运行。视源股份依托"三院一站"研发体系,构建了从算法创新到制造验证的机器人全栈技术能力。目前公司商用清洁机器人已进入欧洲、东南亚及日本市场,在大型商超批量部署。未来将持续加大研发投入,推动机器人与行业场景深度融合。

  • 同比增长17%!腾讯Q2研发投入202.5亿元 混元3D大模型接连突破

    腾讯控股今日发布了截至6月30日的2025年第二季度财报。营收为1845亿元,同比增长15%,经营利润(Non-IFRS)692.5亿元,同比增18%。 财报显示,当季腾讯研发投入达202.5亿元,同比增长17%;资本开支 191.1亿元,同比增幅达119%。在持续加码AI战略的推动下,AI技术带来的效益正在加速显现。 AI高投入背景下,腾讯通过数据增强与合成技术,提升了数据的质量与多样性,并通过更有效�

  • 昇腾赋能三维生成新突破!浙大团队实现跨模态可控3D CAD建模

    浙江大学与魔芯科技团队合作,基于昇腾平台NPU开发了首个三维模型生成算法Img2CAD。该技术突破性地将草图、图片等多模态输入通过Transformer结构高效转化为三维几何信息,无需可微渲染器,完整在NPU上实现训练和推理。研究成果可生成高精度3D模型,直接导入CAD软件编辑,已应用于3D打印、数字制造等领域。项目完成3篇论文,包括1篇中科院1区期刊和2篇CCF-A类会议论文,部分成果实现商业化落地。该技术标志着智能三维内容创作进入"低门槛、高效率、高质量"新阶段,未来将为工业设计、AR/VR等行业提供创新动能。

  • 谷歌DeepMind发布Genie 3世界模型:支持实时生成交互式3D环境

    据媒体报道,谷歌DeepMind正式发布了其新一代通用世界模型Genie 3。 该模型能够根据用户的文本提示,快速生成丰富多样的交互式虚拟环境。Genie 3不仅能够以每秒24帧的速度生成720p分辨率的高清交互式3D世界,更创新性地引入了 可提示世界事件” 功能。用户通过简单文本指令,即可实时修改虚拟环境,显著提升了沉浸感与创造力。 DeepMind视Genie 3为迈向通用人工智能(AGI) 的�

  • 智元四足机器人 D1 系列重磅发布 ,同步上线智元商城开售

    智元机器人8月18日发布三款四足机器人产品:D1Pro(文娱商演)、D1Edu(教育科研)和D1Ultra(工业级应用)。D1Pro主打轻量化(15kg)与高动态性能,可实现3.7m/s奔跑、35cm跳跃及2小时续航;D1Edu配备标准化接口支持二次开发,适配复杂地形教学研究;D1Ultra具备IP54防护和2kW/kg功率密度,支持8kg负载及恶劣环境作业,集成360°监控与智能识别功能。全系列产品已登陆电商平台,覆盖消费级到工业级应用场景,加速四足机器人产业化进程。

  • 六维感知,精准无界!6D位姿跟踪系统让机器人秒变“高精度专家”

    2025世界机器人大会引发关注,工业机器人正推动制造业向柔性化、智能化发展。然而,高端制造对精度要求日益提升,工业机器人在绝对定位精度和动态稳定性方面存在短板。思看科技推出的6D位姿跟踪系统,以100Hz高频追踪和0.049mm空间精度,实现精准检测、快速校准与动态补偿,让工业机器人秒变“高精度专家”。该系统具备三大核心功能:机器人TCP标定、复杂零部件加工�

  • 硅基智能完成数亿元D轮融资,司马华鹏:要从卖工具到卖结果

    南京硅基智能科技完成数亿元D轮融资,由嘉兴高新区产业基金投资。资金将用于核心技术研发和产品市场化应用。公司聚焦AIGC数字人技术,已服务超5000家企业,年营收达数亿元。其新一代多模态大模型DUIX ONE提升了人机交互真实感,并推出"DUIX Inside"战略,为开发者提供标准化API服务。公司还探索"按效果付费"新模式,从卖工具转向卖结果。硅基智能计划在全球1

  • 诚志生命D-核糖荣获“FHE同心奖”,创新引领健康食品产业发展

    2025年2月17-20日,博鳌健康食品科学大会(FHE2025)在海南博鳌召开。会议聚焦"科技创新与科学循证",围绕食品法规、新技术、药食同源等六大板块展开研讨。诚志生命科技携核心产品D-核糖参展并获"FHE同心奖",其临床研究显示D-核糖能显著减少马拉松运动员心肌损伤,提升完赛成绩。公司作为D-核糖全球知识产权持有者,展示了包括D-核糖冲剂等系列营养健康产品。诚志生命成立于2000年,是专注于合成生物学研发的国有控股高科技企业,未来将持续加大D-核糖等核心产品的迭代升级,推动"科技+健康"双驱动发展。

今日大家都在搜的词: