首页 > 业界 > 关键词  > 3D最新资讯  > 正文

HumanGaussian开源:基于Gaussian Splatting的高质量3D人体生成新框架

2023-12-11 09:09 · 稿源:站长之家

要点:

  • 结构感知的SDS引入人体结构先验,同时优化外观和几何形状。

  • 通过退火的负文本引导,确保真实结果,避免过度饱和和消除浮动伪影。

  • HumanGaussian框架能够生成多样、逼真的高质量3D人体模型,展现真实外观和细粒度的细节。

站长之家(ChinaZ.com)12月11日 消息:在3D生成领域,为了实现高质量的3D人体外观和几何形状,研究者们一直在探索自动化的生成方法。传统方法需要经历多个人工制作步骤,而最新的HumanGaussian框架通过结构感知的SDS和负文本引导等核心方法,成功解决了3D人体生成中效率与质量之间的权衡问题。

HumanGaussian引入了结构感知的SDS,利用SMPL-X网格形状初始化3D高斯中心位置。相较于以往的方法,这一框架通过缩放和变换实现合理的人体尺寸,并在3D空间中居中,为3D生成提供了更全面的初始信息。通过SDS源模型,结合RGB和深度图的结构专家分支,研究者成功构建了一个统一的模型,同时捕获外观的图像纹理和前景/背景关系的结构,促进了3D高斯的学习过程。

image.png

项目地址:https://github.com/alvinliu0/HumanGaussian

为了解决3D生成内容与文本之间的对齐问题,HumanGaussian采用了退火的负文本引导,通过结合两个分数进行监督。相较于传统方法中较大的无分类器引导尺度,这一方法能够更清晰地指导SDS损失,避免损害训练稳定性。实验证明,负文本分类器分数的退火可以在小时间步长内提高质量,同时保持稳定性,使生成更真实,消除了浮动伪影。

在性能对比实验中,HumanGaussian在3D人体生成领域取得了优越的成果,展现出更真实的外观、更连贯的结构、更好的视图一致性以及更细粒度的细节捕捉。这一创新框架的开源将有助于推动相关领域的研究和应用,为虚拟试穿、沉浸式远程呈现等应用提供更高质量的3D人体生成解决方案。

HumanGaussian作为一种有效而快速的3D人体生成框架,通过结构感知的SDS和负文本引导的创新方法,成功地平衡了效率和质量,为高质量、真实的3D人体模型的生成提供了新的思路和解决方案。这一框架的开源将为相关研究者提供有力工具,推动3D生成领域的发展。

举报

  • 相关推荐
  • AI日报:Wan 2.2-S2V模型即将发布;​字节跳动内测3D Model Generator;微软开源 VibeVoice-1.5B 模型

    本期AI日报聚焦多项技术突破:阿里通义万相发布Wan 2.2-S2V模型,实现视频音频同步生成;字节跳动研发3D模型生成工具,降低建模门槛;面壁智能推出MiniCPM-V4.5端侧多模态模型;苹果提出RLCF训练法提升模型性能;微软开源VibeVoice-1.5B支持超长语音合成;谷歌Imagen 4正式上线;英伟达发布Jetson Thor机器人计算平台;Genspark推出AI Designer一键生成品牌方案;豆包上线未成年人保护模式。

  • 普渡机器人发布3D感知AI扫地机器人PUDU MT1 Max,重塑智能清洁新高度

    普渡机器人于2025年8月20日发布3D感知AI扫地机器人PUDU MT1Max。该产品在MT1基础上大幅升级,搭载3D雷达与多传感器融合系统,显著增强复杂场景感知与避障能力。通过AI技术实现自适应清洁、垃圾识别、巡检清洁等功能,支持10万平方米以上大场景作业。具备自动振尘过滤和智能避雨机制,提升安全性与运维效率,重塑智能清洁行业新标准。

  • 谷歌DeepMind发布Genie 3世界模型:支持实时生成交互式3D环境

    据媒体报道,谷歌DeepMind正式发布了其新一代通用世界模型Genie 3。 该模型能够根据用户的文本提示,快速生成丰富多样的交互式虚拟环境。Genie 3不仅能够以每秒24帧的速度生成720p分辨率的高清交互式3D世界,更创新性地引入了 可提示世界事件” 功能。用户通过简单文本指令,即可实时修改虚拟环境,显著提升了沉浸感与创造力。 DeepMind视Genie 3为迈向通用人工智能(AGI) 的�

  • 视源股份全栈自研机器人首次亮相世界机器人大会 定位“3D岗”生产力伙伴

    2025世界机器人大会在北京开幕,视源股份携自主研发的机器人产品参展。其工业级高性能四足机器人MAXHUB X7首次亮相,具备全天候、全地形作业能力,已在工业、电力等场景落地应用。该产品采用多传感器融合导航技术,能适应复杂环境,IP66防护等级确保极端条件下稳定运行。视源股份依托"三院一站"研发体系,构建了从算法创新到制造验证的机器人全栈技术能力。目前公司商用清洁机器人已进入欧洲、东南亚及日本市场,在大型商超批量部署。未来将持续加大研发投入,推动机器人与行业场景深度融合。

  • 同比增长17%!腾讯Q2研发投入202.5亿元 混元3D大模型接连突破

    腾讯控股今日发布了截至6月30日的2025年第二季度财报。营收为1845亿元,同比增长15%,经营利润(Non-IFRS)692.5亿元,同比增18%。 财报显示,当季腾讯研发投入达202.5亿元,同比增长17%;资本开支 191.1亿元,同比增幅达119%。在持续加码AI战略的推动下,AI技术带来的效益正在加速显现。 AI高投入背景下,腾讯通过数据增强与合成技术,提升了数据的质量与多样性,并通过更有效�

  • OPPO Find X9参数曝光:3D超声波指纹终于下放

    具体来说,OPPO Find X9标准版将旗舰级的3D超声波指纹模块下放至标准版,这一功能在去年发布的OPPO Find X8系列机型中,只有X8 Ultra超大杯才搭载,其余机型包括X8、X8s、X8s 、X8 Pro均搭载短焦指纹识别,在解锁体验方面存在一定的短板。 据悉,目前的旗舰机型普遍采用了3D超声波指纹模块,相比短焦指纹模块,超声波指纹方案更加安全易用,其优点包括:穿透性强,抗水渍、污渍

  • 昇腾赋能三维生成新突破!浙大团队实现跨模态可控3D CAD建模

    浙江大学与魔芯科技团队合作,基于昇腾平台NPU开发了首个三维模型生成算法Img2CAD。该技术突破性地将草图、图片等多模态输入通过Transformer结构高效转化为三维几何信息,无需可微渲染器,完整在NPU上实现训练和推理。研究成果可生成高精度3D模型,直接导入CAD软件编辑,已应用于3D打印、数字制造等领域。项目完成3篇论文,包括1篇中科院1区期刊和2篇CCF-A类会议论文,部分成果实现商业化落地。该技术标志着智能三维内容创作进入"低门槛、高效率、高质量"新阶段,未来将为工业设计、AR/VR等行业提供创新动能。

  • 六维感知,精准无界!6D位姿跟踪系统让机器人秒变“高精度专家”

    2025世界机器人大会引发关注,工业机器人正推动制造业向柔性化、智能化发展。然而,高端制造对精度要求日益提升,工业机器人在绝对定位精度和动态稳定性方面存在短板。思看科技推出的6D位姿跟踪系统,以100Hz高频追踪和0.049mm空间精度,实现精准检测、快速校准与动态补偿,让工业机器人秒变“高精度专家”。该系统具备三大核心功能:机器人TCP标定、复杂零部件加工�

  • 智元四足机器人 D1 系列重磅发布 ,同步上线智元商城开售

    智元机器人8月18日发布三款四足机器人产品:D1Pro(文娱商演)、D1Edu(教育科研)和D1Ultra(工业级应用)。D1Pro主打轻量化(15kg)与高动态性能,可实现3.7m/s奔跑、35cm跳跃及2小时续航;D1Edu配备标准化接口支持二次开发,适配复杂地形教学研究;D1Ultra具备IP54防护和2kW/kg功率密度,支持8kg负载及恶劣环境作业,集成360°监控与智能识别功能。全系列产品已登陆电商平台,覆盖消费级到工业级应用场景,加速四足机器人产业化进程。

  • 诚志生命D-核糖荣获“FHE同心奖”,创新引领健康食品产业发展

    2025年2月17-20日,博鳌健康食品科学大会(FHE2025)在海南博鳌召开。会议聚焦"科技创新与科学循证",围绕食品法规、新技术、药食同源等六大板块展开研讨。诚志生命科技携核心产品D-核糖参展并获"FHE同心奖",其临床研究显示D-核糖能显著减少马拉松运动员心肌损伤,提升完赛成绩。公司作为D-核糖全球知识产权持有者,展示了包括D-核糖冲剂等系列营养健康产品。诚志生命成立于2000年,是专注于合成生物学研发的国有控股高科技企业,未来将持续加大D-核糖等核心产品的迭代升级,推动"科技+健康"双驱动发展。

今日大家都在搜的词:

热文

  • 3 天
  • 7天