首页 > 业界 > 关键词  > 3D最新资讯  > 正文

HumanGaussian开源:基于Gaussian Splatting的高质量3D人体生成新框架

2023-12-11 09:09 · 稿源:站长之家

要点:

  • 结构感知的SDS引入人体结构先验,同时优化外观和几何形状。

  • 通过退火的负文本引导,确保真实结果,避免过度饱和和消除浮动伪影。

  • HumanGaussian框架能够生成多样、逼真的高质量3D人体模型,展现真实外观和细粒度的细节。

站长之家(ChinaZ.com)12月11日 消息:在3D生成领域,为了实现高质量的3D人体外观和几何形状,研究者们一直在探索自动化的生成方法。传统方法需要经历多个人工制作步骤,而最新的HumanGaussian框架通过结构感知的SDS和负文本引导等核心方法,成功解决了3D人体生成中效率与质量之间的权衡问题。

HumanGaussian引入了结构感知的SDS,利用SMPL-X网格形状初始化3D高斯中心位置。相较于以往的方法,这一框架通过缩放和变换实现合理的人体尺寸,并在3D空间中居中,为3D生成提供了更全面的初始信息。通过SDS源模型,结合RGB和深度图的结构专家分支,研究者成功构建了一个统一的模型,同时捕获外观的图像纹理和前景/背景关系的结构,促进了3D高斯的学习过程。

image.png

项目地址:https://github.com/alvinliu0/HumanGaussian

为了解决3D生成内容与文本之间的对齐问题,HumanGaussian采用了退火的负文本引导,通过结合两个分数进行监督。相较于传统方法中较大的无分类器引导尺度,这一方法能够更清晰地指导SDS损失,避免损害训练稳定性。实验证明,负文本分类器分数的退火可以在小时间步长内提高质量,同时保持稳定性,使生成更真实,消除了浮动伪影。

在性能对比实验中,HumanGaussian在3D人体生成领域取得了优越的成果,展现出更真实的外观、更连贯的结构、更好的视图一致性以及更细粒度的细节捕捉。这一创新框架的开源将有助于推动相关领域的研究和应用,为虚拟试穿、沉浸式远程呈现等应用提供更高质量的3D人体生成解决方案。

HumanGaussian作为一种有效而快速的3D人体生成框架,通过结构感知的SDS和负文本引导的创新方法,成功地平衡了效率和质量,为高质量、真实的3D人体模型的生成提供了新的思路和解决方案。这一框架的开源将为相关研究者提供有力工具,推动3D生成领域的发展。

举报

  • 相关推荐
  • 2899元!小米智能门锁4 Pro双摄版发布:支持AI掌静脉+3D人脸识别

    小米智能门锁4 Pro双摄版正式发布,目前已经在小米有品开启预订,首发到手价2899元。 新品整体上与此前发布的小米智能门锁4 Pro保持一致,最大的不同是增加了一颗底部摄像头,可以全方位监控无死角,尤其对于查看快递非常实用。

  • 当贝D7X 和D6X 有啥不一样?这些升级点要知道

    当贝D7X投影仪相比D6X实现全面升级:亮度从720CVIA提升至1100CVIA(增幅近60%),对比度达1600:1,暗场细节更立体;色域覆盖110% BT.2020,色彩呈现更鲜活;搭载8核芯片与64G存储,多任务运行更流畅;新增米家生态联动和语音控制功能。D6X则保留触控屏设计,适合卧室小空间使用。追求画质性能选D7X,注重触控操作选D6X。

  • 当贝 D7X Pro 新品投影发布,和 D6X Pro 区别大吗?

    当贝D7X+Pro投影仪作为D6XPro升级款,在光源、光学设计、核心性能等方面全面优化:搭载全新QuaLas三色激光光源,色彩更纯净;新增0.98-1.3:1无损光学变焦,小空间灵活适配;升级MT9681芯片与3+64GB存储,运行更流畅;支持DynamicX深黑算法与HDR Vivid解码,画面对比度达20000:1;新增米家生态联动,语音控制智能设备。适合追求4K画质、灵活安装及智能家居联动的用户。

  • 3天3亿,董宇辉双11单挑李佳琦

    在一众大主播几乎“失声”的双11,董宇辉搞出了个大动静。 他搭建了一个双11“大卖场”,偌大的场馆内,沙发、床、冰箱等家纺家电产品依次摆放着,灯光架起,摄像机就位。这是董宇辉为特地为双十一准备的直播现场。 连续三天,董宇辉在这里带货。据飞瓜数据显示,10月9日至11日,与辉同行累计吸引近7000

  • 学生自习看恐怖片被吓病索赔3万 法院:学校承担30%责任

    学生子涵(化名)就读于当地某学校, 2023 年 10 月某日下午,因科任老师请假,该课程改为自习。期间,部分学生提议观看电影,在获得班主任及全班同学同意后,他们选择了一部恐怖电影进行观看。 不料,当晚子涵在与母亲微信聊天时便出现了胡言乱语的现象。数日后,其父母将子涵接往医院治疗,子涵被确诊为“急性而短暂的精神病性障碍”。子涵及其家人认为,子涵�

  • 高德“起”榜30天

    “什么时候上的榜,我自己也不知道。” 国庆期间,我们询问了全国多地高德扫街榜烟火小店商家,其中大多不知道自己已在榜单之上。据了解,烟火小店绝大部分为家庭经营的单店,规模不大,长期游离在各类榜单之外。 商家的反馈至少折射出截然不同的两个信息,高德扫街榜的确没有商业化成分,但也意味着商家还需要一定时间来衡量榜单所产生的价值。 扫街榜是高�

  • 通过欧盟EN18031标准!蒲公英R300A路由器为工业设备出海保驾护航

    贝锐蒲公英工业路由器R300A海外版率先通过EN18031认证,符合欧盟RED指令对网络安全与隐私保护的强制要求,具备进入欧洲及全球市场的合规资质。该产品支持多国4G频段,集成SD-WAN异地组网、智能链路与零接触部署能力,可快速构建安全稳定的全球网络连接,并即将推出海外流量卡服务,实现一卡多运营商智能切换,为企业全球化部署提供从合规准入到稳定连接的全链路解决方案。

  • 连升3名,顺丰同城位列“2025浙江省服务业百强企业”第38名

    10月15日,浙江省发布“2025百强企业”系列榜单,顺丰同城同时入选服务业百强与成长性最快百强,分别位列第38、39位。其服务业排名较去年提升3位,2024年营收达157.5亿元,同比增长27%,净利润增长162%。公司通过“技术+场景”双轮驱动,依托AI系统优化运力匹配,无人车超300台覆盖60城,并投入3000万元“圆梦基金”完善骑士关怀体系。行业认为其入选印证了第三方即时配送的商业价值与发展潜力。

  • 3300万日活的创业蓝海,绿洲启元的造富逻辑

    当下年轻人创业与自由职业浪潮中,UGC(用户生成内容)赛道因低启动成本、高创意弹性成为热门选择。有人想借设计类UGC拓展稳定副业,有人试图靠短视频IP实现流量变现,甚至期待将兴趣转化为核心收入来源。 但这条赛道的理想与现实之间始终存在鸿沟:创作门槛高与流量变现难两大核心困境,让多数参与者陷入创意难落地、落地无回报的僵局。 即便在用户基数超

  • 智利一公司错发330倍月薪后员工失联:维权三年还败诉

    早在2022年5月30日,智利冷切肉制品企业CIAL的人力资源部门因系统错误,向行政助理胡安(化名)的账户转入1.65亿比索(约123万人民币)。 据悉,该员工月薪50万智利比索(约3700元人民币)的办公室助理误转1.65亿智利比索,相当于其330倍月薪 胡安当日向主管报告错误,并

今日大家都在搜的词: