首页 > 业界 > 关键词  > 3D最新资讯  > 正文

HumanGaussian开源:基于Gaussian Splatting的高质量3D人体生成新框架

2023-12-11 09:09 · 稿源:站长之家

要点:

  • 结构感知的SDS引入人体结构先验,同时优化外观和几何形状。

  • 通过退火的负文本引导,确保真实结果,避免过度饱和和消除浮动伪影。

  • HumanGaussian框架能够生成多样、逼真的高质量3D人体模型,展现真实外观和细粒度的细节。

站长之家(ChinaZ.com)12月11日 消息:在3D生成领域,为了实现高质量的3D人体外观和几何形状,研究者们一直在探索自动化的生成方法。传统方法需要经历多个人工制作步骤,而最新的HumanGaussian框架通过结构感知的SDS和负文本引导等核心方法,成功解决了3D人体生成中效率与质量之间的权衡问题。

HumanGaussian引入了结构感知的SDS,利用SMPL-X网格形状初始化3D高斯中心位置。相较于以往的方法,这一框架通过缩放和变换实现合理的人体尺寸,并在3D空间中居中,为3D生成提供了更全面的初始信息。通过SDS源模型,结合RGB和深度图的结构专家分支,研究者成功构建了一个统一的模型,同时捕获外观的图像纹理和前景/背景关系的结构,促进了3D高斯的学习过程。

image.png

项目地址:https://github.com/alvinliu0/HumanGaussian

为了解决3D生成内容与文本之间的对齐问题,HumanGaussian采用了退火的负文本引导,通过结合两个分数进行监督。相较于传统方法中较大的无分类器引导尺度,这一方法能够更清晰地指导SDS损失,避免损害训练稳定性。实验证明,负文本分类器分数的退火可以在小时间步长内提高质量,同时保持稳定性,使生成更真实,消除了浮动伪影。

在性能对比实验中,HumanGaussian在3D人体生成领域取得了优越的成果,展现出更真实的外观、更连贯的结构、更好的视图一致性以及更细粒度的细节捕捉。这一创新框架的开源将有助于推动相关领域的研究和应用,为虚拟试穿、沉浸式远程呈现等应用提供更高质量的3D人体生成解决方案。

HumanGaussian作为一种有效而快速的3D人体生成框架,通过结构感知的SDS和负文本引导的创新方法,成功地平衡了效率和质量,为高质量、真实的3D人体模型的生成提供了新的思路和解决方案。这一框架的开源将为相关研究者提供有力工具,推动3D生成领域的发展。

举报

  • 相关推荐
  • 如何用DeepSeek生成高质量的竞品SWOT分析报告

    本教程介绍如何利用DeepSeek AI工具快速生成电商平台供应链SWOT分析报告。以京东vs拼多多为例,通过输入指定指令,AI可自动生成包含优势、劣势、机会和威胁四个维度的结构化分析报告,重点突出两者供应链能力差异。操作流程包括:1)登录DeepSeek官网进入对话界面;2)输入SWOT分析指令;3)获取AI生成结果。该方法能显著提升商业分析效率,建议结合最新行业数据对报告进�

  • A日报:B站升级动漫视频生成模型AniSora V3;字节开源4D视频生成框架EX-4D;DeepSWE开源AI Agent系统强势登顶

    AI日报栏目汇总了近期AI领域的重要进展:1)字节跳动开源EX-4D框架,可将单目视频转换为多视角4D视频;2)B站开源动漫视频生成模型AniSora V3,支持多种风格;3)DeepSWE+开源基于Qwen3-32B的AI Agent系统;4)字节开源3亿参数图像编辑模型VINCIE-3B;5)Stability AI推出移动端音频生成模型Stable Audio Open Small;6)谷歌发布免费教育AI工具套件Gemini for Education;7)Topview推出革命性AI数字人带货技术Avatar

  • 可灵AI全系模型上线“视频音效”功能 可同步生成高质量立体声音效

    可灵AI宣布全系列视频模型上线“视频音效”功能,用户在使用可灵AI进行视频创作时,不仅能获得高质量的视频画面,更能体验到与视频精准匹配、富有空间感的立体声音效……

  • 小赢卡贷:数字金融赋能实体经济高质量发展

    小赢卡贷深耕湾区沃土,通过"科技+金融"创新模式服务小微企业。其自主研发智能风控系统,构建多维风险评估模型,解决小微企业信用评估难题;开发差异化信贷产品,实现全流程数字化服务;通过科技降本增效,提供普惠利率。目前累计服务超百万湾区小微企业和个体工商户,成为区域经济重要推手。未来将持续加强AI、区块链等前沿技术研发,探索跨境金融、绿色金融等创新业务,深化产学研合作培育数字人才,助力大湾区金融科技高地建设,以科技赋能实体经济高质量发展。

  • 如何用DeepSeek快速起草高质量商务合作邮件

    本文介绍如何利用DeepSeek AI快速生成专业商务合作邀约邮件。传统邮件撰写耗时费力,而通过该工具只需四步:1)登录官网输入指令;2)提供合作对象、内容等关键信息;3)AI自动生成结构清晰、措辞专业的邮件草稿;4)复制到邮箱发送或下载存档。该工具能显著提升商务沟通效率,特别适合需要频繁进行业务往来的职场人士,支持个性化调整并保留专业度,是现代化办公的高效解决方案。(139字)

  • 你的隐私 由你掌控:三星Knox Vault为Galaxy AI构建隐私防护堡垒

    三星Galaxy AI通过本地化处理保护用户隐私,采用Knox Vault硬件级安全方案隔离敏感数据。该方案配备专属处理器和内存,加密存储生物识别、金融信息等关键数据,防止物理篡改和远程攻击。AI功能如音频橡皮擦、通话转文字均在设备端处理,避免云端传输风险。随着AI应用场景扩展,三星将持续强化隐私保护,确保个性化体验与数据安全并重。

  • AI日报:阿里开源3D数字人项目MNN TaoAvatar;MiniMax Agent上线;罗永浩数字人直播再探“AI+IP”带货模式

    本文汇总了AI领域最新动态:1)阿里开源MNN+TaoAvatar技术,实现手机端3D数字人实时交互;2)MiniMax升级AI工具Agent,新增智能图像搜索和多语言支持;3)罗永浩数字人将登陆百度电商直播;4)OpenAI员工套现近30亿美元,软银成最大接盘方;5)ChatGPT推出深度研究和语音模式升级;6)Meta发布V-JEPA2模型,提升机器人环境适应能力;7)AMD与OpenAI合作推出新一代AI芯片;8)Google Gemini集成Imagen4图像生成模型;9)谷歌AI实现10公里级精准天气预报;10)Gartner预测到2028年80%的AI应用开发时间将缩短50%。

  • LiblibAI 重磅发布「星流 Agent」:中文语义 + 图片视频3D全能生成,中国最强设计 Agent

    LiblibAI推出Lovart中文版"星流Agent",这是一款专为中国市场深度优化的AI设计工具。该产品在保留Lovart全球版"生成-编辑-排版-交付"全链路能力基础上,针对中文语义、国风审美和本土使用场景进行了全面重构。星流Agent支持从创意构思到设计交付的全流程自动化,可处理平面设计、视频生成和3D建模等跨模态创作,内置符合中国文化的视觉风格库。该产品的推出标�

  • 每日互动:进一步开发数据要素价值 推动城市交通高质量发展

    浙江省数据局于2025年6月4日公告,浙江云通达数达科技成为省内首批省级公共数据授权运营单位,将开展"数智绿波"场景应用。该公司自2022年进入智慧交通领域,已在34个地区落地645条数智绿波带,使道路通行效率提升超20%。此次授权将推动其在规划建设、优化管理等方面持续发力,并通过数据API与科研单位等开展二次创新,赋能智能网联汽车"车路云一体化"项目建设。该授权是对公司在数据安全、技术能力等方面的认可,未来将继续深化数据融合与场景探索,助力城市交通高质量发展。(140字)

  • 伊顿 Bussmann 西安熔断器制造中心 | 专注电路保护,助力能源转型

    库柏西安熔断器有限公司是伊顿电气在亚太地区主要的熔断器产品制造及研发中心之一,位于西安高新区。公司生产Bussmann系列高压、低压、快速及智能熔断器等产品,广泛应用于能源转换、电力传输、轨道交通、数据中心、新能源汽车等领域,获得海内外用户广泛认可。作为全球知名熔断器及电路保护系统供应商,公司拥有60多项专利技术,持续打造制造实力,并通过数字化管理体系确保产品质量。近年来,公司成功开发覆盖储能系统、新能源车等领域的电力保护解决方案,助力全球新能源转型。公司积极践行绿色制造理念,显著降低碳排放,入选国家工信部绿色制造名单。作为百年品牌,库柏西安将继续致力于研发智造,推动能源转型目标达成。