首页 > 业界 > 关键词  > Meta最新资讯  > 正文

Meta AI 推出可重新调整光线的高保真头像生成方法 可用于制作动画生成新颖的表情

2023-12-12 09:59 · 稿源:站长之家

划重点:

1. 💡 Meta AI 研究团队提出了可重新调整光线的高保真头像生成方法,该方法能够捕捉面部表情的细节,并实时生成真实的头像。

2. 💡 该方法通过引入基于3D 高斯函数的几何模型和可学习的辐射转移外观模型,实现了对头像的动态生成和光线调整。

3. 💡 这种头像生成方法还可以根据表情、视线、观察角度和光线进行灵活控制,为用户提供交互式的使用体验。

站长之家(ChinaZ.com)12月12日 消息:在 Meta AI 的一项开创性研究中,研究人员成功解决了动态3D 头像的高保真重新调整光线的挑战。传统方法在实时应用中捕捉面部表情的细节常常需要进行改进,尤其是对于捕捉亚毫米级细节的要求。Meta AI 的研究团队针对这一挑战提出了 “可重新调整光线的高斯编码头像(Relightable Gaussian Codec Avatars)”,这一方法有望重新定义头像的逼真程度。

image.png

这项研究团队解决的核心问题是如何更清晰地捕捉动态面部序列中的亚毫米级细节,例如头发和毛孔。现有方法的局限性促使人们寻求一种能够在保持实时性的同时,高效地建模人类头部多样材料(包括眼睛、皮肤和头发)并容纳所有频率反射的创新解决方案。

现有的可重新调整光线头像方法一直面临着实时性和真实性之间的折衷。在实时应用中捕捉动态面部细节一直是一个持久的挑战。Meta AI 的研究团队认识到了这一差距,并提出了 “可重新调整光线的高斯编码头像” 作为一种革命性的解决方案。

Meta AI 的方法引入了基于3D 高斯函数的几何模型,提供了亚毫米级精度的准确性。这在捕捉动态面部序列方面是一个显著的进步,确保头像展示出逼真的细节,包括头发和毛孔的微妙之处。作为这种创新方法的关键组成部分,可学习的辐射转移外观模型构建了可重新调整光线的外观模型。

image.png

这些头像的亮点在于其全面的头像构建方法。以3D 高斯函数为参数的几何模型是头像的支撑,使得头像能够使用高斯扩散技术进行高效渲染。由可学习的辐射转移驱动的外观模型结合了漫反射球谐函数和镜面高斯函数,使得头像能够进行点光源和连续光照的实时重新调整。

除了这些技术方面,该方法引入了对表情、视线、观察角度和光线的可分离控制。通过利用潜在表情代码、视线信息和目标视角方向,可以实现头像的动态动画。这种控制水平是头像动画的重大进步,为用户提供了细腻而互动的使用体验。

这些头像不仅仅是理论上的进步,它们也提供了切实可行的结果。该方法允许对各个方面进行可分离的控制,通过头戴相机进行实时视频驱动动画的演示。这种能力创造了动态、互动的内容,实时视频输入可以无缝驱动头像。

Meta AI 的 “可重新调整光线的高斯编码头像” 标志着创新在解决复杂问题方面的巨大威力。通过将基于3D 高斯函数的几何模型与革命性的可学习辐射转移外观模型相结合,研究团队超越了现有方法的局限,为头像的逼真程度树立了新的标准。

论文网址:https://arxiv.org/abs/2312.03704

项目网址:https://shunsukesaito.github.io/rgca/

举报

  • 相关推荐
  • Lamett乐迈石晶快装秘籍!让武汉20年老宅“一键焕新”

    武汉黄先生一家140平米老宅经《梦想改造家》节目改造后焕然一新。设计师采用零甲醛添加的Lamett乐迈石晶地板,解决潮湿问题,提升防滑耐磨性能。空间重构实现客卧对调、主卧休闲办公一体化,厨房岛台增进家人互动。全屋原木色调营造温馨氛围,兼顾健康与美学,为五口之家打造安全舒适的生活环境。

  • 15天快装开业,Lamett乐迈石晶地墙品类投资模式解析

    贝壳研究院数据显示,2025年中国存量房装修市场规模将达3.34万亿元,消费者对健康环保、便捷高效的家装需求持续攀升。乐迈石晶作为全球石晶品类开创者,推出"100㎡开店、10余万投资、15天极速开业"轻资产模式,携手经销商掘金"新房整装+旧房改造"市场。其首创的石晶地板和石晶柜板技术,实现从地面材料向墙面、柜体等全屋空间应用的跨越,构建"地墙柜一体化"健康整装系统。凭借"零醛添加、防水防潮"等核心性能优势,石晶材料正加速替代传统建材。目前乐迈石晶在全球拥有10余家工厂及销售机构,业务遍及80多个国家和地区,为高端住宅及商业空间提供整体解决方案。

  • 从头像到乐队,Soul App的数字文创的次元突破

    社交平台Soul推出"NOISE宇宙噪点"数字文创系列,以虚拟乐队为载体,将宇宙微波背景辐射转化为可交互的数字社交体验。该系列延续原IP"莫比乌斯",推出由四位虚拟乐手组成的新乐队,融合电子摇滚与实验噪音音乐。项目通过AI虚拟偶像互动、换装玩法等形式,为用户提供表达与共鸣空间。Soul将Z世代情绪比作宇宙信号,通过数字头像、音乐作品等具象化呈现,构建"创作-互动-情感共鸣"的内容生态。数据显示,61.38%的年轻人通过兴趣社交获得情绪满足,平台持续加码数字文创战略,精准把握Z世代对Y2K、摇滚等潮流元素的喜好。在算法驱动时代,该项目展现了科技守护人性微光的社交哲学。

  • 从“手动挡”进入“AI智能挡”:亚数TrustAsia 开启证书管理「服务化」CaaS 新时代

    随着TLS/SSL证书有效期缩短至47天,企业面临信任中断风险加剧、内部系统协同困难及预警监测缺失三大挑战。亚数TrustAsia推出新一代智能证书管理体系TrustAsia CaaS,通过自动化流程实现证书全生命周期管理,提供六大核心能力:资产发现与管理、多CA自动化签发、自动化分发部署、实时监测告警、无缝集成定制及全流程自动化,有效应对加密敏捷性需求,助力企业构建安全可信�

  • 带猫环游世界的@不撸猫HaiTang 如何吸引1亿点赞?

    当打工人还在幻想诗和远方,@不撸猫HaiTang 已经带着他的两只狸花猫开始环游世界了! 视频里,这只名为海棠的狸花猫,在菲律宾的划艇上悠闲地打量着海洋;另一段视频中,它又出现在日本北海道的雪景里,好奇地从主人的背包里探出小脑袋。

  • 一款专为日常需求设计的超值平板:三星Galaxy Tab S10 Lite正式发布

    三星电子于2025年8月25日发布Galaxy Tab S10 Lite平板电脑,配备10.9英寸大屏、S Pen手写笔及多项智能功能,支持高效学习、创作与娱乐。搭载升级处理器、8000mAh电池和快充技术,确保长续航。提供星空灰、星川银、星语红三款配色,9月5日起陆续上市。

  • 自动化浏览器控制领域工具深度对比:NXNOS、TARS与Fellou性能与成本

    本文对比三款自动化浏览器控制工具:NXNOS、Agent+TARS和Fellou。从企业背景、技术架构、稳定性实测和硬件成本四个维度分析,NXNOS在复杂场景容错和长期运行稳定性上表现突出,硬件门槛低;Agent+TARS侧重跨设备自动化但资源需求高;Fellou适合轻量任务但复杂场景适配弱。建议用户根据场景复杂度、并发需求和预算选择,无绝对优劣,只有适用性差异。

  • 苹果iOS 26 Beta 8上线:测试版即将结束 正式版9月亮相

    苹果今日向开发者推送了iOS 26 Beta 8,这意味着Beta测试即将结束。通常情况下,苹果在iOS正式版发布前,只会向开发者推送8个Beta版本。 此前,iOS 18、iOS 17、iOS 16、iOS 15、iOS 14以及iOS 13的Beta版本均未超过8个,回溯至2018年,iOS 12曾推出过第9、第10、第11乃至第12个Beta版本,但自那以后,苹果在9月发布前进行如此频繁的更新。 就iOS 18而言,苹果于8月28日推送了第8个Beta版本,之�

  • 法大大Nota Sign全球签,解决跨境生意的“信任焦虑”

    法大大推出Nota Sign全球签平台,助力中国企业出海合规签约。该平台提供安全、合规、高效的电子签约解决方案,覆盖100+国家地区法律要求,支持多语言智能翻译和AI风险识别。2024年中国企业出海规模达2.17万亿美元,但面临跨境合同签署效率低、合规风险高等痛点。Nota Sign通过全球数据中心部署、集成权威CA机构、适配欧盟eIDAS等监管要求,实现毫秒级响应签约。平台已服务10万+企业客户,在汽车、互联网等行业沉淀解决方案,通过AI智能比对合同条款、提醒履约节点,将签约周期从数天缩短至分钟级。法大大创始人表示,未来3-5年随着中国企业出海范围扩大,具备全球化能力的可信电子签约平台将成为跨境商业合作的基础设施。

  • 小米张国全回应澎湃OS 3 Beta版是否本月推出:不能说 很快!

    小米集团日前发布了第二季度财报,小米手机系统软件部总监张国全转发了该消息,并表示坚定投入核心技术,连续3个季度超千亿”。 有网友在评论区问到,澎湃OS 3 Beta版是否会在这个月推出,张国全回复称:不能说,很快”。另外,近期国产手机厂商都纷纷接入了12306,可以在系统内方便的展示购票信息。 也有网友问到了澎湃这边什么时候接入,张国全称:本来计划OS3一�

今日大家都在搜的词:

热文

  • 3 天
  • 7天