首页 > 业界 > 关键词  > 3D头像最新资讯  > 正文

谷歌被!高保真3D头像逼真到恐怖 小姐姐挤眼,挑眉毫无破绽

2024-05-31 14:50 · 稿源:站长之家

站长之家(ChinaZ.com)5月31日 消息:最近,一项由德国慕尼黑工业大学(TUM)和伦敦大学学院(UCL)等研究团队提出的新算法——NPGA(Neural Parametric Gaussian Avatar),引起了广泛关注。这项技术能够生成高保真3D头像,逼真的表情甚至让人怀疑自己的眼睛。

image.png

从官方给出的演示可以看到,NPGA生成的小姐姐不仅可以做出挤眼,挑眉,嘟嘴等各种丰富的表情,而且眼神细节等丝毫看不出破绽,俨然和真人无异。

image.png

NPGA技术的创新点

NPGA采用了一种基于高斯点云的方法来生成3D人像形状。这种方法通过无数个点来构建3D头像,使得渲染更加高效和逼真。此外,NPGA引入了神经参数化头部模型(NPHM),可以捕捉人脸细微的表情变化,从而使3D数字化身能够更真实地模拟人类表情。

NPGA算法亮点:

  • 高保真3D头像:NPGA能够生成逼真的3D头像,表情丰富,接近真实人类。

  • 恐怖谷效应:逼真度极高,以至于让人难以区分是真人还是虚拟形象。

  • 创新技术:与传统的3D网格模型相比,NPGA使用高斯点云,通过点来构建3D人像形状,提高渲染效率和逼真度。

  • 神经网络模型:利用神经参数化头模型(NPHM)捕捉人脸细微表情变化,模拟真实人类表情。

  • 拉普拉斯项:增强数字化身的表现力,通过潜在特征和预测动态提升化身的真实感。

技术细节:

数据集NeRSemble:包含4700多个多视角、高分辨率、高帧率视频,涵盖头部运动、情绪、表情和口语。

训练和优化:使用MonoNPHM模型和COLMAP计算的点云追踪,实现几何精确的模型追踪。

循环一致性目标:反转MonoNPHM的后向变形场,与基于光栅化的渲染兼容。

规范高斯点云和MLP:包含先验网络F进行前向变形,网络G学习细粒度动态细节。

应用前景:

电影、游戏、AR/VR远程会议:NPGA技术可广泛应用于这些领域,提供逼真的虚拟角色。

元宇宙:逼真的3D化身对于构建沉浸式虚拟世界至关重要。

实验评估:

自我重现任务:评估NPGA算法的保真度,结果显示在自我重现任务中有显著提升。

交叉重现任务:将一个人的表情转移到另一个虚拟化身上,NPGA表现出色。

局限性:

可控性和重建质量:受限于底层3DMM表达空间,某些区域如颈部、躯干等无法完全解释。

数据驱动限制:受可用数据限制,可能需要扩展底层3DMM以提供更详细的人类状态描述。

项目页:https://tobias-kirschstein.github.io/nersemble/

论文地址:https://arxiv.org/pdf/2405.19331

举报

  • 相关推荐
  • 聚首华南,2025下半年增材制造、3D 打印的顶尖展览与活动推荐

    2025年全球3D打印行业将迎来系列盛会。4月西安论坛成功举办后,下半年将迎来深圳Formnext Asia(8月26-28日)、东京论坛(9月25-26日)和法兰克福Formnext展会(11月18-21日)三大国际活动。这些平台将汇聚全球顶尖企业,展示航空航天、医疗健康、汽车工业等领域的最新技术成果,特别关注中国企业的快速成长。法兰克福展会预计吸引超900家展商,中国展商数量有望再创新高。系列活动将搭建全球产业交流平台,推动3D打印技术创新与商业应用深度融合。

  • 10倍精度升级!腾讯混元3D模型v2.5版本发布

    腾讯混元3D模型升级至v2.5版本,建模精度和贴图真实度显著提升。新版本参数体量从1B增至10B,有效面片数增加超10倍,支持1024几何分辨率。纹理系统支持4K高清贴图和凹凸细节,率先支持多视图生成PBR模型。针对动画场景优化骨骼蒙皮系统,支持非标准姿态自动绑定。新增文生/图生3D减面模型、多视图建模模板等专业工作流。混元3D v2.5已全面更新至腾讯AI创作引擎,免费生成额度提升至每日20次,并正式上线腾讯云API面向企业开放。GitHub开源版本累计Star超1.2万。

  • ​上海毅速推出第三代模具3D打印专机E3系列,引领模具制造技术革新

    导读:近年来,金属3D打印技术在模具制造领域得到了广泛的应用,模具行业正在迎来一场前所未有的技术变革,随着应用的逐渐深入,模具专用的金属3D打印机应运而生。2025 年 4 月 15 日,上海毅速激光科技有限公司(以下简称“毅速”)正式发布了其第三代模具3D打印专机系列——E3- 420 和E3-520。这一新品的推出,标志着模具制造行业向增材制造迈出了重要一步。毅速E3- 420 �

  • 曝iPhone 18 Pro内测屏下3D人脸识别:苹果迈入单挖孔屏时代

    这意味着iPhone 18 Pro系列正式迈入单挖孔屏时代,向安卓主流屏幕形态看齐。需要注意的是,安卓阵营普遍采用单挖孔 屏幕指纹识别方案,而iPhone则是采用屏下3D人脸识别方案,不支持屏幕指纹。

  • 3199元起!华为智能门锁2 Pro/Ultra开启预售:首次掌静脉+3D人脸识别

    华为智能门锁2 Pro、华为智能门锁2 Ultra今天正式开启预售,官方定价分别是3199 元、3699元起,国补到手价是2634.15元、3059.15元。

  • o3全网震撼实测:AGI真来了?最强氛围编程秒杀人类,却被曝捏造事实

    昨夜o3的发布,让人不尽感慨:打了这么久嘴炮的OpenAI,这回终于实实在在拿出了点真东西。史上首次,模型能够用图像思考,视觉推理达到巅峰。许多网友实测后,大感惊艳。o3能不断缩放图像,完成解题、识图,编程任务实测惊人。还有一大特点,就是速度快!只用2分55秒,它就解决了一道Project Euler问题,速度秒杀任何人类。甚至可以认为,o3是一个快速版的Deep Search,但不需

  • AI日报:腾讯混元3D生成模型2.5版本发布;海螺推出图像人物参考功能;百度上线移动端超级智能体心响App

    本文介绍了多款AI领域的新产品和技术进展:1)Kortix-AI推出开源通用AI智能体平台Suna;2)腾讯混元3D生成模型升级至2.5版本;3)海螺AI推出基于单张图像生成多角度角色图像功能;4)百度发布"心响"App整合多智能体协作;5)Nari Labs开源媲美真人的对话语音模型Dia;6)Grok新增视觉处理和多语言支持;7)Genspark推出AI幻灯片工具;8)Character.AI发布让静态图片"说话"的AvatarFX模型;9)pad.ws结合白板和代码编辑器;10)OpenBMB开源社区推出长文本生成模型"卷姬";11)腾讯推出AI阅读助手"企鹅读伴";12)OpenAI有意收购Chrome浏览器;13)字节跳动调整AI产品线布局。这些创新展现了AI技术在自动化、3D生成、语音交互、内容创作等领域的快速发展。

  • 盟友反目?苹果管“唱衰”搜索引擎,谷歌发文驳斥!

    显然,苹果希望这项交易继续有效,因为它每年从这项合作中获得了数百亿美元的利益。但 Cue 的这番言论却导致谷歌、苹果的股价双双下跌……

  • 爱奇艺改logo上热搜 官方回应:没换 是15周岁特别头像

    爱奇艺平台4月22日更换官方账号头像并发布新海报,引发网友热议。最显著变化是标志性绿色Logo被替换为黄色,部分用户认为新设计不如旧版美观且缺乏辨识度,更有网友调侃新头像像滴滴打车界面,引发"回忆杀"。对此爱奇艺官方迅速回应,澄清并未更换品牌Logo,此次变动仅为庆祝平台成立15周年的特别设计。

  • 小姐出海战略咨询|抓住亚马逊Cosmo算法红利:精细化用户洞察与营销策略

    亚马逊2024年9月推出的Cosmo算法将彻底改变跨境电商竞争格局。该算法实现从"千人一面"到"千人千面"的个性化推荐转型,通过全域数据分析深度理解用户行为和需求,为不同用户推荐最匹配产品。核心特征包括:1)从产品理解转向用户理解;2)从静态标签到动态认知;3)覆盖18个主要品类实现精准推荐。研究显示,该算法将带来三大机遇:突破价格战限制、精准定位细分市场、创造多元化竞争空间。典型案例显示,深耕细分市场的产品即使定价较高,只要精准定位目标用户仍能获得成功。专家建议卖家重点布局:1)深度细分市场;2)打造品牌差异化;3)重视站外营销;4)针对细分人群溢价。这标志着跨境电商进入以用户需求为核心的新竞争时代。