首页 > 业界 > 关键词  > HiFi4G最新资讯  > 正文

25倍压缩率!​HiFi4G渲染技术实现照片级真实人体建模和高效渲染

2023-12-13 10:18 · 稿源:站长之家

**划重点:**

1. 🌐 HiFi4G实现了从密集视频中重新创建高保真4D人体表演的全显式和紧凑方法。

2. 🎮 HiFi4G在优化速度、渲染质量和存储开销方面明显优于当前的隐式渲染技术。

3. 📦 研究团队提供了一种压缩方法,使HiFi4G在每帧不到2MB的存储空间下,以约25倍的压缩率,可在各种设备上实现沉浸式观看人体表演。

站长之家(ChinaZ.com)12月13日 消息:近日,上海科技大学、NeuDim、字节跳动和DGene的研究团队共同发布了一篇名为《HiFi4G:人体建模和高效渲染的突破性进展》的AI论文。该论文介绍了HiFi4G,这是一种全新的、全显式且紧凑的高斯方法,用于从密集视频中重新创建高保真的4D人体表演。

这项研究的主要亮点在于,HiFi4G通过将非刚性跟踪与3D高斯表达相结合,成功分离了运动和外观数据,从而实现了紧凑且压缩友好的表达。相较于当前的隐式渲染技术,HiFi4G在优化速度、渲染质量和存储开销方面取得了明显的改进。

具体而言,研究团队首先提出了一种双图方法,包括细粒度高斯和粗略变形图,以自然地将高斯表示与非刚性跟踪连接起来。通过使用NeuS2创建每帧几何代理,并以关键帧的方式使用嵌入式变形(ED),这一显式跟踪技术将序列划分为部分,为每个部分内的运动提供了丰富的历史信息。

接下来,研究团队为进一步初始化构建了一个细粒度高斯图,通过从粗略ED网络中插值每个高斯运动。为了平衡高斯特征和非刚性运动先验的更新,研究团队提出了一种4D高斯优化方法。他们使用时间正则化器确保每个高斯的外观属性的一致性,如不透明度、缩放系数和球谐(SH)。对于运动特征(位置和旋转),研究团队建议使用平滑项,以在相邻高斯之间生成局部尽可能刚性的运动。

为了应对在表现小而非刚性运动的区域出现的颤动现象,研究团队为这些正则化器添加了自适应加权机制。经过优化,研究团队生成了时空紧凑的4D高斯。为了使HiFi4G对用户更加实用,研究团队提出了一种伴随的压缩技术,采用传统的残差校正、量化和熵编码,以适应各种平台上的低存储沉浸式人体表演体验。

HiFi4G作为一种用于高保真人体表现渲染的方法,具有以下特色功能:

  • 紧凑的高斯喷溅表示法: HiFi4G采用3D高斯表达与非刚性跟踪相结合,实现了紧凑且压缩友好的表示。这种方法通过采用双图机制,包括粗糙变形图和细粒度高斯图,来获得运动的先验知识。

  • 双图机制: 引入了双图机制,其中包括一个用于有效初始化的粗糙变形图和一个用于强制约束的细粒度高斯图,以实现对非刚性运动的建模。

image.png

  • 4D高斯优化方案: 采用了4D高斯优化方案,其中包括自适应的时空正则化器,以有效平衡非刚性先验和高斯更新,实现高质量的人体表现渲染。

  • 伴随的压缩方案: 提出了一个伴随的压缩方案,包括残差补偿,可在各种平台上实现沉浸式体验。该方案实现了约25倍的压缩率,每帧不到2MB的存储开销。

  • 关键帧非刚性跟踪: 通过基于关键帧的非刚性跟踪,建立了一个粗糙变形图,并跟踪了高斯优化的运动,为后续渲染提供支持。

  • 实时高保真渲染: HiFi4G能够在实时性要求下,对具有挑战性动作的人体表现进行高保真渲染,例如演奏乐器、跳舞和更衣等。

image.png

渲染结果:HiFi4G 可实时高保真地渲染人类在演奏乐器、跳舞和换衣服等具有挑战性的动作中的表现。

在应用场景上,HiFi4G可以用于电影、电视剧和游戏制作,实现更逼真、高保真的人物表现渲染。特别是在需要展现复杂人体动作,如演奏乐器、跳舞和更衣等情境下,可以提供更真实的画面效果。另外,由于HiFi4G能够实现实时高保真渲染,它在虚拟现实和增强现实应用中也具备广泛的应用前景。用户在虚拟环境中进行各种活动时,可以获得更具沉浸感的体验。

项目网址:https://nowheretrix.github.io/HiFi4G/

论文网址:https://arxiv.org/abs/2312.03461

举报

  • 相关推荐
  • CNS作者来评审!AI4S智能体CNS挑战赛启动,叩响自主科研新纪元大门

    AI与科学双向奔赴的当下,在以Cell、Nature、Science(CNS)为代表的全球顶尖科研“殿堂”中,科学智能(AI for Science, AI4S)成果愈发受人瞩目。然而,在传统科研范式里,AI大多扮演着“被动待命”的静态辅助工具角色,其应用依赖人类科学家从问题定义、模型设计到结果解读的全流程主导和反复推敲。当面对CNS级别的科学命题时,这种“人力主导”的模式在超大规模高维数据面�

  • 苹果折叠屏渲染图曝光:不对称设计 形态类似书本

    据站长之家报道,知名爆料人Sonny Dickson近日公布了苹果首款折叠屏手机iPhone Fold的3D设计图。该机预计今年秋季发布,采用左右折叠方案,外屏5.5英寸,内屏展开达7.8英寸,后置相机模组延续iPhone Air风格。为优化折叠体验,苹果在屏幕结构中采用超薄玻璃与特殊防护膜,并通过金属板分散应力。由于铰链、屏幕及机身成本显著增加,其售价预计在2000至2500美元之间,或将成为苹果首款突破2000美元价位的iPhone。

  • 2499元的超级直播神器!华为随行WiFi X发布:下行5.3Gbps、上行1000Mbps

    华为在鸿蒙智家技术沟通会上正式发布华为随行WiFi X,定位超级直播神器,售价2499元。 有多个融合套餐可选,199元/200GB、299元/350GB、399元/500GB。 华为随行WiFi X是全球首款四发四收终端,搭载三载波聚合技术,实现5.3Gbps下行峰值速率、1000Mbps上行峰值速率。 远场弱场直播流畅度较旗舰手机提升100%,拥塞网络下直播流畅度提升50%,轻松满足4K高清直播、大文件高速传输等高速�

  • “龙虾”狂热:ChatGPT们只是AI的后端,OpenClaw让AI真正有了前端

    Agent 这个词,AI 行业喊了至少两年。2024年起,每一场发布会都在谈 Agent,投资机构管它叫下一个万亿市场,创业公司一夜之间改了 slogan。但打开产品一看,还是一个对话框等你打字:你给指令,它给回答;你不提问,它就停在那儿。 概念跑得很快,产品形态没跟上。直到 OpenClaw 出来,这种错位才突然变得可见——不是因为它发明了什么新技术,而是它把那层一直缺失的交互前�

  • 小红书挥刀AI托管账号,让AI当替身做账号行不通了

    ​“The AI that actually does things.”(真正能做事情的AI。) 最近,凭借令人惊喜的干活儿能力和无尽的想象空间,人称“龙虾”的开源AI智能体工具OpenClaw(下文统称“龙虾”)全国爆火,不仅引得各大厂纷纷下场推出专属龙虾,“安装龙虾、培养AI牛马”也成为当下最火爆的社交话题。 养龙虾的风刮到内容行业后,创作者们同样跃跃欲试,希望靠龙虾躺着涨粉、睡着赚钱。 在

  • AI日报:xAI发布Grok4.20;美团上线AI搜索产品“问小团”;百度健康内测AI医生助手“DoctorClaw”

    本期AI日报聚焦多领域AI进展:xAI发布Grok 4.20,推理能力显著提升,非幻觉率达78%;美团王兴强调物理世界数字化是AI落地核心,并上线AI搜索产品“问小团”;OpenAI Sora 2 API升级,支持角色一致性、20秒视频及横竖屏输出;百度健康内测AI医生助手“DoctorClaw”,专注学术检索与办公辅助;中国获批全球首个侵入式脑机接口医疗器械,为脊髓损伤患者带来新希望;Anthropic更新Claude插件,打通Excel与PowerPoint工作流;老板电器发布全球首款AI烹饪眼镜,通过第一视角实时指导烹饪;阿里云与腾讯在AI移动端竞争加剧,分别推出手机版“龙虾”与“Claw”产品。

  • 解放双手!千问AI眼镜将上线AI办事 不用手机就能点外卖、订酒店

    千问AI眼镜于AWE2026期间完成国内首次产品发布。 这款硬核智能穿戴设备不仅搭载多项旗舰配置,还将迎来功能重磅升级,本月底正式上线AI办事功能,让用户无需掏出手机,就能通过语音指令完成各类生活服务操作。 阿里巴巴千问相关负责人介绍,千问AI眼镜G1搭载双芯片双系统,64GB超大本地存储可轻松保存各类拍摄、录音文件,右镜腿创新采用热插拔换电设计,从根本上解

  • AI驱动人事服务变革 2 号人事部AI员工助手正式上线,让HR减负、员工省心

    在AI全面驱动企业管理升级的浪潮下,2号人事部推出AI员工助手,以自然语言交互为核心,打造零门槛、一站式员工自助服务入口。员工通过一句话即可完成假期、考勤、排班查询与审批直达,实现员工少提问、HR少被打断。产品支持HR后台统一管控、数据可量化ROI、按需计费成本可控,在不增加系统复杂度的前提下,大幅降低企业沟通成本、提升全员服务体验,助力企业人事服务高效升级。

  • 在EasyClaw上,我轻松养出了自己的AI“龙虾”

    “装龙虾(OpenClaw)”,突然成了一门显学。 3月6日,腾讯大楼外排起了长队,有人抱着电脑等待安装;小红书上,收费上门服务、免费教学和代装教程,层出不穷;甚至连路过的大爷大妈,也拎着电脑来凑热闹。这番景象,像极了ChatGPT横空出世的时候。 就在同一天,上百位网友从全国各地出发,齐聚猎豹移动位于北京朝阳的总部大楼,他们都是来参加上周末由猎豹移动举办的

  • 中国首个国产AI推理千卡集群落地 云天励飞助力打造湛江市“AI渗透之城”

    3月12日,云天励飞中标湛江市AI渗透支撑新质生产力基础设施建设,金额4.2亿元。项目将基于其自研国产AI推理加速卡,打造中国首个全栈国产AI推理千卡集群,搭载DeepSeek等国产大模型,为政务、产业及各类应用场景提供便捷、低成本的AI能力。此举标志着湛江人工智能产业发展迈出实质性步伐,“AI渗透之城”建设进入全面提速新阶段。

今日大家都在搜的词: