南洋理工发布提高AI视频生成内容一致性方法FreeInit

2023-12-14 09:43 · 稿源：站长之家

要点:
FreeInit方法提升视频扩散模型生成的时空一致性。
通过发现噪声初始化在视频扩散模型中存在的隐含训练-推理差距，提出了FreeInit，无需额外训练，不引入可学习参数。
FreeInit通过迭代优化推理初始噪声的时空低频组件，弥补训练和推理之间的初始化差距，显著提高生成结果的时空一致性。

站长之家（ChinaZ.com）12月14日消息:南洋理工大学发布了一项名为FreeInit的方法，该方法可以大幅提高人工智能视频生成的内容一致性。演示显示这一方法非常流畅，并且可以与现有的SD生态结合。此外，他们还发表了与Animatediff结合的方法，只需等待一些专业人士制作插件，就可以使用这一方法。视频中展示了使用了FreeInit和未使用FreeInit的Animaetdiff的对比。

项目地址:https://tianxingwu.github.io/pages/FreeInit/

根据他们的介绍，他们深入研究了视频扩散模型的噪声初始化，并发现了一个隐含的训练-推断差距，导致了推断质量的下降。他们的关键发现包括推断时初始潜变量的信噪比（SNR）的时空频率分布与训练时本质上不同，以及去噪过程受到初始噪声的低频分量的显著影响。

在受到这些观察的启发下，他们提出了一种简洁而有效的推断采样策略FreeInit，该策略能够显著改善扩散模型生成的视频的时间一致性。通过在推断过程中迭代地优化初始潜变量的时空低频分量，FreeInit能够弥补训练和推断之间的初始化差距，从而有效改善生成结果的主体外观和时间一致性。

FreeInit以迭代方式改进推断初始噪声，通过DDIM采样、DDPM前向和噪声重新初始化，初始噪声的低频成分逐渐得到改进，从而持续增强时间一致性和主体外观。

这一方法的发布为人工智能视频生成领域带来了新的突破，将有望提高视频生成的质量和时间一致性。随着这一技术的不断发展和完善，相信将会为视频内容创作和人工智能应用带来更多的可能性。

（举报）

相关推荐
大家在看

关键词：

AI视频

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
AI视频生成神器 PixVerse:保持角色一致性、百变场景

视频生成神器PixVerse推出了新功能，让用户能够实现角色一致性换背景，解决了AI生成效果不一致的问题。网友展示了生成效果，角色面部基本一致，背景丰富生动。期待未来AI技术的发展，为各行业带来更多可能性。

PixVerse AI视频 AI头条
MuseV：基于SD的AI视频生成工具角色一致且视频时长不限

一款名为MuseV的虚拟人视频完整解决方案应运生，为虚拟人视频领域带来了全新的突破。MuseV基于SD，支持文生视频、图生视频、视频生视频等多种生成方式，能够保持角色一致性，且不受视频长度限制。无论是个人用户还是企业用户，都可以通过MuseV轻松地制作出高质量的虚拟人视频，满足各种场景的需求。

MuseV AI视频 AI头条
AI视频生成工具ID-Animator：可保持角色一致生成视频动画

生成具有指定身份的高保真人类视频引起了广泛关注。现有技术在训练效率和身份保持之间往往难以取得平衡，要么需要繁琐的逐案微调，要么在视频生成过程中通常会丢失身份细节。当提供多个控制图像时，生成的视频序列紧密遵循多个图像提供的序列。

ID-Animator AI头条
Infinity AI官网体验入口人工智能视频生成工具在线使用地址

InfinityAI是一家专注于人类故事创作的人工智能视频生成工具提供商。他们致力于构建生成式视频模型，通过只有3名作家的团队创作出获奖影片。了解更多关于InfinityAI的信息，并开始您的人工智能视频生成之旅。

InfinityAI
MuseV官网体验入口虚拟人AI视频生成软件使用地址

MuseV是一个基于扩散模型的虚拟人视频生成框架，支持无限长度视频生成，采用了新颖的视觉条件并行去噪方案。它提供了预训练的虚拟人视频生成模型，支持Image2Video、Text2Image2Video、Video2Video等功能，兼容StableDiffusion生态系统，包括基础模型、LoRA、ControlNet等。要了解更多有关MuseV的信息，欢迎访问官方网站。

MuseV
DreaMoving可控制AI视频生成框架使用地址阿里dreamoving官方入口

DreaMoving是什么？DreaMoving是阿里一个基于扩散模型的可控制视频生成框架，用于生成高质量的定制人类舞蹈视频。DreaMoving能够适应大多数风格化扩散模型以生成多样化的结果。

DreaMoving
Krea AI将推视频生成功能界面更加简洁美观了

KreaAI即将推出的视频生成功能，无疑将为设计领域带来新的革命。这个功能的推出，将使得用户能够轻松地生成高质量的视频内容，无论是用于广告、电影、游戏概念设计是用于社交媒体分享，都将变得非常方便。KreaAI推出实时增强功能，可以让用户在绘制图像时，实时看到图像的细节和分辨率的提升，这对于需要精细作画的设计工作来说，无疑是一大福音。

Krea AI头条
太卷了！字节最新AI神器Dreamina开放试用 4秒AI视频生成国内最强（附Dreamina详细使用教程）

字节的生成式视频软件Dreamina正式开始内测，小编昨天也通过了审核，可以体验Dreamina的视频生成功能。小编简单体验了下，Dreamina整体的操作会比较简单，对小白也比较友好，可以说是国内4秒AI视频生成时代最大的惊喜吧。目前免费生成只支持生成3秒，生成后的视频再延长3秒需要付费。

Dreamina Dreamina使用教程 AI头条
荐统一角色、百变场景，视频生成神器PixVerse被网友玩出了花，超强一致性成「杀招」

你是否会遇见过想要给图片角色换个背景，但是AI总是搞出「物非人也非」的效果。即使在Midjourney、DALL・E这样成熟的生成工具中，保持角色一致性还得有些prompt技巧，不然人物就会变来变去，根本达不到你想要的结果。显然这次PixVerse使用技能是「一致性」。

PixVerse
AI延时视频生成工具MagicTime在线体验地址放出

MagicTime是一款创新的在线工具，它能够根据用户提供的文本描述生成展示真实世界物理变化过程的时间延迟视频。这种技术的应用范围非常广泛，可以用于记录和展示各种自然和人为引起的变化过程。对于教育和科普来说，MagicTime提供了一种生动、直观的教学工具，帮助学生和公众更好地理解复杂的科学概念。

MagicTime AI头条

今日大家都在搜的词：

热文

3 天
7天

南洋理工发布提高AI视频生成内容一致性方法FreeInit

今日大家都在搜的词：

热文

站长商机