首页 > 业界 > 关键词  > AI视频最新资讯  > 正文

Rerender A Video源代码放出!解决AI视频闪烁问题

2023-09-26 11:23 · 稿源:站长之家

站长之家(ChinaZ.com)9月26日 消息:Rerender A Video是一项令人印象深刻的技术成果,它旨在将大型文本到图像扩散模型的能力扩展到视频领域。该项目提出了一种零训练的文本引导视频到视频翻译框架,能够在视频帧之间确保时间一致性,这一直是一个巨大的挑战。

它包括两个主要部分:关键帧翻译和完整视频翻译。第一部分使用适应的扩散模型生成关键帧,通过应用层次交叉帧约束来强化形状、纹理和颜色的连贯性。

image.png

项目地址:https://github.com/williamyang1991/Rerender_A_Video

第二部分则通过时间感知的补丁匹配和帧混合将关键帧传播到其他帧。这个框架以较低的成本实现了全局样式和局部纹理的时间一致性,而无需重新训练或优化。

它还与现有的图像扩散技术兼容,可以利用它们,例如使用LoRA自定义特定主题,或者使用ControlNet引入额外的空间引导。大量的实验结果证明了该框架在渲染高质量和时间一致性视频方面的有效性。

核心功能:

时间一致性: 通过交叉帧约束实现低级别时间一致性,确保生成的视频帧之间的平滑过渡。

零训练: 无需对模型进行训练或微调,使其适用于各种视频翻译任务。

灵活性: 与现成的模型(如ControlNet、LoRA等)兼容,可以根据需求自定义翻译过程。

WebUI界面: 提供了用户友好的Web界面,使用户可以轻松上传视频、输入提示、选择种子等,并运行不同的翻译步骤。

命令行支持: 提供了灵活的命令行脚本,允许用户通过命令行参数控制翻译过程。

举报

  • 相关推荐
  • Chat Video:用GPT分析和总结视频

    ChatVideo是一个基于人工智能的视频分析和管理工具,致力于帮助用户高效学习和管理视频。在这个视频泛滥的时代,ChatVideo凭借其独特的AI技术,为用户节省大量时间,真正释放视频的价值。如果你希望高效管理视频,ChatVideo一定是你的最佳选择。

  • 登Nature两年,谷歌「AI 6小时设计芯片」遭打脸?大神Jeff Dean论文被官方调查,疑似隐藏源代码

    【新智元导读】在2021年9月,由JeffDean领衔的谷歌大脑团队发表了一篇AI设计芯片的论文,曾引起业界轰动。随后有多人发现这项工作并不能被复现关键数据和代码被隐藏了,Nature也对此展开了调查。这篇曾引起整个EDA和IC设计社区的轰动的论文,如今在被Nature重新调查,不知后续会如何发展。

  • 蚂蚁集团开源代码大模型CodeFuse-CodeLlama-34B 4bits量化版本

    蚂蚁集团代码大模型CodeFuse-CodeLlama-34B4bits量化版本发布。CodeFuse-CodeLlama-34B-4bits是CodeFuse-CodeLlama-34B模型的4bits量化版本,后者是通过QLoRA对基座模型CodeLlama-34b-Python进行多代码任务微调得到的代码大模型,模型输入长度为4K。CodeFuse是蚂蚁自研的代码生成专属大模型,根据开发者的输入提供智能建议和实时支持,帮助开发者自动生成代码、自动增加注释,自动生成测试用例,修复和优化代码等,以提升研发效率。

  • Deci AI推出8.2亿参数的文本到图像潜在扩散模型DeciDiffusion 1.0

    DeciAI最近推出了DeciDiffusion1.0,这是一项令人振奋的创新,旨在解决文本到图像生成领域的挑战。将文本描述转化为栩栩如生的图像一直是人工智能领域的难题,因为这涉及到自然语言理解和视觉内容创建之间的巨大差距。随着研究人员继续推动AI能够实现的界限,我们可以期待进一步的突破,使我们更接近一个世界,其中文本无缝地转化为引人入胜的图像,从在各个行业和领�

  • 农狂喜!微软提出CodePlan,跨168个代码库编任务,LLM自动化完成

    微软提出的CodePlan让码农的生产力又提高了!对于大模型来说,擅长的是本地化编码任务。但如果任务跨越了多个相互依赖的文件,LLM却无法解决。它成功应对了许多挑战,为高效可靠的软件工程实践开辟了新的可能性。

  • 万能AI编程工具包插件Sidekick 提供个性化编程帮助

    SidekickAI是一款强大的VisualStudioCode扩展,旨在帮助开发人员更快速、更高效地编写代码、提出问题和发现错误。它由GPT-4引擎提供支持,为开发者提供高效、便捷的编程体验。这些核心功能使SidekickAI成为了开发人员的得力助手,能够加速编码过程、提高代码质量,并提供了智能工具来解决复杂的开发任务。

  • 姜子牙大模型开源代码大模型Ziya-Coding-34B-v1.0

    IDEA研究院封神榜团队最近开源了最新的代码大模型Ziya-Coding-34B-v1.0,该模型在HumanEvalPass@1的评测上取得了75.5的好成绩,超过了GPT-4的得分。此次开源的Ziya-Coding-34B-v1.0,基于CodeLLaMA34B的预训练模型,经过了两个阶段的有监督精调,支持多种与代码相关的任务,包括代码生成、代码解释、代码纠错以及单元测试的生成等。

  • 对标GPT-4代码解释器!港中大让模型写代码解决数学难题,得分超越GPT-4

    对标GPT-4代码解释器,港中大最新研究放了个“大招”:他们开发了一个叫做MathCoder的大模型,数学能力直接在竞赛级“题库”Math上超过GPT-4。做到这一点靠的就是无缝集成代码的能力——在遇到数学问题时,它不仅能用自然语言推理能自动编写和执行代码来建模、推导公式与方程。通讯作者为李鸿升,为港中大电子工程系副教授,同时也就职于上海人工智能研究室。

  • IDC:AI解决PC行业销售问题的方案

    据IDC称,AI被视为解决PC行业销售问题的一种潜在方案,尽管该分析师承认使用案例尚未完全明确。随着ChatGPT的公开发布,生成式AI引起了广泛的关注,大型软件和硬件品牌正竭力将这一技术应用到各个领域。”她还表示,只要假日销售不崩溃,PC供应链中的库存将在年底前保持在正常范围内,即四到六周。

  • AI初创公司Delphi新举措:将打造网红和名人AI数字虚拟人

    人工智能初创公司Delphi致力于将名人和网红的互动扩展到更多人群。这家初创公司采用创新的方法,通过模仿名人和网红的个性,为他们创建数字聊天机器人,以实现一对一互动。这一创新商业模式的成功与否,将在很大程度上取决于其技术的卓越性以及聊天机器人与原始人物的相似度。