首页 > 业界 > 关键词  > AVID最新资讯  > 正文

Meta AI开源T2V模型AVID 可修复视频改变纹理

2023-12-12 10:27 · 稿源:站长之家

站长之家(ChinaZ.com)12月12日 消息:Meta AI最近开源了AVID,这是一项具有先进修复和扩展能力的 T2V 模型。AVID 不仅支持通过文本编辑视频,还可以修复视频、更改视频对象、改变纹理和颜色,甚至删除视频内容或更换视频环境。

image.png

项目地址:https://zhang-zx.github.io/AVID/

这个开源项目是为了解决文本引导的视频修复所面临的三个主要挑战:时间一致性、不同保真度级别的支持以及处理可变的视频长度。

AVID 模型具备有效的运动模块和可调节的结构引导,可以用于固定长度的视频修复。此外,该模型还引入了一种新颖的时间多重扩散采样管道,具有中帧注意力引导机制,有助于生成任何所需持续时间的视频。经过综合实验,AVID 模型在不同的视频持续时间范围内都能稳健地处理各种修复类型,并且质量很高。

在培训阶段,AVID 模型采用了两步方法。首先,在主要文本到图像 (T2I) 修复模型的每一层后集成了运动模块,并对视频数据进行了优化。

其次,保留了 UNet $\epsilon_\theta$ 中的参数,并利用 UNet 编码器的参数副本专门训练了结构指导模块 $\mathbf{s}_\theta$。在推理过程中,对于长度为 $N^\prime$ 的视频,AVID 模型会构建一系列片段,每个片段包含 $N$ 个连续帧,并在每个去噪步骤中计算并汇总每个分段的结果。

举报

  • 相关推荐
  • 菁彩Vivid搭载车量超百万,携手车企迎来车载应用新里程碑!

    2025年11月5日,世界超高清视频产业联盟在深圳举办UWA+峰会,宣布中国自主三维音频标准“菁彩声”(Audio Vivid)车载应用装机量突破100万台。该标准基于AI技术,支持7阶HOA渲染与128轨实时处理,解码延迟低于80ms,实现三维空间精准定位与“黄金听音位”个性化体验。已覆盖鸿蒙智行、奇瑞等十余家车企29款车型,获IEC国际标准认证,与Dolby AC-4等并列全球四大三维音频标准。通过构建“标准-内容-终端”生态,推动中国音频产业从技术领先迈向市场引领。

  • 机器人“全能导航大脑”来了!银河通用发布NavFoM大模型

    银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM,实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用,通过统一“视频流+文本指令→动作轨迹”范式,融合800万条跨任务导航数据,在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施,为规模化商业落地奠定关键基础。

  • 专注你的创意,制作交给 Avid——Avid职业剪辑师技术培训在京举办

    此次针对中国剪辑师学会的剪辑师们所举办的 Avid职业剪辑师技术培训与交流活动,主要涉及Avid Media Composer的媒体工作流程、剪辑工具集和媒体管理方案...与此Avid还提供一系列专为后期制作专业人员而设计的不同配置的产品,为他们提供更高的创造性能,充分满足他们的项目制作需求...基于此,进一步掌握包括Media Composer等在内的Avid制作产品及其整体制作流程,无疑对中国的Avid职业剪辑师及剪辑师后续更好地展开与国内外的项目合作,有着积极的意义......

  • 信锐助力TCL获 “2025中国IDC未来企业大奖联接领军者”优秀奖!

    10月17日,TCL空调办公网络智能连接与体验升级项目在IDC中国CIO峰会获“2025未来企业连接领军者”优秀奖。该项目依托信锐“AI+网络自动驾驶”理念,通过全网智能2.0与小信GPT方案重构企业网络管理模式,实现从感知、分析到决策的智能闭环,助力TCL实现20+维度数据采集、7*24小时AI调优及自然语言交互运维,推动企业数字化转型升级。

  • 平安云原生AI算力资源调度平台,荣获IDC “AI-就绪数字基础设施领军者优秀奖”

    近日,IDC公布2025年中国未来企业大奖获奖名单,平安科技打造的《云原生AI算力资源调度平台》创新项目荣获“AI就绪数字基础设施领军者优秀奖”。该平台通过统一资源池化管理、动态调度及GPU虚拟化等技术,显著提升资源利用率约30%,降低运营成本,并支持金融级高可用与弹性伸缩,助力企业高效应对AI推理与训练场景需求,体现了平安在AI基础设施构建与产业赋能方面的技术实力与国际认可。

  • 以算力为基,优刻得与IDEA共建低空经济新格局

    10月24日,粤港澳大湾区数字经济研究院低空经济院长李世鹏一行访问优刻得上海总部,与董事长季昕华、副总裁韩畅交流。双方围绕低空经济发展趋势、技术攻关及生态共建等达成多项合作意向,将共同推动低空经济产业创新与落地。此前中共二十届四中全会提出加快低空经济等新兴产业发展。双方团队将在技术产品创新、生态共建与全球化布局等领域深化合作,整合云计算与产业资源优势,促进低空经济全链条发展,把握战略机遇,引领产业健康、智能、可持续发展新阶段。

  • 又一入门级!中兴Avid Plus发布:750元

    在今天举行的CES2016大展上,中兴除了为我们带来了定位中低端的Grand X 3,还有另一款新机Avid Plus,该机相较Grand X3定位更加低端。

  • David Kedwards:华尔街英语深耕中国市场20年初心不变

    近日,网易教育特邀华尔街英语全球首席执行官David Kedwards,就华尔街英语作为全球领先的成人英语培训品牌,如何在进入中国市场20年来能够始终初心不变并取得成功的原因进行了一对一的深度访谈。以下为访谈记录。主持人:请问华尔街英语长期成功发展的秘诀有哪些?David Kedwards:总体来说,有三个主要层面。首先,半个世纪以来,华尔街英语一直专注耕耘成人英语培训市场,对市场和客户有着深刻的洞察,这种持久的专注与专业是我

  • 看完牙医生无可恋:David DeVore将童年模因与NFT挂钩拍卖

    2008 年的时候,当时才 7 岁的 David DeVore 被父亲带着去看了趟牙医,但返程时的他因为打了麻药而陷入了沉思。几个月后,视频被传导了 YouTube 上,原意是想和亲朋友好分享以下,没想到在 11 年间迎来了超过 1.4 亿的观看量。现在,David DeVore 决定趁着 NFT 艺术品的热潮,将这个“David After Dentist”作品拿出来拍卖。David DeVore 在接受 TheVerge 采访时称:“这感觉又像是回到了 2009 年,当时的社交媒体正处于起步阶段,

  • AI日报:Sora正式登陆Android;网易云音乐推AI调音大师;谷歌将推Nano Banana2

    本期AI日报聚焦多领域突破:OpenAI视频应用Sora登陆安卓平台并引入付费角色功能;网易云音乐推出AI调音大师实现智能音效适配;字节跳动高薪布局人形机器人赛道;谷歌Gemini平台将升级图像生成技术;llama.cpp实现多模态革命;特斯拉秘密实验室通过行为数据训练机器人;上海首例AI著作权案宣判保护原创;微软推出自研图像生成器MAI-Image-1,在创意效率与质量间取得平衡。

今日大家都在搜的词: