首页 > 业界 > 关键词  > AVID最新资讯  > 正文

Meta AI开源T2V模型AVID 可修复视频改变纹理

2023-12-12 10:27 · 稿源:站长之家

站长之家(ChinaZ.com)12月12日 消息:Meta AI最近开源了AVID,这是一项具有先进修复和扩展能力的 T2V 模型。AVID 不仅支持通过文本编辑视频,还可以修复视频、更改视频对象、改变纹理和颜色,甚至删除视频内容或更换视频环境。

image.png

项目地址:https://zhang-zx.github.io/AVID/

这个开源项目是为了解决文本引导的视频修复所面临的三个主要挑战:时间一致性、不同保真度级别的支持以及处理可变的视频长度。

AVID 模型具备有效的运动模块和可调节的结构引导,可以用于固定长度的视频修复。此外,该模型还引入了一种新颖的时间多重扩散采样管道,具有中帧注意力引导机制,有助于生成任何所需持续时间的视频。经过综合实验,AVID 模型在不同的视频持续时间范围内都能稳健地处理各种修复类型,并且质量很高。

在培训阶段,AVID 模型采用了两步方法。首先,在主要文本到图像 (T2I) 修复模型的每一层后集成了运动模块,并对视频数据进行了优化。

其次,保留了 UNet $\epsilon_\theta$ 中的参数,并利用 UNet 编码器的参数副本专门训练了结构指导模块 $\mathbf{s}_\theta$。在推理过程中,对于长度为 $N^\prime$ 的视频,AVID 模型会构建一系列片段,每个片段包含 $N$ 个连续帧,并在每个去噪步骤中计算并汇总每个分段的结果。

举报

  • 相关推荐
  • 四方合力推进菁彩Vivid技术应用,引领电影产业视听体验革新

    中国电影科研所、华夏电影、UWA联盟与华为在国家电影局指导下,于9月9日签署战略合作协议,共同推进HDR Vivid技术标准体系建设。该合作将打通从技术标准到内容制作、发行放映的完整产业链,加速超高清视频技术在全行业落地应用,推动中国自主音视频技术标准走向国际,助力2035年电影强国建设目标。

  • AI日报:生数科技上线Vidu Q1参考生图;字节跳动发布Seedream4.0;百度文心大模型X1.1发布

    本期AI日报聚焦多项AI技术突破与应用进展。生数科技推出Vidu Q1参考生图功能,支持多图输入与一致性生成;字节跳动发布Seedream4.0多模态图像创作模型,推理速度提升10倍;腾讯推出国内首款全形态AI编程工具CodeBuddy,编码效率提升40%;百度文心大模型X1.1升级深度学习能力;OpenAI支持AI动画长片《Critterz》制作;上海AI实验室发布XTuner V1训练引擎提升效率20%;谷歌AI搜索新增5种语言支持;我国发布30项人工智能和15项人形机器人国家标准,推动行业规范化发展。

  • 腾讯云联合IDC发布AI Infra报告:定义Gen Al时代智算新范式

    2025年腾讯全球数字生态大会于9月16-17日在深圳召开。在Infra+Agent专场,腾讯云与IDC联合发布《AI+Infra:加速智能体落地的基础架构、发展趋势与产业实践》报告。报告指出,随着AI应用规模化落地,AI云基础设施正向核心智算设施演进,涵盖分布式底座、异构硬件、高性能软件和场景化方案四大维度。报告还提出六大演进趋势:架构重构、行业垂直化、算力智能化、安全能力提升、研发范式创新和服务化转型,并解析了腾讯云在交通、制造、医疗等领域的落地案例,为企业智能化转型提供实践指南。

  • 恒创科技15 载笃行,构建企业出海全链路 IDC 解决方案

    2025年全球经济格局深度变革,中国作为世界第二大经济体地位愈发关键。一方面凭借庞大市场规模、完备产业体系及持续优化的营商环境,吸引国际企业加大布局;另一方面受国内市场竞争加剧、增长空间收窄,叠加移动互联网爆发式发展与经济全球化深化驱动,中国企业“出海”已成不可逆趋势。出海企业普遍面临海外服务商筛选、复杂网络难题破解等核心挑战。恒创科技依托香港及亚太地区数据中心优势,启动全球化战略布局,为个人开发者及企业提供有力支撑,携手推进全球化发展。

  • 专注你的创意,制作交给 Avid——Avid职业剪辑师技术培训在京举办

    此次针对中国剪辑师学会的剪辑师们所举办的 Avid职业剪辑师技术培训与交流活动,主要涉及Avid Media Composer的媒体工作流程、剪辑工具集和媒体管理方案...与此Avid还提供一系列专为后期制作专业人员而设计的不同配置的产品,为他们提供更高的创造性能,充分满足他们的项目制作需求...基于此,进一步掌握包括Media Composer等在内的Avid制作产品及其整体制作流程,无疑对中国的Avid职业剪辑师及剪辑师后续更好地展开与国内外的项目合作,有着积极的意义......

  • 从RE+ 2025看未来,海辰储能AIDC储能解决方案打破“能耗焦虑”

    海辰储能在RE+2025展会发布面向AI数据中心的储能解决方案,包括锂电和钠电系统组合,通过创新技术应对高能耗场景的能源挑战。同时展示了全球首次开门燃烧试验成果及专用钠离子电池等产品,彰显其在安全性和技术领先性上的实力。展会期间还与Microgrid Networks签署合作协议,加速北美市场布局,体现全球化战略推进。

  • 海辰储能AIDC储能解决方案亮相RE+ 2025,以长时储能赋能AI数据中心绿色转型

    海辰储能在RE+2025展会上发布面向AI数据中心的储能解决方案,包括6.25MWh锂电长时储能系统和2.28MWh钠电储能系统。该方案创新融合锂电稳定性和钠电高倍率优势,可满足数据中心对电力实时性和稳定性的严苛需求,助力提升绿电使用占比,标志着长时储能在数据中心应用的全新突破。

  • 又一入门级!中兴Avid Plus发布:750元

    在今天举行的CES2016大展上,中兴除了为我们带来了定位中低端的Grand X 3,还有另一款新机Avid Plus,该机相较Grand X3定位更加低端。

  • David Kedwards:华尔街英语深耕中国市场20年初心不变

    近日,网易教育特邀华尔街英语全球首席执行官David Kedwards,就华尔街英语作为全球领先的成人英语培训品牌,如何在进入中国市场20年来能够始终初心不变并取得成功的原因进行了一对一的深度访谈。以下为访谈记录。主持人:请问华尔街英语长期成功发展的秘诀有哪些?David Kedwards:总体来说,有三个主要层面。首先,半个世纪以来,华尔街英语一直专注耕耘成人英语培训市场,对市场和客户有着深刻的洞察,这种持久的专注与专业是我

  • 看完牙医生无可恋:David DeVore将童年模因与NFT挂钩拍卖

    2008 年的时候,当时才 7 岁的 David DeVore 被父亲带着去看了趟牙医,但返程时的他因为打了麻药而陷入了沉思。几个月后,视频被传导了 YouTube 上,原意是想和亲朋友好分享以下,没想到在 11 年间迎来了超过 1.4 亿的观看量。现在,David DeVore 决定趁着 NFT 艺术品的热潮,将这个“David After Dentist”作品拿出来拍卖。David DeVore 在接受 TheVerge 采访时称:“这感觉又像是回到了 2009 年,当时的社交媒体正处于起步阶段,

今日大家都在搜的词: