首页 > 业界 > 关键词  > Fairy最新资讯  > 正文

Meta推AI视频模型Fairy,轻松替换视频人物、改变风格

2024-01-08 10:23 · 稿源:站长之家

划重点:

🔍 MetaFairy 是一个快速的视频到视频综合模型,展示了 AI 如何为视频编辑带来更多创作自由。

🔍 Fairy 使用交叉帧关注机制,确保时间上的一致性和高保真度合成。

🔍 Fairy 比之前的模型快44倍,但在处理动态环境效果方面仍存在一些问题。

站长之家(ChinaZ.com)1月8日 消息:Meta 的 GenAI 团队推出了名为 Fairy 的视频到视频综合模型,该模型比现有模型更快,时间上更一致。研究团队展示了 Fairy 在几个应用中的表现,包括角色 / 物体替换,风格化和长形式视频生成。

比如,只需简单的文本提示,如 “仿梵高风格”,就足以编辑源视频。例如,文本命令 “变成雪人” 将视频中的宇航员变成了雪人。

image.png

image.png

Fairy 的视觉连贯性是一个特别具有挑战性的问题,因为基于相同提示有无数种方法可以修改给定的图像。Fairy 使用交叉帧关注机制,这是一种隐式传播扩散特征的机制,确保了优越的时间连贯性和高保真度的合成。

image.png

该模型可以在仅14秒内生成大小为512x384像素、120帧(30fps 下的4秒)的视频,比以前的模型至少快44倍。与 Meta 的 Emu 视频模型一样,Fairy 是基于用于图像处理的扩散模型,经过了视频编辑的增强。

Fairy 在处理源视频的所有帧时不进行时间降采样或帧插值,并保持了512的水平输出视频的纵横比。在使用六个 A100GPU 进行测试时,Fairy 能够在71.89秒内渲染一个27秒的视频,并保持高度的视觉一致性。

Fairy 的性能在一个包含1000个生成样本的广泛用户研究中进行了测试。无论是人类判断还是定量指标都证实,Fairy 的表现优于 Rerender、TokenFlow 和 Gen-1这三个模型。

image.png

然而,该模型目前在处理如雨、火灾或闪电等动态环境效果方面存在问题,这些效果要么无法很好地融入整个场景,要么会产生视觉错误。

尽管存在这些问题,研究团队认为他们的工作在 AI 视频编辑领域代表了一次重大进展,具有对时间一致性和高质量视频合成的变革性方法。

Fairy项目体验网址:https://top.aibase.com/tool/fairy

举报

  • 相关推荐
  • Meta雷朋第三代智能眼镜亮相在即,三星/微美全息领航消费级XR助推行业增长!

    Meta与雷朋合作的第三代智能眼镜渲染图曝光,预计今年发布,定价300-500美元。新一代眼镜强调AI功能升级,支持实时物体识别与场景理解。Meta还将在9月Connect大会推出首款带显示屏的智能眼镜Hypernova,售价约800美元,并配套手势控制腕带。与此同时,三星确认将于9月推出XR头显Project Infinite,售价约1800-2900美元。智能眼镜市场正迎来爆发期,2025年Q1全球出货量激增82.3%,中国增长116.1%。微美全息等企业加速布局,行业期待未来2-3年迎来真正拐点。

  • Lamett乐迈石晶产品硬核测评:零醛、防水、防霉三大指标重新定义健康家

    北京楼市新政落地,市场活力提升,新房装修需求升温。文章重点指出选购健康安全建材的关键指标:甲醛释放量少、防水防潮性强、防霉防蛀能力过硬。通过高温甲醛实验、防水实验和防霉防蛀实验,对比测试了乐迈石晶板等主流建材,结果显示其具有零甲醛释放、滴水不侵、无惧虫霉的优异性能,重新定义了健康建材的标准。

  • Lamett乐迈石晶快装秘籍!让武汉20年老宅“一键焕新”

    武汉黄先生一家140平米老宅经《梦想改造家》节目改造后焕然一新。设计师采用零甲醛添加的Lamett乐迈石晶地板,解决潮湿问题,提升防滑耐磨性能。空间重构实现客卧对调、主卧休闲办公一体化,厨房岛台增进家人互动。全屋原木色调营造温馨氛围,兼顾健康与美学,为五口之家打造安全舒适的生活环境。

  • AI日报:抖音打击AI技术滥用行为;OpenAI 收购开发数据分析平台 Statsig;ElevenLabs 音效模型更新

    抖音打击AI技术滥用行为,对违规商家和达人采取下架、清退等措施。ElevenLabs音效模型升级至版本2,支持长音频和无缝循环。OpenAI收购数据分析平台Statsig,增强产品迭代能力。亚马逊推出Lens Live AI功能,实时扫描购物。谷歌AI推出Stax工具,帮助开发者评估大语言模型。WordPress推出AI工具Telex简化网站构建。Liquid AI发布LFM2-VL模型,提升手机视觉语言处理。苹果开源FastVLM与MobileCLIP2模型,优化边缘设备AI应用。MetaGPT推出自动化测试工具RealDevWorld,精准率达92%。瑞士发布开源大模型Apertus,提供多语言处理能力。

  • AI日报:苹果明年推出SiriAI搜索;OpenAI放开ChatGPT Projects功能;Kimi K2-0905 上线 Discord

    本文汇总了AI领域最新动态:苹果与谷歌合作,计划在Siri中引入Gemini AI技术;OpenAI向免费用户开放Projects功能,提升任务管理效率;谷歌推出免费Gemini CLI工具,集成GitHub提升开发效率;OpenAI估值飙升至5000亿美元,二级股票售出103亿美元;苹果自研AI搜索引擎“世界知识问答”计划2026年上线;月之暗面发布Kimi K2-0905模型,提升编程与创意写作能力;Raycast推出Cursor Agent插件优化代码编辑;谷歌发布nano banana官方Prompt模板,助力创意设计。

  • 7年来首次!苹果罕见发布iOS 26 Beta 9更新

    今日,苹果发布iOS 26开发者预览版Beta 9更新,内部版本号23A5336a。 值得注意的是,这是继2018年iOS 12之后,苹果首次推出第9个测试版更新。 据悉,从iOS 13到iOS 18,苹果在正式版发布前最多只会推出8个测试版,更新节奏一向稳定。 而iOS 12则因频繁修复弹窗问题,一度创下12个测试版的纪录。 根据往年发布节奏,苹果预计将在9月10日发布iOS 26 RC版(准正式版)更新,9月16日发�

  • 带猫环游世界的@不撸猫HaiTang 如何吸引1亿点赞?

    当打工人还在幻想诗和远方,@不撸猫HaiTang 已经带着他的两只狸花猫开始环游世界了! 视频里,这只名为海棠的狸花猫,在菲律宾的划艇上悠闲地打量着海洋;另一段视频中,它又出现在日本北海道的雪景里,好奇地从主人的背包里探出小脑袋。

  • 小米14无缘澎湃OS 3首批Beta版:张国全解释原因

    小米软件部张国全发文表示,澎湃OS 3 Beta版第二版今天已经外发,欢迎大家升级体验,如果没有重大问题,8款机型第二批Beta版明天逐步外发。 值得注意的是,12306行程助手明天开始外发(澎湃OS 2/OS 3同时外发),NFC上岛/秒表上岛,第一版开始外发,大家升级试用后有问题随时反馈。 张国全还提到了小米14系列Beta版计划,称去年在规划澎湃OS 3 Beta版的时候,怕大家觉得不公�

  • 小米澎湃OS 3首批Beta版更新“3.0.0.24”发布

    今日,小米正式向旗下8款机型推送了澎湃OS3的首批Beta版升级,涵盖小米15、小米15Pro、小米15S Pro、小米15Ultra、REDMI K80Pro、REDMI K80至尊版、小米平板7Pro以及小米平板7S Pro12.5。此次更新不仅修复了用户反馈的多项系统问题,还新增了实用功能,并对相机稳定性进行了优化。 在系统层面,小米澎湃OS3解决了部分场景下多应用音量调节异常、应用双开时无法切换输入法、点击消息�

  • AI日报:海螺AI首尾帧功能上线;元石科技发布问小白5;OpenAI发布全新语音模型GPT-Realtime

    AI日报栏目每日提供人工智能领域热点内容,聚焦开发者,帮助洞悉技术趋势、了解创新AI产品应用。最新动态包括:MiniMax海螺AI首尾帧功能上线;元石科技发布问小白5挑战GPT-5;OpenAI推出语音模型GPT-Realtime;谷歌Gemini AI优化表格处理;腾讯黑科技实现AI配音;百度计划培养千万AI人才;MathGPT.ai反作弊功能推广;苹果Xcode集成Claude Sonnet4;微软发布自研AI模型MAI系列;xAI推出高效编码模型Grok Code Fast1;SuperCLUE多模态评测Gemini-2.5-Pro居首;9月1日起AI内容标识新规实施,违规将承担法律风险。

今日大家都在搜的词: