首页 > 业界 > 关键词  > AnimateLCM最新资讯  > 正文

支持Animatediff所有控制方式!AnimateLCM 4步推理即可生成视频

2024-02-02 16:49 · 稿源:站长之家

站长之家(ChinaZ.com)2月2日 消息:又有团队开卷视频生成了!这个项目在视频生成方面非常优秀。它使用了一致性模型(Consistency Model, CM)的启发,简化了预训练的图像扩散模型以加速采样过程。这一模型还成功扩展到了潜在一致性模型(Latent Consistency Model, LCM),用于条件图像生成,最终形成了AnimateLCM

image.png

项目地址:https://top.aibase.com/tool/animatelcm

AnimateLCM能够在很少的步骤中生成高质量的视频。相比直接在原始视频数据集上应用一致性学习,该项目提出了一种解耦的一致性学习策略,分别对图像生成的基础知识和运动生成的基础知识进行提炼。这种策略提高了训练效率并提升了生成视频的视觉质量。

此外,为了结合稳定扩散社区中的即插即用适配器来实现各种功能,比如使用ControlNet进行可控制的视频生成,该项目提出了一种高效的策略。这个策略不仅可以将现有的适配器调整到文本条件视频一致性模型中,还可以从零开始训练适配器,而不会影响采样速度。

在基于图像的视频生成和基于布局的视频生成中,AnimateLCM都取得了优异的成绩。从演示来看视频效果也很不错,支持现有 SD 生态 Animatediff 的所有控制方式,将LCM用在视频生成只需要4步推理就可以生成视频。目前,AnimateLCM暂未发布代码和权重,期待能够尽快上代码。

举报

  • 相关推荐
  • 腾讯元宝又叒叕上新:一句话即可生成Mermaid图表

    据其介绍,只要在元宝里输入一句话,比如帮我用Mermaid生成一张xxx流程图”,系统就会自动生成饼图、流程图、甘特图、时序图等。生成后,用户可以立刻预览效果,或者复制代码拿去其他地方使用。 腾讯元宝介绍,这个功能比较适合用在学术研究、工作报告、数据分析等场景,能帮助用户把复杂的内容快速变成图表,让信息更直观,沟通也更高效。

  • ClimatePartner认证全攻略:如何通过绿舟快速实现产品“绿标”突围

    本文介绍了ClimatePartner认证如何帮助亚马逊卖家提升竞争力。该认证通过量化产品全生命周期碳排放,制定减排计划并购买碳抵消额度,最终实现碳中和目标。获得认证的产品可显示亚马逊"绿标",享受流量扶持等权益,数据显示带绿标产品页面浏览量平均增长10%,销售额提升超12%。认证流程包括产品评估、碳足迹核算、减排方案制定和碳抵消购买,通常需8-12周。费用包含建模费、系列官费、年度证书费和碳抵消成本四部分。认证有效期为1年,需每年续费。专业服务商绿舟能缩短认证周期至4-6周,并提供透明收费和全链路支持,已助力安克创新等品牌实现销量增长和碳效提升。ClimatePartner认证不仅是流量密码,更是品牌ESG价值的重要体现。

  • 微软上线GPT-image-1模型 通过API向开发者开放使用

    OpenAI于4月24日发布全新图像生成模型GPT-image-1,通过API向全球开发者开放。该模型支持生成高质量图像,具备多级定制功能,包括控制敏感度、生成效率、背景、输出格式等参数,并推出"吉卜力模式"生成独特风格图像。Adobe、Figma等多家企业已将其集成到产品中。API定价按token计算,低质量图像生成成本约0.02美元/张。OpenAI CEO Sam Altman高度评价该模型,认为其为开发者带来更大创意空间。

  • 刚刚,OpenAI发布GPT-image-1模型,更强吉卜力版本来啦

    OpenAI发布全新图像生成模型GPT-image-1,通过API向全球开发者开放。该模型支持精细控制图像敏感度、生成效率、背景、输出格式等参数,并集成吉卜力模式。Adobe、Figma等企业已将其应用于产品中。API支持批量生成、蒙版编辑、透明度调整等高级功能,图像生成成本从0.02-0.19美元/张不等。CEO Sam Altman表示该模型与ChatGPT版本差异显著,开发者可通过API实现更多创意场景。新模型在�

  • 生成很强,推理很弱:GPT-4o的视觉短板

    研究显示,GPT-4o在图像理解和推理上表现出色,能生成精美图片,但在基础逻辑测试中表现欠佳,暴露出理解、推断及多步骤逻辑处理的不足。例如,被要求画一只猫时,它先画了狗然后改为猫,但仍存在错误判断。这表明当前AI更像“精确指令机器”,需进一步优化以实现更精细的图像理解和复杂任务处理。

  • 思看科技三维扫描仪NimbleTrack荣获2025德国红点设计大奖

    思看科技旗下NimbleTrack智能无线三维扫描仪荣获2025年德国红点设计大奖。该产品凭借创新工业美学设计、全无线理念和轻量化结构(仅1.3kg)脱颖而出,实现0.025mm高精度扫描,支持每秒490万次测量。其碳纤维一体成型框架和边缘计算模块提升了稳定性与运算效率,适用于汽车制造、航空航天等领域,推动行业数字化转型。此次获奖彰显了思看科技在三维数字化领域的技术实力和设计创新能力。

  • AI日报: OpenAI推出gpt-image-1图像生成API;纳米AI发布MCP万能工具箱;中国占全球AI专利60%

    【AI日报】栏目聚焦人工智能领域最新动态:1) OpenAI推出ChatGPT图像生成API,开发者可轻松集成AI绘图功能,已生成超7亿张图片;2) 谷歌Gemini月活用户突破3.5亿,但仍落后于ChatGPT的6亿用户;3) OpenAI预测2029年收入将达1250亿美元,AI代理业务成主要增长点;4) Ostris发布8B参数扩散模型Flex.2-preview,优化ComfyUI工作流;5) 英伟达推出多模态LLM模型Describe Anything,支持指定区域生成详细描�

  • 阿里开源通义新模型:指定首尾图片生成视频

    快科技4月18日消息,据报道,阿里巴巴旗下通义万相宣布开源其创新视频生成技术首尾帧生视频14B模型。这项突破性AI技术能够根据用户提供的起始和结束画面,智能生成720p高清过渡视频,为视频创作带来全新可能。该模型通过先进的深度学习算法,能够精准理解输入画面的内容、风格及主题特征。当用户提供首尾两帧图像后,模型会智能分析画面中的视觉元素,包括物体形�

  • 医疗信息化江湖风云再起!金仓数据库亮相CHIMA 2025

    第29届中国医院信息网络大会(CHIMA2025)在厦门召开,聚焦"AI融合医疗、共促高质量发展"主题。金仓数据库作为国产数据库代表参展,展示了与汕头市中心医院合作的临床数据中心集成平台项目。该项目采用双轨并行方案,实现零停机切换,每个模块上线切换仅需暂停业务5分钟以内。金仓数据库具备100%兼容源库能力,已成功支持浙江省人民医院等多个院区系统国产化改造,并积累301医院云HIS系统等核心医疗系统替换案例。会议显示国产数据库已能满足医疗行业对数据安全、稳定性和高效管理的需求,助力医疗信息化建设。

  • 华为 MateXT 销量超 40 万台,三星或今年 10 月发布“同款”!

    华为全球首款三折手机“Mate XT” 自去年 9 月发售以来,已售出约 40 万台。在此情况下,三星或将于 10 月跟上华为的脚步,推出“同款”……