首页 > 业界 > 关键词  > LCM最新资讯  > 正文

LCM到底有多快?SDXL 图像2秒就能生成!附:LCM完整设置指南

2023-11-16 10:18 · 稿源:站长之家

今天我们将介绍一项令人振奋的新技术,通过使用Aur,你可以显著加速任何稳定扩散1.5SDXL或SSD1B的生成过程。(视频可点此观看)

Aur发布的新技术涉及LCM(Laura Configuration Models)的创新,为稳定扩散和SDXL提供了更快的生成速度。通过LCM过程对模型进行蒸馏,他们成功将生成速度从1390秒(在之前的7秒内)降低到仅需1秒,让Mac上的速度提高了10倍。

在新发布的LCM Laura中,我们可以看到他们在SDXL一代中进行快速推理。他们分享了扩散器代码的部分,通过这个过程中的8个步骤,成功取代了之前需要执行的50、25甚至10个步骤。值得注意的是,在这里有一小段关于指导尺度的文字,建议使用尺度为1以有效禁用它,特别是对于大多数提示而言,这是最快的方法。

LCM调度程序在auto1111和ComfyUI中表现出色。通过使用ComfyUI,您可以轻松下载SDXL检查点,使用LCM Laura配置,选择合适的采样器和指导比例,即可生成高质量的图像。在示例中,作者使用了UNI PC和LCM采样器,演示了使用四个步骤和1.8的指导比例时的性能。

image.png

在Auto1111中使用Aur技术的方式非常简单。基本上,您只需选择一个采样器,我建议使用DPM Plus+ SD Caris,并按比例缩小。如果您在使用SD Caris采样器时达到两个步骤,然后再次尝试四个步骤,您可以显著提高性能。按照提示,这样做更为有效。因此,在ComfyUI和Auto1111中都成功完成了四个步骤。

对于SDXL的处理,回到ComfyUI,加载SDXL检查点,并选择SDXL LCM Laura配置。确保将此采样器的名称更改为LCM,并将指导比例保持在1.8。建议比较两个图像的输出,特别关注画面的亮度和对比度。开箱即用的指导比例为1.5,尽管性能会下降到1或1.1,但仍然关注亚秒级生成。在增加步数到6后,每秒3.7次迭代,即1秒内有4个步骤。这与使用带有SDXL的普通Oiler采样器的速度相当。通过增加指导比例到1.8左右,您可以在第一张图像中获得更多清晰度。作者更喜欢1.6左右的指导比例,因为相比于一路上升到2.4,这样的比例更为理想。不幸的是,尝试使用其他采样器,如uni PC和uni PC bh2,似乎并未如期望那样自动工作。

image.png

在总体性能方面,使用LCM版本几乎每秒九次迭代,具有四个步骤,而速度下降到每秒六次迭代。这意味着如果速度足够快,可以一直增加到八个步骤,可能仍然保持在subc的水平。生成时间不到1秒,即每秒九次迭代,对于生成1024x1024的SDXL图像非常令人满意。作者还尝试了与DM一起使用Oiler,尝试提高指导尺度,虽然生成的图像是卡通风格,但似乎有起作用。

使用LCM配置生成的图像,其生成速度足够快,可以制作人工智能生成的视频。尽管生成的质量不是最佳,但在每秒17帧的速度下,生成60帧只需17秒。这证明LCM技术与Aur的其他配置兼容,确实为用户提供了快速而高效的深度学习模型生成体验。

总的来说,Aur的LCM技术为稳定扩散和SDXL的生成速度提供了显著的提升。无论是在ComfyUI中还是在auto1111中,使用LCM Laura配置和适当的采样器,用户都能够轻松实现高质量、高速的深度学习模型生成。这是对Aur技术的一次令人印象深刻的探索,为用户提供了更快、更高效的生成体验。

举报

  • 相关推荐
  • IBM研究:CMO将AI视为增长动力,但运营障碍阻碍了他们的步伐

    IBM最新研究显示,81%的CMO认可AI的战略重要性,但执行面临挑战:54%高管低估了AI落地的运营复杂性,仅22%企业制定了明确的AI决策指导方针。数据表明,组织内部协作不足是关键障碍——仅24%企业拥有跨职能协作平台,44%实现了需求规划系统集成。研究还发现,实现营销、销售和运营全面协同有望带来20%收入增长,但当前仅28%企业能有效管理跨部门客户体验。值得注意的是,64

  • 小米YU7的25扬声器和14扬声器到底有什么差别 值得选装吗

    小米YU7标准版、Pro版标配14扬声器,可付费6000元选装25扬声器,小米YU7 Max则标配25扬声器。 那么问题来了,小米YU7的25扬声器和14扬声器有什么差别?25扬声器值得选装吗? 小米汽车官方解答到:无论14扬声器还是25扬声器,均采用小米自研算法,声音还原更加真实、全车低音听感更均衡。而且小米YU7全系标配2个主驾头枕扬声器,可播报导航、通话、辅助驾驶提醒。 25扬声器�

  • 干货丨盘点国内14家热门智能体(文末附选型指南)

    文章概述了国内智能体市场近半年的爆发式增长,并精选14家热门智能体进行盘点。重点分析了各智能体的核心优势、适用场景及用户群体,如九科信息bit-Agent的企业办公自动化、Dify的开源大模型应用开发、魔塔智能体的电商物流场景等。同时提出智能体选择的五大标准:明确需求、成本考量、技术评估、数据安全与信创适配、生态服务。特别强调"场景适配+成本可控"�

  • 1.1亿玩家在手,小红书离“游戏指南”还有多远?

    暑期档临近,小红书游戏赛道又有新动作。 作为游戏行业的高热节点,暑期档是游戏玩家活跃和回流的高峰期,也是游戏厂商与宣发平台牵手的热恋期。 近期,腾讯旗下的《王者荣耀》和米哈游旗下的《崩坏:星穹铁道》两款游戏迎来版本更新,相关话题均登上小红书热点榜,单个话题最高在看人数达到654万,其中既有游戏官方账号的宣传物料,也有玩家自发的二创cos形象�

  • CVPR2025:快手可灵四大技术方向布局视频生成及世界模型

    面向用户意图理解,可灵团队提出的Any2Caption按照一种统一的方式理解多模态用户输入信息,进而生成语义丰富的结构化描述,可显著提升视频生成的成功率……

  • 70斤蟒蛇生吞30斤羊被活捉:试图逃跑时还完整吐了出来

    天气炎热,又到了蛇类出动的时候,尤其是在我国南方地区,甚至会有体型巨大的蟒蛇家访”。 据肇庆消防通报,6月23日上午,肇庆广宁红太阳村某农场出现一条巨蟒,引发村民恐慌。 消防救援人员抵达现场后,发现一条3米70斤左右的巨蟒,已经吞食了一只30斤左右的羊,在抓捕过程中,巨蟒吐出了来不及消化的羊准备逃走。 三名经验丰富的消防救援人员穿戴好防护装备,

  • Ceph存储效能飙升20%+!忆联PCIe5.0 ESSD智能多流技术攻克“隐形损耗”

    本文介绍了忆联Ceph分布式存储方案的技术优势。该方案基于PCIe5.0 ESSD,数据吞吐效率达上一代2倍;采用智能多流技术,性能优于主流竞品3.15%;有效抑制写放大效应(WAF),优于竞品20%-32%,可延长SSD寿命20%以上。方案通过硬件层面的创新突破,为云原生环境提供兼具超低延迟与超高一致性的存储基础设施,满足企业级客户对存储系统全生命周期稳定性的严苛需求。测试数据显示,在3副本配置下,QD32时随机读IOPS达175.5万,延迟稳定在1.1毫秒内;混合读写IOPS超50万,延迟约20毫秒。智能多流技术实现1.78超低WAF值,显著提升存储效能,是构建新一代分布式存储系统的理想选择。

  • AI日报:阿里通义推Qwen-TTS模型;Cursor已支持网页和手机端;字节发布图像合成技术XVerse

    【AI日报】今日AI领域7大突破:1)阿里通义Qwen-TTS实现方言语音合成重大突破;2)Cursor发布Web版AI编程工具;3)字节XVerse技术实现多对象精准图像生成;4)NoteGen跨平台AI笔记工具革新知识管理;5)ManimML动画库可视化Transformer架构;6)TEN+Agent开源语音交互技术降低延迟;7)Chai-2抗体设计模型将药物研发周期缩短至两周。淘宝同时上线RecGPT推荐模型提升购物体验。

  • 阿里巴巴发布全球首个胃癌影像筛查AI模型:CT就能识别早期胃癌

    浙江省肿瘤医院联合阿里巴巴达摩院,发布了全球首个胃癌影像筛查AI模型DAMO GRAPE。 该模型首次利用平扫CT影像识别早期胃癌病灶,并联合全国20家医院,在近10万人的大规模临床研究中大幅提升胃癌检出率。 相关论文在24日登上了国际顶级期刊《自然医学》(Nature Medicine)。 据国家癌症中心统计,我国每年新发胃癌约36万例,死亡26万例,死亡人数在所有恶性肿瘤中位列第�

  • AI日报:美团No Code平台免费开放;豆包App升级“一句话P图”功能;苹果Xcode 26内置ChatGPT等AI功能

    本文介绍了AI领域多项重要进展:1)美团推出No Code平台和1680个AI应用;2)豆包App升级"一句话P图"功能;3)苹果发布内置ChatGPT的Xcode26开发工具;4)iOS26新增视觉智能功能;5)讯飞星火X1升级版即将发布;6)比亚迪接入阿里通义大模型;7)DeepSeek支持本地工具调用;8)开源框架Rowboat支持快速构建智能助手;9)X平台整合Grok AI优化内容推荐;10)港科大开发进化搜索技术提升小模型图像生成能力;11)硅基流动完成数亿元融资;12)港大与英伟达合作开发新型视觉注意力机制。这些创新展示了AI技术在各领域的快速发展和应用突破。