首页 > 业界 > 关键词  > LCM最新资讯  > 正文

LCM到底有多快?SDXL 图像2秒就能生成!附:LCM完整设置指南

2023-11-16 10:18 · 稿源:站长之家

今天我们将介绍一项令人振奋的新技术,通过使用Aur,你可以显著加速任何稳定扩散1.5SDXL或SSD1B的生成过程。(视频可点此观看)

Aur发布的新技术涉及LCM(Laura Configuration Models)的创新,为稳定扩散和SDXL提供了更快的生成速度。通过LCM过程对模型进行蒸馏,他们成功将生成速度从1390秒(在之前的7秒内)降低到仅需1秒,让Mac上的速度提高了10倍。

在新发布的LCM Laura中,我们可以看到他们在SDXL一代中进行快速推理。他们分享了扩散器代码的部分,通过这个过程中的8个步骤,成功取代了之前需要执行的50、25甚至10个步骤。值得注意的是,在这里有一小段关于指导尺度的文字,建议使用尺度为1以有效禁用它,特别是对于大多数提示而言,这是最快的方法。

LCM调度程序在auto1111和ComfyUI中表现出色。通过使用ComfyUI,您可以轻松下载SDXL检查点,使用LCM Laura配置,选择合适的采样器和指导比例,即可生成高质量的图像。在示例中,作者使用了UNI PC和LCM采样器,演示了使用四个步骤和1.8的指导比例时的性能。

image.png

在Auto1111中使用Aur技术的方式非常简单。基本上,您只需选择一个采样器,我建议使用DPM Plus+ SD Caris,并按比例缩小。如果您在使用SD Caris采样器时达到两个步骤,然后再次尝试四个步骤,您可以显著提高性能。按照提示,这样做更为有效。因此,在ComfyUI和Auto1111中都成功完成了四个步骤。

对于SDXL的处理,回到ComfyUI,加载SDXL检查点,并选择SDXL LCM Laura配置。确保将此采样器的名称更改为LCM,并将指导比例保持在1.8。建议比较两个图像的输出,特别关注画面的亮度和对比度。开箱即用的指导比例为1.5,尽管性能会下降到1或1.1,但仍然关注亚秒级生成。在增加步数到6后,每秒3.7次迭代,即1秒内有4个步骤。这与使用带有SDXL的普通Oiler采样器的速度相当。通过增加指导比例到1.8左右,您可以在第一张图像中获得更多清晰度。作者更喜欢1.6左右的指导比例,因为相比于一路上升到2.4,这样的比例更为理想。不幸的是,尝试使用其他采样器,如uni PC和uni PC bh2,似乎并未如期望那样自动工作。

image.png

在总体性能方面,使用LCM版本几乎每秒九次迭代,具有四个步骤,而速度下降到每秒六次迭代。这意味着如果速度足够快,可以一直增加到八个步骤,可能仍然保持在subc的水平。生成时间不到1秒,即每秒九次迭代,对于生成1024x1024的SDXL图像非常令人满意。作者还尝试了与DM一起使用Oiler,尝试提高指导尺度,虽然生成的图像是卡通风格,但似乎有起作用。

使用LCM配置生成的图像,其生成速度足够快,可以制作人工智能生成的视频。尽管生成的质量不是最佳,但在每秒17帧的速度下,生成60帧只需17秒。这证明LCM技术与Aur的其他配置兼容,确实为用户提供了快速而高效的深度学习模型生成体验。

总的来说,Aur的LCM技术为稳定扩散和SDXL的生成速度提供了显著的提升。无论是在ComfyUI中还是在auto1111中,使用LCM Laura配置和适当的采样器,用户都能够轻松实现高质量、高速的深度学习模型生成。这是对Aur技术的一次令人印象深刻的探索,为用户提供了更快、更高效的生成体验。

举报

  • 相关推荐
  • 玄武云通过DCMM三级认证 数据管理能力获国家级权威认可

    玄武云科技(02392.HK)近日通过国家数据管理能力成熟度(DCMM)稳健级(三级)认证。该认证依据国家标准GB/T36073-2018,标志着公司在数据战略、治理、安全、质量等八大能力域达到国家权威标准。公司建立了覆盖数据标准管理、安全管理、质量管理的完整体系,将数据管理融入产品研发与业务流程,为云通信与AI业务发展奠定坚实基础。未来将持续深化数据能力建设,探索数据要素创新应用,助力行业数字化转型。

  • 坚定研发 GMCC美芝以原创性技术打造空调好“心脏”

    GMCC美芝15槽10极变频转子式压缩机自2025年投产以来,凭借静音、节能等革命性优势获行业认可。其应用三大原创技术:极致静音技术通过创新结构实现6Hz无异音,噪声较行业标杆再降5dB(A);宽域节能技术采用高效电机及流道优化,低频能效提升2%;高质智能制造技术引入自动化工艺,生产效率提升42%。这些突破彰显美芝作为全球空调压缩机领导品牌的技术实力,推动产业从规模领先迈向技术领先。

  • PCEVA深度评测:忆联AE531 QLC SSD以高效稳定,从容应对多元应用场景挑战

    PCEVA对忆联首款QLC商用消费级SSD AE531进行深度评测。该产品在性能测试中全面超越同级,顺序读写达6817/5680MB/s,SLC缓存策略提供约110GB空间,60℃满载无降速。跨平台兼容性与低TCO设计满足企业降本增效需求,验证了QLC在商用场景下的稳定优势。

  • 传承与创新并行,八马茶业斩获C-CSI茶叶连锁店顾客满意度三连冠

    八马茶业连续三年蝉联中国顾客满意度指数茶叶连锁店榜首,全国门店超3700家。凭借“品质为王”理念,其红茶、岩茶、铁观音三大品类销量多年领跑。通过全渠道布局与智能化生产基地,实现线上线下协同,保障产品稳定供应与服务一致性。未来将持续以品质为核心,推动传统茶文化创新,引领行业高质量发展。

  • 特斯拉Cybercab不配备方向盘和踏板 预计2026年二季度下线

    特斯拉CEO马斯克透露,Cybercab无人驾驶出租车将于2026年第二季度量产。该车型颠覆传统设计,无方向盘和踏板,完全依赖FSD全自动驾驶技术,采用纯视觉方案。整车成本预计低于3万美元,配备超大后备箱和鸥翼门,内饰极简仅设中控屏。车辆支持感应充电,专为无人出租场景优化,将推动汽车行业变革。

  • EBC金融集团携手牛津:洞见经济本质实现投资认知突围

    EBC金融集团与牛津大学经济系将于2025年11月11日联合举办第三期“经济学家都干了什么”系列研讨会。本期主题聚焦复杂时代的金融素养培养,旨在帮助投资者建立牛津经济学思维,弥合公众与专家间的认知鸿沟。研讨会将引入“解释-参与-教育”三维框架,结合牛津教授的前沿研究与EBC CEO的实战经验,探讨央行沟通策略及有效经济教育模式,助力提升市场洞察力与决策能力。

  • 只有0.9B的PaddleOCR-VL,却是现在最强的OCR模型。

    ​这几天,OCR这个词,绝对是整个AI圈最火的词。因为DeepSeek-OCR,甚至让OCR这个赛道文艺复兴,又给直接带火了。 整个Hugging Face的趋势版里,前4有3个OCR,甚至Qwen3-VL-8B也能干OCR的活,说一句全员OCR真的不过分。 然后在我上一篇讲DeepSeek-OCR文章的评论区里,有很多朋友都在把DeepSeek-OCR跟PaddleOCR-VL做对比,也有很多人都在问,能不能再解读一下百度那个OCR模型(也就是PaddleOCR-VL

  • “大模型应用”新风口:“无人测试”趋势,CIO/CTO如何应对

    当前CIO面临的核心挑战是如何在有限IT预算下加速企业数字化转型。传统软件测试环节因人力密集、周期冗长成为效率瓶颈,而AI技术正推动测试模式从"辅助"向"无人化"演进。通过AI Agent实现全流程自主测试,可提升测试效率300%、降低成本30%,并将产品发布周期从"月"压缩至"周"。这不仅是技术升级,更是重构IT成本结构、实现降本增效的战略支点,助力IT部门从成本中心转型为价值创造中心。

  • DocuVerse AI赋能:让企业文档“活”起来,开启智慧办公新体验

    飞天云DocuVerse通过AgentsCo AI智能体,将传统文档管理系统升级为“可对话”的知识资产。用户只需右键点击文件即可直接提问,AI能快速提炼技术专利、合同条款等核心信息,实现零门槛交互。系统支持封装高频文档集成为专属智能体(如HR政策助手、客服知识库),7×24小时响应咨询。在研发、销售等场景中,AI加速创新进程、精准匹配客户需求,推动办公模式从“人力驱动”向“智能驱动”升级。

  • 男子豪饮8瓶啤酒 膀胱劈裂出6cm巨大破口 医生提醒:饮酒要适量

    近日,陕西西安,一男子因连喝8瓶啤酒,不幸遭遇了一场紧急修补手术。 原来,在手术前一天,男子和朋友聚餐时,推杯换盏间不知不觉喝下了8瓶啤酒。 不料,次日凌晨,男子被腹部一阵疼痛惊醒,虽然他发现自己尿意十足,却仅有几滴排出。 家人紧急将他送往医院,经医生检查后发现,男子腹腔内存在大量不明积液!医生诊断为膀胱破裂,弥漫性腹膜炎、急性肾损伤”

今日大家都在搜的词: