首页 > 业界 > 关键词  > AlignYourSteps最新资讯  > 正文

Align Your Steps:低步数推理保持高质量结果 适用于SD 1.5和SDXL

2024-04-26 10:38 · 稿源:站长之家

划重点:

- 通过优化采样计划提升生成模型效率和质量

- 可适用于多种数据合成基准测试,包括图像、视频等

- 用户友好的插拔式优化计划应用,提升生成过程中的稳定性和质量

站长之家(ChinaZ.com)4月26日 消息:在深度学习领域,扩散模型(DMs)作为生成建模的前沿方法已经得到广泛应用。然而,DMs 的一个关键缺点是其较慢的采样速度,这主要是由于需要通过大型神经网络进行多次顺序函数评估。

本文提出了一种名为 “步调齐整(Align Your Steps)” 的全新方法,旨在为 DMs 优化采样计划,从而实现高质量输出。该技术适用于SD1.5和SDXL,低步数的同时保持高质量结果。通过利用随机微积分方法,针对不同的求解器、训练的 DMs 和数据集找到最佳的采样计划。在多个图像、视频以及二维数据合成基准测试中,优化计划几乎在所有实验中优于先前手工制定的计划。这一方法展示了采样计划优化的潜力,特别是在少步骤合成领域。

通过严格的定量实验,发现优化计划在标准图像生成基准测试中显著提升图像质量,无论使用哪种流行的采样器都能得到一致的改进。此外,研究还针对文本到图像模型进行了用户研究,结果显示使用优化计划生成的图像更受欢迎。

下面展示了一些文本到图像的例子,对比展示了使用优化计划与实践中使用的两种最流行计划(EDM 和 Time-Uniform)的效果。

image.png

image.png

image.png

image.png

此外,在视频生成方面进行了研究,发现使用优化计划可以在视频生成过程中产生更加稳定的视频,减少随时间推移的颜色失真。

产品入口:https://top.aibase.com/tool/align-your-steps

在线colab:https://colab.research.google.com/drive/1cIwbbO4HRP1aUQ8WcbQBaT8p3868k7BC?usp=sharing

适用于SDXL的ComfyUI工作流:https://openart.ai/workflows/KrmAPmuIWMzztrE7Qkrc

举报

  • 相关推荐
  • 百度APP发布AI星河计划,构建AIGC创作者全方位扶持体系

    8月29日,百度AIGC未来创作联赛颁奖典礼在京举行,活动汇聚众多高质量AIGC作品与优秀创作者。百度发布“AI星河计划”,投入亿级流量和千万现金补贴,通过流量扶持、涨粉加速、分成翻倍、多元变现等手段,构建全方位创作者专属成长扶持体系。该计划根据作者AI技术与内容创作能力区分4档创作者,提供定制化支持套餐,最高可享亿级流量池和3倍分成补贴。百度APP依托月活7.35亿流量池与技术优势,已成为AIGC内容平台市场头部玩家,期待与更多优秀创作者共建未来内容生态。

  • 豆包1.5 Vision Lite 对比 GPT-5-min,谁更适合你?实测AI模型选型利器|AIBase

    文章探讨了企业选择AI大模型时面临的实际决策难题,指出单纯比较学术参数无法满足业务需求。AIBase模型对比平台(https://model.aibase.cn/compare)通过三大核心价值解决痛点:1)聚焦业务场景而非参数堆砌,突出价格、语言支持、上下文长度等实用维度;2)透明化成本计算,标注长文本溢价规则和多模态附加费;3)一键生成对比报告。平台特别强调中文场景的特殊性(如豆包1.5在中文处理成本的优势),并揭示厂商宣传中容易忽略的隐藏成本(如GPT-5-min超5000字符的30%溢价)。典型电商客服案例显示,需综合中文理解、多模态、性价比等维度决策,最终选择取决于具体业务需求而非绝对性能排名。

  • 未来已来,百度APP与创作者携手打造全新AIGC内容生态

    8月29日,百度AIGC未来创作联赛颁奖典礼在京举行,汇聚众多高质量AIGC作品与优秀创作者。百度推出“AI星河计划”,投入亿级流量与千万现金补贴,全方位助力AI创作者成长。赛事覆盖120余所高校,征集1100余条优秀作品,吸引1800+创作者参与,总播放量超8亿。35个作品脱颖而出,获得金银铜等多项殊荣。百度APP作为国内领先的AIGC内容平台,通过生态构建与技术迭代,持续推动AIGC创作生态的繁荣与发展。

  • 不叫骁龙8 Elite 2!曝高通新一代Soc命名为骁龙8 Elite Gen5

    高通下一代旗舰Soc不叫骁龙8 Elite 2,暂定命名为骁龙8 Elite Gen5,型号为SM8850。 如果命名属实的话,这颗Soc的中文名字可能会叫第五代骁龙8至尊版”,高通这次从第一代直接跳到了第五代。

  • AI日报:AI内容新规正式生效;美团推出开源大模型LongCat;阶跃发布语音大模型Step-Audio 2 mini

    AI日报栏目每日更新AI领域热点内容,聚焦开发者需求。本期重点包括:阶跃星辰发布端到端语音大模型Step-Audio2 mini,在多项基准测试中表现优异;9月1日起AI生成内容需强制标识;美团推出开源大模型LongCat;上海AI实验室发布多模态大模型InternVL3.5;腾讯ARC团队推出音频生成模型AudioStory;OpenAI发布实时语音模型GPT-realtime;Meta与UCSD合作推出DeepConf技术;xAI代码库遭窃事件;阿里巴巴Qwen团队发布GUI自动化框架;微软推出Copilot Labs实验中心;小红书自动化工具xiaohongshu-mcp上线。

  • OriginOS 6 Beta版开启招募测试:vivo X200 Pro/iQOO 13首发尝鲜

    今天,vivo社区宣布开启OriginOS 6 Beta测试招募,适配机型包括vivo X200 Pro、iQOO 13。 官方提醒,本次OriginOS 6 Beta测试系统仅面向极客用户(非正式版本),可能存在不稳定因素,对于普通用户,我们强烈建议不要使用,请谨慎报名。 因OriginOS 6测试版尚处于开发阶段,其运行效果不像正式版本那样稳定,版本可能存在部分Bug、耗电异常、三方兼容性异常等问题,如果用户追求手机

  • 格创东智ALIOTH系列S800F自动目检仪,实现半导体硅片0.3μm级缺陷检测

    国内某半导体硅片企业专注研发生产4-12英寸硅片产品,覆盖酸腐片、抛光片、外延片等关键材料。针对传统人工检测效率低、成本高、精度不足等问题,企业采用格创东智ALIOTH S800F自动目检仪,通过CV+AI算法实现0.3μm级缺陷检测,准确率达99%。设备支持20+种缺陷自动分类(准确率95%),30秒/片检测速度,年减少不良损失超千万元。系统建立百万级硅片缺陷数据库,为工艺优化�

  • 别再猜了!手把手教你用数据选择AI模型,我的Gemini 2.5 Flash-Lite vs DeepSeek选型心得

    开发者分享模型选择心路历程:从盲目试错到数据驱动。曾因追求低价模型导致成本飙升,后通过AIbase平台对比Gemini 2.5 Flash-Lite和DeepSeek-V3,基于价格、上下文长度和代码能力等数据,最终选择更适合代码生成任务的DeepSeek-V3。强调没有“最好”的模型,只有“最适合”的模型,建议开发者善用专业工具进行数据驱动决策,避免隐性成本。

  • 中企出海“信任战”:法大大Nota Sign全球签助力构建跨境信任体系

    中国企业出海进入全球化“深水区”,面临跨境签约合规挑战。法大大推出Nota Sign全球签平台,提供安全合规的电子签名服务,支持多语言合同智能比对,降低跨境交易成本与风险。平台覆盖100多个国家地区,适配各地法规,助力中资企业构建全球数字信任网络,提升签约效率与安全性。

  • AI日报:海螺AI首尾帧功能上线;元石科技发布问小白5;OpenAI发布全新语音模型GPT-Realtime

    AI日报栏目每日提供人工智能领域热点内容,聚焦开发者,帮助洞悉技术趋势、了解创新AI产品应用。最新动态包括:MiniMax海螺AI首尾帧功能上线;元石科技发布问小白5挑战GPT-5;OpenAI推出语音模型GPT-Realtime;谷歌Gemini AI优化表格处理;腾讯黑科技实现AI配音;百度计划培养千万AI人才;MathGPT.ai反作弊功能推广;苹果Xcode集成Claude Sonnet4;微软发布自研AI模型MAI系列;xAI推出高效编码模型Grok Code Fast1;SuperCLUE多模态评测Gemini-2.5-Pro居首;9月1日起AI内容标识新规实施,违规将承担法律风险。

今日大家都在搜的词: