首页 > 业界 > 关键词  > StableDiffusion最新资讯  > 正文

Stable Diffusion教程:快速上手热门AI画图LoRA模型

2023-04-13 16:06 · 稿源:站长之家用户

LoRA 训练小模型有特定的公式,每张图最少训练100步,总步数不低于1500步,也就是说建议训练图片大于15张,若小于则用这个公式计算每张步数:「1500/图片张数=每张训练步数」,举例来说,训练的图片共10张,那我就是每张训练150步即可,只要依照这个公式去训练产生的小模型效果就会很好,若不好就是要去检查训练图片是否合适,图片质量很重要(建议都用R-ESRGAN4x+ Anime6B去跑一次去除噪声及优化),尺寸统一都是1:1,而我就设为基本的512x512px 效果就很好了!如果显卡够力可以试着768x768px 的图片拿去训练看看!训练 LoRA 最低显示卡 VRAM 为7G!所以8G、12G VRAM 的显卡都适合拿来用。

年轻女性 女人 AI绘画

LoRA 训练出来的小模型档案不大,顶多100多 MB 而已,而且每训练一个模型只要不到十分钟,很快就能让 AI 学会一个物件如何绘制,非常强大,实际产图成功率极高,能非常接近我想要的模样,二次元动漫风格用 LoRA 训练出来的模型绘制非常合适。

使用软件列表

1.Stable Diffusion web UI:处理训练图片、AI 绘图用

2.Kohya's GUI:训练 LoRA 模型

※ 备注:请先点入个别软件连结去依照教学安装好,熟悉软件界面操作后再往下看教学。

为了准备训练图片,这里以D盘作为主要参考,资料夹之安排如下:

资料夹安排

D:\ai\source -> 训练图片放的资料夹(已经去噪声跟裁切为1:1比例)

D:\ai\model -> LoRA 模型输出位置

D:\ai\destination -> 整理过后训练图片放的位置,训练时读取该资料夹(包含 txt 提示词注记)

剩余75%的图文内容打赏作者后可查看

举报

  • 相关推荐
  • T2I扩散模型PIXART-α:像生成质量媲美Stable Diffusion

    文本到图像生成模型如DALLE2、Imagen和StableDiffusion的发展,开启了逼真图像合成的新时代。这不仅对图片编辑、视频制作、3D素材创建等领域产生了深远影响为研究社区和企业提供了许多下游应用的机会。控制功能:PIXART-α还提供了控制功能,允许用户生成定制图像,精确修改物体颜色等,以满足特定需求。

  • OnnxStream:内存友好的机器学习推理引擎 可在树莓派Zero 2上运行Stable Diffusion 1.5

    OnnxStream是一款专注于减少内存占用、提高推理效率的机器学习推理引擎。它的设计目标是在资源受限的环境中运行深度学习模型,如树莓派Zero2,该设备只有512MB的RAM。它的跨平台性使得用户可以在不同的设备上灵活使用。

  • 腾讯开源StableDiffusion工作流保存插件LightDiffusionFlow

    腾讯宣布开源LightDiffusionFlow,LightDiffusionFlow是一个开源插件,基于AI绘画开源平台StableDiffusionwebUI开发来。它可以帮助用户一键保存和复现SD绘画工作流,包括模型、提示词、垫图和其他第三方插件的参数设置。对于SD初学者来说,使用Flow文件可以快速上手SD,降低学习和使用门槛;对于SD进阶者来说,可以保存优质的工作流并快速复用,减少操作成本,并传播AI绘画能力;对于企业团队来说,可以建立可复用的AI绘画工作流,快速建立团队的AI绘画能力,实现降本增效。

  • Stability AI发布移动端语言模型Stable LM 3B

    StabilityAI发布了最新的语言模型StableLM3B,该模型是为便携式数字设备设计的,参数规模为30亿,比行业通常使用的70亿参数模型要小,具有更高的性能和可移植性。StableLM3B具有较小的体积和高效性的优势,需要更少的资源和较低的运行成本,使其对大多数用户来说更加可承受。该模型已在HuggingFace平台上发布,可以下载权重进行尝试。

  • AI视野:OpenAI开发者大会开放申请;微软在开发AI模型时泄露了38TB敏感数据;螺旋控制像Illusion Diffusion爆火

    2023年OpenAI开发者大会正式开始接受申请,计划于11月6日在旧金山举行,涵盖主题演讲、分组会议和晚间招待会。参会者需提交申请,门票费用为450美元,名额有限。🤖📱💼AI应用ChatVideo:用GPT分析和总结视频ChatVideo是基于人工智能的视频分析和管理工具,利用其独特的AI技术,能够通过语音识别快速转录视频内容成文�

  • AI视野:英特尔首款AI PC处理器发布;腾讯开源StableDiffusion插件LightDiffusionFlow;百度发布医疗大模型;妙鸭相机推出免费体验版

    DeepMind发布AlphaMissense模型,能预测基因错义突变是否致病,提升近千倍于人类专家,成功分类7100万突变中89%的致病性,加强遗传病诊断和新致病基因发现。论文地址:https://www.science.org/doi/10.1126/science.adg7492百度发布医疗大模型“灵医大模型”百度发布国内首个“产业级”医疗大模型——灵医大模型,旨在推�

  • Stability AI发布AI音乐生成工具“Stable Audio” 可生成长达90S音乐

    伦敦初创公司StabilityAI发布了一款名为StableAudio的AI音乐生成工具,标志着音乐创作领域再次迎来了创新。StableAudio采用了一种称为潜在扩散的技术,据称可以生成高质量、商业可用的音乐。StabilityAI表示,他们正在积极采取措施来确保内容的真实性,包括在图像模型中实施水印技术,以便用户和平台可以识别通过其托管服务生成的AI辅助内容。

  • 螺旋形状控制网像Illusion Diffusion:Hugging Face空间的创新之光

    一套基于螺旋形状的控制网图像在网络上引发了热潮。这种独特的螺旋形状风格成为了网友们关注的焦点令人惊讶的是,这个风格是由HuggingFace空间创造出来的。HuggingFace空间的这种创新尝试,不仅展示了其在图像设计和处理方面的强大实力,也进一步推动了相关领域的发展和创新。

  • 开发快速上手MasterGo,让设计和代码连接更紧密

    设计师与开发者处于不同的项目阶段,同时也使用着不同的工具,那么让他们两者之间建立良好的沟通协作方式就尤为重要,MasterGo虽然是一款面向设计师的专业工具,但同时兼顾强大的协作基因,今天小编就用一个全新的视角,站在开发者的角度,帮助大家了解和正确使用MasterGo,让设计与代码连接更加紧密!在开始之前,我们首先需要知道,MasterGo能为开发者做什么?以上就是本期分享的从开发者视角快速上手使用MasterGo的全部内容了,希望能够帮助到开发同学,同时也希望能有更多开发同学可以加入体验一下MasterGo。

  • Meta开源数字水印Stable Signature,极大增强生成式AI安全

    全球社交、科技巨头Meta在官网宣布,开源数字水印产品StableSignature,并公开论文。StableSignature是由Meta和INRIA联合开发成,可将数字水印直接嵌入到AI自动生成的图片中,防止其非法用途。通过StableSignature将数字水印嵌入到AI图片中,可极大避免此类事件的发生。