首页 > 业界 > 关键词  > StableDiffusion教程最新资讯  > 正文

Stable Diffusion教程:效果超好的Instant-ID换脸 使用方法(纯干货)

2024-07-11 09:16 · 稿源:站长素材

Instant ID 是 controlnet 比较新的一个模型,主要作用也是固定人物的面部特征。它可以仅通过一张图片进行完美换脸,可能是目前最强的脸部迁移模型。

image.png

Instant ID 技术在多个领域展现了其独特的优势,主要表现在以下几个方面:

1. 作为一种创新的ID保留方法,Instant ID 有效地解决了训练效率与ID保真度之间的矛盾。

2. 它具有可插拔性,与目前社区内的文生图基础模型、LoRAs、ControlNets等完全兼容,可以在推理过程中零成本地保持人物ID属性。同时,Instant ID 还保持了良好的文本编辑能力,使得ID可以平滑地嵌入到各种风格中。无论是添加装饰、改变发色还是更换套装,都能轻松应对。

3. 实验结果证明,Instant ID 不仅超越了目前基于单张图片特征进行嵌入的方法(如IP-Adapter-FaceID),而且在特定场景下与ROOP、LoRAs等方法相比也毫不逊色,且成本更低。

更详细的原理可以阅读Instant ID团队在 github 的解析:https://github.com/InstantID/InstantID

步骤一:使用前准备

如果你的 controlnet 没有 Instant ID 你需要到秋叶启动包更新一下扩展

image.png

此外,你还需要下载controlnet模型到本地的controlnet模型文件夹中

模型下载地址:

ipadapter model

ControlNet model

如果网络不好的话可以扫描右边的二维码加群获取,或者在esheep这个在线SD网站上体验

下载完还要改名字分别修改成 ip-adapter_instant_id_sdxl 和control_instant_id_sdxl,然后再放入这个文件夹中

image.png

步骤二:图生图设置

【大模型】必须上 SDXL 模型,因为目前 Instant ID 只支持 SDXL

我这里使用的是 DreamShaper XL V2.1 Turbo

该模型可以在 C 站上下载,访问不了的可以扫描右边二维码加入群聊获取

或者在Esheep在线SD网站上体验

【采样方法】 DreamShaper XL V2.1 Turbo 模型必须使用 DPM++ SDE Karras

【采样步数】8

【尺寸】768*1024

【CFG 提示词相关性】大模型作者建议将CFG设置为 2,以获得最佳效果。

【重绘幅度】0.6

具体参数可以参考下图,局部重绘要把脸涂上

image.png

企业微信截图_17206629541882.png

步骤三:ControlNet 设置

你的第一个单元必须是 embedding 和 ip-adapter 的组合

第一个单元是获取人脸特征的模型

企业微信截图_17206629266954.png

你的第二个单元必须是 keypoints 和 control-instant-id-sdxl 的组合

这个单元是作为替换模版,在图生图中你可以不上传图像,sd 会自动使用你上面图生图上传的图像作为模板

image.png

步骤:点击生成

以上参数设置好后点击生成。可以看到面部特征还原的非常好,除了边缘有一些瑕疵,可以调整蒙版边缘模糊度改善

调整重绘区域和蒙版边缘模糊度后:

企业微信截图_1720662939974.png

注意事项

参数不是固定的,需要参考你的大模型提示,在我使用的DreamShaper XL V2.1 Turbo大模型是按照以上参数设置

尽量选择高清的面部素材可以达到更好的换脸效果

image.png

------------------------------------------------------------------------------------------

站长素材AI教程是站长之家旗下AI绘图教程平台

海量AI免费教程,持续更新干货内容

想要深入学习更多AI绘图教程,请访问站长素材AI教程网

https://aisc.chinaz.com/jiaocheng/

举报

  • 相关推荐
  • GTAOL/GTA增强版万圣节活动月到来!持续时间最长、活动最多、奖励最丰富的狂欢!

    GTA万圣节活动月开启,包含三大限时活动:幽浮绑架事件需合作逃脱获专属武器与服装;幽灵曝光任务拍摄新角色杰斯·诺里斯灵魂得奖励;佩里科岛丧尸生存战解锁木乃伊套装。另有UFO观光事件及电棒等限定载具武器。活动持续最长、奖励最丰富,推荐使用加速器优化网络体验。

  • iOS 26.1 Beta 2发布:闹钟需要滑动停止、苹果智能支持繁体中文

    苹果今天凌晨正式发布了iOS 26.1 Beta 2开发者预览版,加入开发者计划的用户都能升级体验。 这次对用户影响最大的是闹钟功能的改进,之前iOS 26将闹钟的停止按钮加大,导致停止更方便,同时也更容易误触,苹果目前已经进行大改,需要滑动才能停止。 这个设计让用户在迷迷糊糊中点击手机的无法结束闹钟,不会错过起床时间了。 除了闹钟升级之外,Apple Intelligence还在更�

  • 特斯拉V14终于来了!整合Robotaxi技术 马斯克:FSD有了意识

    以下是FSD 14的主要功能更新 1、新增到达选项(Arrival Options):驾驶者可选择目的地停车类型,包括停车场、街边、车道、停车库或路边停靠。 2、系统可识别警车、消防车、救护车等紧急车辆并自动避让或靠边停车。 3、实现对封路与临时绕行的实时处理。 4、增加自定义速度档位”以调整驾驶风格。新增SLOTH”模式,以更低车

  • 重新定义开放式耳机通讯体验:开石OpenRock推出全球首款可拆卸磁吸咪杆开放式耳机,于Kickstarter震撼上线

    OpenRock推出全球首款可拆卸磁吸开放式耳机Link20,搭载独家MagShield™ FusionTech磁吸连接技术,解决传统开放式耳机通话质量差的痛点。产品采用人体工学近场音孔设计,配合5麦克风阵列与AI降噪系统,实现高清通话与Hi-Fi级音质。单耳仅重9克,支持IPX7防水与13小时续航,现已在Kickstarter开启首发预售,早鸟价105美元。

  • 数贸会今日开幕!每日互动展台人气火爆,GAI Station引领AI办公新体验

    2025全球数字贸易博览会于9月25日在杭州开幕。每日互动公司(展位7A-T022)集中展示了AI产业实践与数据流通领域成果,重点推出10万元级智能工作站GAI+Station,集成写作、会议纪要、智能问答等功能,内置8大模型能力,破解成本与安全痛点。其“发数站”战略打通数据高效流通链路,已在医疗、交通等多领域落地,“数智绿波”应用覆盖全国30多个省市,通行效率提升20%以上。此外,AITA超级营销助手实现升级,机器狗互动表演吸引关注。展会期间将举办10余场专业发布,涵盖数据要素、大模型应用等行业实战,助力企业把握数字化机遇。

  • Reviews.ai 依托 DigitalOcean 高效实现 AI 业务扩展

    Reviews.ai是一个消费者反馈聚合平台,帮助品牌将客户评论转化为可执行的洞察。该平台专注于评论分析,通过AI驱动功能(如按需报告、主题分类和智能代理)提升产品与服务。近期从Review Monitor更名后,团队迁移至DigitalOcean云平台,解决了原有专用服务器架构的扩展瓶颈。迁移过程在合作伙伴Aquazeel支持下高效完成,仅用数周,成本降低近30%。新架构采用Droplets、托管数据库和负载均衡器,支持灵活扩展。未来计划利用GPU Droplets增强AI能力,进一步优化大型语言模型处理效率。

  • 小米澎湃OS 3 OTA逻辑改进:优先手动检测、逐步放量

    今年的小米澎湃OS 3进步很大,流畅性、功能性等多方面都大幅超越前代,很多用户都希望第一时间升级。 对此,小米公司应用软件部总监王乐专门发文解释了澎湃OS 3系统改进后的OTA逻辑,让大家更方便体验: 1.在大型软件工程体系下,所有软件产品的新版本发布都会遵循逐步放量的灰度策略 2.灰度策略有多种选择,比如招募一定的内测用户优先推送,或者随机放量慢慢扩�

  • 最新版国内直连Sora2,无水印免费使用教程

    OpenAI推出的Sora2视频生成模型引发全球关注,其文字理解能力显著提升,仅需输入提示词即可生成带原生配音的完整视频,覆盖短视频、广告、影视等多场景。然而官方渠道存在水印且需付费,国内用户难以体验。文章推荐通过浏览器插件DeepSider免费使用Sora2,支持中文注册、无限制登录,可控制画面比例、无水印保存。该插件还集成Claude、Gemini等数十款AI模型,具备文档解析�

  • 2025年VTN平台11.11会员狂欢节聚势启航

    9月26日,VTN平台启动2025年11.11会员狂欢节动员会,ACCESS集团高管与VTN核心团队分享业务规划,以“唯有奋斗,不负青春”为口号开启年度大促征程。活动将持续28天,涵盖超级品牌日、主题营销及福利活动,通过严选全球健康美容产品和创新策略,推动业绩增长。平台强调团队专业力与组织蜕变,致力于打造健康美丽管理专家,重塑亿万级健康生活方式市场格局。

  • IBM与Anthropic达成战略合作,为企业软件开发注入AI赋能的安全和治理

    IBM与Anthropic达成战略合作,将Claude大语言模型集成至IBM软件产品及开发工具中,旨在加速企业级AI开发进程。该合作聚焦提升开发效率,在IBM全新AI集成开发环境中率先应用,支持代码生成、测试部署等全生命周期任务。内部测试显示生产力提升45%,同时确保代码质量与安全合规。双方强调将为企业提供安全可靠的AI解决方案,推动行业标准化发展。

今日大家都在搜的词: