首页 > 业界 > 关键词  > ComfyUI最新资讯  > 正文

ComfyUI透明图层生成插件LayerDiffusion正式上线

2024-03-04 10:48 · 稿源:站长之家

站长之家(ChinaZ.com)3月4日 消息:ComfyUILayerDiffusion透明图层生成插件也已经发布了,目前还只支持生成。该插件主要包含两个节点,其中一个遮罩节点需要安装comfyui-tooling-nodes插件。

LayerDiffusion项目已经在forge的扩展上可以使用,经过测试,其功能强大,不仅支持直接生成透明的图片元素,还可以在已有图片上生成与环境融合的透明图片。

LayerDiffusion利用大型预训练的潜在扩散模型(latent diffusion model)来创造透明图像。这项技术不仅可以生成单独的透明图像,还能生成多层透明图层。它通过一种被称为“潜在透明度”的方法,将透明度(即 alpha 通道)整合到预训练的潜在扩散模型的潜在结构中。

image.png

项目地址:https://top.aibase.com/tool/comfyui-layerdiffusion

这样做的好处是,它通过以潜在偏移的形式加入透明度,几乎不改变模型原有的潜在分布,从而保持了模型的高质量输出能力。基于这种方法,任何一个潜在扩散模型都可以通过对潜在空间的微调,转化为透明图像生成器。

在训练这个模型时,我们使用了一种涉及人机互动的方法,收集了一百万组透明图像层数据。研究显示,这种潜在透明技术不仅可以应用于不同的开源图像生成器,还可以适配多种条件控制系统,实现例如基于前景/背景条件的层生成、层的联合生成、对层内容进行结构控制等多种应用。

一项用户研究发现,大多数情况下(97%),相比于之前的临时解决方案(如先生成图像再进行抠图处理),用户更喜欢直接生成的透明内容。使用LayerDiffusion生成的透明图像在质量上可媲美真实的商业级透明素材,例如 Adobe Stock 提供的素材。

举报

  • 相关推荐
  • 暗区突围端游今日正式上线 | 与世界冠军一起刺激枪战!

    《暗区突围:无限》正式上线!这款FPS射击大作由魔方工作室打造,提供5张特色地图、5种游戏模式和1000+枪械配件自由搭配。

  • Funcom宣布《沙丘:觉醒》大规模测试即将开启

    《沙丘:觉醒》将于6月10日正式上线,5月10日将在伦敦与PAX East同步举行全球在线派对直播,并发放数万测试密钥。5月9日至12日将开启大规模测试,玩家可体验前20小时内容及第一章剧情。游戏基于弗兰克·赫伯特经典科幻小说改编,融合电影化叙事与开放世界生存玩法,玩家将探索厄拉科斯沙漠星球,揭开神秘预言与古老阴谋交织的故事。购买豪华版或终极版可提前5天进入游戏。开发商Funcom曾推出《流放者柯南》等知名作品。

  • BYDFi正式上线链上交易工具MoonX 开启CEX+DEX双引擎时代

    2025年4月巴黎区块链周期间,BYDFi作为官方赞助商发布全新Web3产品MoonX,这是一款专为MemeCoin投资者打造的智能交易工具。MoonX集热点发现、风险筛选、智能跟单和交易优化于一体,深度集成Solana和BNB Chain两大生态,覆盖超50万Meme资产。该产品标志着BYDFi正式进入CEX与DEX并行的"双引擎时代",通过中心化撮合系统保障流动性,同时提供链上发现功能追踪热点。CEO Michael表示,未来加密交易所的竞争将转向生态系统建设,MoonX将重构链上交易体验,让用户通过单一账户即可便捷参与Web3投资。BYDFi成立于2020年,服务覆盖190多个国家和地区,拥有超100万用户。

  • ChatGPT上线图库功能:可管理AI生成图

    快科技4月16日消息,据报道,OpenAI近日宣布将为ChatGPT推出全新的Image Library图库功能,该功能将帮助用户更高效地管理和查看AI生成的图像。这项创新功能将逐步向所有用户开放,包括移动端和网页端的免费版、Plus版及Pro版用户。新功能的设计充分考虑了用户体验的便捷性。用户只需点击ChatGPT侧边栏的Library入口,就能进入一个直观的图像网格界面。在这个界面中,用户可以轻�

  • 鸿蒙宇宙又添一员!梅赛德斯-奔驰鸿蒙版正式上线

    快科技4月15日消息,今日,有媒体报道,梅赛德斯-奔驰完成鸿蒙版本开发,已正式上线Harmonyos NEXT AG,用户通过手机就能轻松进入品牌智能生态圈。据介绍,通过手机远程控制功能,用户可完成车辆解锁或锁车操作,远程启动发动机,还能控制车窗与天窗开闭。同时,还能实时查看功能覆盖车辆定位、核心部件状态及配件情况,配合节能监控系统实时反馈能耗数据,并给出优�

  • 苹果Vision Air曝光:采用钛金属 设备更轻

    快科技4月17日消息,当前Vision Pro 256G版本售价为29999元起,设备重量为600克至650克,根据遮光罩和头带配置不同可能有所差异,其单独的电池重量为353克,不少线下体验者表示,该头显的重量影响其体验舒适度。苹果也意识到了这个问题,其下一代头显的研发重点是减重”,有博主在社交平台上爆料称,苹果正在研发全新头显Vision Air,其特点是采用轻量化设计,同时带来午夜�

  • 华为Vision智慧屏5系列正式推出:售价2799元起

    站长之家(ChinaZ.com)4月16日 消息:今日,华为正式推出Vision智慧屏5系列新品,凭借多项创新技术,为用户带来越级体验,宛如打造出一台更懂年轻人的“潮酷巨幕手机”。Vision智慧屏5系列以“三个首次”惊艳亮相。首次接入鸿蒙AI,深度融合与华为Mate70系列手机同源的AI能力。用户借助模糊剧情、角色/演员、台词三种模式,就能轻松锁定片源。比如询问“在阿勒泰拍摄的是哪�

  • 苹果Siri团队大换血!Vision Pro班底全面上马

    苹果正对Siri团队进行大规模重组,由新任工程主管Mike Rockwell主导改革。Rockwell从Vision Pro项目调来核心成员,重组了语音、理解、性能等关键团队。Vision Pro项目副手Ranjit Desai将负责Siri主要工程事务,Olivier Gutknecht接手用户体验设计。此次重组旨在简化开发流程,提升Siri功能。苹果AI/ML团队此前因管理混乱被员工戏称为"AI/less"。业内建议苹果应考虑重塑Siri品牌形象,推出全新数字助手以摆脱负面评价。

  • 森赛睿科技亮相 VisionCon 2025:视觉 AI 生态链赋能工业视觉检测快速落地,引领智造升级新范式

    雅时国际商讯主办的“VisionCon视界系统设计技术大会”在武汉光谷盛大召开,聚焦工业视觉人工智能领域,展示其在视觉AI生态构建上的战略部署与创新成果,推动“AI+制造”深度融合,为全球工业视觉行业提供可复刻的智能解决方案,突破传统视觉系统的科技壁垒,打造“云-边-端”协同架构。

  • AI日报:苹果AI国行版或随iOS 18.6月底上线;Suno v4.5正式上线;Runway发布像一致性参考功能

    本文汇总了AI领域最新动态:1)英伟达开源语音识别模型Parakeet-TDT-0.6B-V2,提升转写效率;2)Suno音乐平台v4.5版本支持8分钟歌曲生成;3)Runway推出图像一致性参考功能Gen-4 References;4)Midjourney V7新增"Omni-Reference"图像控制功能;5)Claude将引入MCP协议提升集成能力;6)iOS18.6或为中国用户启用AI功能;7)OpenAI宣布回归非营利模式;8)Freepik发布版权安全的F-Lite图像模型;9)OpenAI以30亿美