首页 > 业界 > 关键词  > ComfyUI最新资讯  > 正文

ComfyUI透明图层生成插件LayerDiffusion正式上线

2024-03-04 10:48 · 稿源:站长之家

站长之家(ChinaZ.com)3月4日 消息:ComfyUILayerDiffusion透明图层生成插件也已经发布了,目前还只支持生成。该插件主要包含两个节点,其中一个遮罩节点需要安装comfyui-tooling-nodes插件。

LayerDiffusion项目已经在forge的扩展上可以使用,经过测试,其功能强大,不仅支持直接生成透明的图片元素,还可以在已有图片上生成与环境融合的透明图片。

LayerDiffusion利用大型预训练的潜在扩散模型(latent diffusion model)来创造透明图像。这项技术不仅可以生成单独的透明图像,还能生成多层透明图层。它通过一种被称为“潜在透明度”的方法,将透明度(即 alpha 通道)整合到预训练的潜在扩散模型的潜在结构中。

image.png

项目地址:https://top.aibase.com/tool/comfyui-layerdiffusion

这样做的好处是,它通过以潜在偏移的形式加入透明度,几乎不改变模型原有的潜在分布,从而保持了模型的高质量输出能力。基于这种方法,任何一个潜在扩散模型都可以通过对潜在空间的微调,转化为透明图像生成器。

在训练这个模型时,我们使用了一种涉及人机互动的方法,收集了一百万组透明图像层数据。研究显示,这种潜在透明技术不仅可以应用于不同的开源图像生成器,还可以适配多种条件控制系统,实现例如基于前景/背景条件的层生成、层的联合生成、对层内容进行结构控制等多种应用。

一项用户研究发现,大多数情况下(97%),相比于之前的临时解决方案(如先生成图像再进行抠图处理),用户更喜欢直接生成的透明内容。使用LayerDiffusion生成的透明图像在质量上可媲美真实的商业级透明素材,例如 Adobe Stock 提供的素材。

举报

  • 相关推荐
  • 再次定义行业创新范式 跃然创新推出全球首款端到端 AI 玩具 CocoMate

    8月26日,跃然创新推出全球首款搭载端到端语音模型的AI玩具CocoMate系列。该产品采用可拆卸设计,配备3000mAh电池,支持4G和WiFi网络。依托端到端技术,具备丰富交互表现和拟人化情感能力,支持多重唤醒、主题游戏及聊天室等功能。新品将于8月27日开售,首发包含奥特曼及原创IP“泡泡”等角色,后续还将上线财神爷、塔罗猫等系列,目标人群从儿童延伸至成年人。

  • vivo Vision探索版发布 将于明日开放线下体验

    今日下午,vivo正式发布了备受瞩目的vivo Vision探索版MR头显,尽管该设备暂未确定上市销售时间,但已引发市场广泛关注。从8月22日起,北京、深圳等10余座城市的12家vivo官方授权体验店将率先开启抢先预约体验活动,后续还将有第二批线下体验门店加入,让更多消费者有机会亲身感受这款创新产品的魅力。

  • 豆包1.5 Vision Lite 对比 GPT-5-min,谁更适合你?实测AI模型选型利器|AIBase

    文章探讨了企业选择AI大模型时面临的实际决策难题,指出单纯比较学术参数无法满足业务需求。AIBase模型对比平台(https://model.aibase.cn/compare)通过三大核心价值解决痛点:1)聚焦业务场景而非参数堆砌,突出价格、语言支持、上下文长度等实用维度;2)透明化成本计算,标注长文本溢价规则和多模态附加费;3)一键生成对比报告。平台特别强调中文场景的特殊性(如豆包1.5在中文处理成本的优势),并揭示厂商宣传中容易忽略的隐藏成本(如GPT-5-min超5000字符的30%溢价)。典型电商客服案例显示,需综合中文理解、多模态、性价比等维度决策,最终选择取决于具体业务需求而非绝对性能排名。

  • 苹果Vision Pro劲敌!vivo韩伯啸:vivo Vision发布会准备中

    vivo通信科技有限公司产品经理韩伯啸今天表示vivo Vision真的要来了,目前发布会已经在紧锣密鼓的准备中了,感兴趣的朋友,可以关注后续的官方公告。

  • 全球最轻的MR头显!vivo Vision探索版亮相:仅重398g

    今天下午,vivo Vision发布会暨影像盛典正式开启,vivo Vision探索版正式亮相,这是蓝厂首款MR头显。 vivo智慧终端产品总经理洪沂介绍,vivo Vision从一开始立项,减重”就是核心命题,因为太重的话大家就很难长时间沉浸体验。 目前市面上的大部分MR头显设备重量都超过了500g,苹果Vision Pro的重量甚至超过了600g,这次vivo Vision探索版的重量压缩至398g,是目前行业内最轻的MR头显。

  • vivo Vision探索版双目8K分辨率 1000度近视也能用

    今日,vivo首款混合现实设备vivo Vision探索版正式亮相。 vivo Vision探索版采用双目8K Micro-OLED屏幕,拥有94% DCI-P3色域,色彩准确度E2。 通过双目校准,保证每台设备的两块屏幕保持一致的、专业级电影监视器的色彩容差体验。

  • AI日报:B站测试AI视频工具花生AI;腾讯发布多模态模型Large-Vision;昆仑万维开源Skywork UniPic 2.0

    【AI日报】主要内容: 1. B站测试"花生AI"视频工具,3分钟可成片,同时推进自研大模型和多语言翻译功能 2. 昆仑万维开源多模态模型Skywork UniPic 2.0,实现高效统一的多模态生成能力 3. 马斯克指责苹果偏袒OpenAI,苹果回应称平台设计公平公正 4. 腾讯混元发布52B参数多模态理解模型Large-Vision,支持任意分辨率输入 5. DeepSeek官方否认8月发布R2模型的传闻 6. OpenAI推出超值ChatGPT Go套餐,仅399卢比降低使用门槛 7. AI新贵Perplexity豪掷345亿美元收购谷歌Chrome 8. Anthropic的Claude Sonnet 4模型支持100万token上下文 9. ChatGPT重大更新:恢复GPT-4o默认模式,为GPT-5引入多模式选择,优化交互体验

  • AI最新资讯在哪里看?AIbase:高效获取国内外AI新闻头条与行业动态

    文章探讨了AI时代信息过载的困境:有价值的前沿动态、重磅模型发布和行业解读分散各处,筛选成本高、效率低下。AIbase资讯导航站应运而生,通过四大核心功能解决痛点:1)聚合主流信源,过滤低质噪音;2)结构化分类呈现大模型动态、行业应用等六大板块;3)提炼核心要点,拒绝标题党;4)高频更新确保信息鲜度。该平台致力于成为AI领域的"信息雷达",帮助用户节省70%信息搜集时间,将精力聚焦于思考与创造。适用于技术负责人快速掌握行业动态、产品经理调研案例、投资人捕捉趋势等多元场景。

  • MCP服务库完整指南:如何选择最适合的Model Context Protocol服务

    本文介绍了MCP(Model Context Protocol)作为连接大型语言模型与外部数据源的重要桥梁。随着AI技术发展,选择合适的MCP服务库对开发者至关重要。文章分析了MCP服务库的核心价值:提升开发效率、增强系统互操作性、降低技术门槛。评估MCP服务库质量需考虑协议兼容性、安全性、生态系统丰富度及社区活跃度等维度。建议开发者根据业务需求选择服务,初创公司可侧重简便性,大型企业应关注安全性和扩展性。文章还指出MCP服务未来将向云原生化、智能化运维和标准化方向发展,并推荐使用专业对比平台(如mcp.aibase.cn)辅助决策。

  • “无限量”供应Claude,就是AI IDE们的百亿补贴

    Anthropic于2025年7月28日宣布,将从8月28日起对Claude Code工具新增每周调用限额——因为少数重度用户全天候高频使用,一次使用成本甚至高达数万美元,远远超过普通订阅预期。 同样在上个月,Cursor曾因其“I’ll keep it unlimited”的Pro收费模式悄然变更为计算tokens限制,导致大量用户抱怨“实际上并非无限”,纷纷在社群中吐槽,迫使公司CEO出面道歉、甚至给出退款补偿。 这两�

今日大家都在搜的词: