首页 > 业界 > 关键词  > SPM最新资讯  > 正文

AI 图片橡皮擦来了!概念半透膜模型SPM实现精准擦除特定内容,还能改头换面

2024-03-13 14:36 · 稿源:站长之家

划重点:

⭐ 清华大学与阿里合作推出概念半透膜模型,能够精准、可控地擦除各类具象或抽象概念。

⭐ 该模型已被 CVPR2024会议高分录用,具有在 Diffusion 架构的 AI 作图模型中擦除特定概念的能力。

⭐ 模型通过一维 Adapter 和微调策略实现概念擦除,同时保留其他生成内容,并可动态适配擦除信号。

站长之家(ChinaZ.com)3月13日 消息:清华大学与阿里安全联合发布了概念半透膜模型(SPM),这一模型能够在 Diffusion 架构的 AI 作图模型中,精准、可控地擦除各类具象或抽象概念。

该模型的推出解决了传统 AI 作图模型存在的生成涉黄、侵权等危险概念的问题,实现了对特定概念的精确擦除。

image.png

概念半透膜模型通过一维 Adapter 和微调策略实现概念擦除,同时保留其他生成内容。Adapter 作为一种「半透薄膜」插入到预训练的 Diffusion Model(DM)中,学习特定概念的可迁移识别及擦除,同时保持模型完整性。通过微调策略 Latent Anchoring,模型获得对特定概念的擦除半渗透性,有效地擦除目标概念并保留其他概念。模型在推理过程中通过 Facilitated Transport 机制动态适配擦除信号,控制擦除效果,保证生成内容的准确性和完整性。

image.png

概念半透膜模型的实验效果表明,在单概念或多概念擦除时,模型能够稳定且彻底地擦除目标概念,同时对其他概念几乎没有影响。与其他方法相比,该模型具有更高的精确性和可控性,为 AI 作图模型的应用带来新的可能性。

这一研究成果有望在 AI 内生安全领域、可控生成等方面发挥重要作用,推动 AI 技术产品向着可用、可靠、可信、可控的方向发展。

SPM特色功能亮点总结如下:

概念消除功能 :使用一维适配器 Semi-Permeable Membrane(SPM),能够精确删除目标概念而保留非目标概念,实现通用、可定制和模型可转移的擦除解决方案。

代际交替侵蚀解决 **:通过引入 Latent Anchoring 策略,在微调过程中有效减轻了参数漂移,避免了概念的交替和侵蚀现象。

迁移能力 :SPM 能够在不重新调优的情况下,从一个专门的模型迁移到另一个,展现了其良好的擦除和保留能力。

艺术风格消除 :SPM 可以擦除特定的艺术风格而保留其他风格,避免了以往在擦除和保留之间的明显折衷。

明确内容消除 :在处理涉及裸露内容的情况下,SPM 能够有效消除明确内容,并展现了在不同情境下的擦除能力。

项目入口:https://top.aibase.com/tool/spm

论文网址:https://arxiv.org/abs/2312.16145

举报

  • 相关推荐
  • AI最新资讯在哪里看?AIbase:高效获取国内外AI新闻头条与行业动态

    文章探讨了AI时代信息过载的困境:有价值的前沿动态、重磅模型发布和行业解读分散各处,筛选成本高、效率低下。AIbase资讯导航站应运而生,通过四大核心功能解决痛点:1)聚合主流信源,过滤低质噪音;2)结构化分类呈现大模型动态、行业应用等六大板块;3)提炼核心要点,拒绝标题党;4)高频更新确保信息鲜度。该平台致力于成为AI领域的"信息雷达",帮助用户节省70%信息搜集时间,将精力聚焦于思考与创造。适用于技术负责人快速掌握行业动态、产品经理调研案例、投资人捕捉趋势等多元场景。

  • AI日报:昆仑万维发布SkyReels-A3模型;百度搜索PC端全面上线AI搜索;Grok 4 AI模型永久免费开放

    AI日报栏目聚焦人工智能领域最新动态:1)昆仑万维发布SkyReels-A3模型,实现语音驱动数字人生成;2)xAI宣布Grok4模型永久免费开放;3)OpenAI发布GPT-5提示词指南;4)百度PC端上线AI搜索功能;5)微软Windows Co pilot接入GPT-5;6)百川智能开源医疗大模型Baichuan-M2性能超越GPT-oss120b;7)苹果iOS26将集成ChatGPT-5;8)谷歌推出3D视觉编辑框架BlenderFusion;9)轻量级TTS模型Kitten TTS参数仅1500万;10)MiniCPM-V

  • AI日报:B站测试AI视频工具花生AI;腾讯发布多模态模型Large-Vision;昆仑万维开源Skywork UniPic 2.0

    【AI日报】主要内容: 1. B站测试"花生AI"视频工具,3分钟可成片,同时推进自研大模型和多语言翻译功能 2. 昆仑万维开源多模态模型Skywork UniPic 2.0,实现高效统一的多模态生成能力 3. 马斯克指责苹果偏袒OpenAI,苹果回应称平台设计公平公正 4. 腾讯混元发布52B参数多模态理解模型Large-Vision,支持任意分辨率输入 5. DeepSeek官方否认8月发布R2模型的传闻 6. OpenAI推出超值ChatGPT Go套餐,仅399卢比降低使用门槛 7. AI新贵Perplexity豪掷345亿美元收购谷歌Chrome 8. Anthropic的Claude Sonnet 4模型支持100万token上下文 9. ChatGPT重大更新:恢复GPT-4o默认模式,为GPT-5引入多模式选择,优化交互体验

  • AI大模型计费器如何精准比价?38款模型隐藏费用一键预警,三步告别超支

    文章揭示了AI项目成本失控的三大痛点:1)计费维度分裂,如输入/输出token分开计价;2)参数迷雾,如文心一言4.0增强模式成本是基础版3.2倍;3)汇率陷阱,海外模型美元报价波动导致实际成本偏差超15%。通过AIbase费用计算器可精准测算:支持38个主流API对比,包含隐藏费用提醒,提供四大维度的决策矩阵(百万token成本/长文本溢价/月度总价/性价比评分)。案例显示某团队发现自研模型成本比通义千问高27%后及时调整采购策略。该工具能帮助开发者避免"成本黑箱",实现零成本预算推演。

  • AI日报:可灵2.1推出全新首尾帧功能;昆仑万维上线AI音乐模型Mureka V7.5;腾讯云推出AI开发工具CloudBase AI CLI

    本文介绍了AI领域最新动态:1)快手可灵2.1推出首尾帧功能,提升视频生成效果;2)昆仑万维发布Mureka V7.5音乐模型,优化人声表现;3)腾讯云推出AI开发工具CloudBase AI CLI,可减少80%编码量;4)海外新品MuleRun通过虚拟机和AI Agent带来创新游戏体验;5)Meta开源DINOv3视觉模型,无需标注即可实现卓越性能;6)宇树科技人形机器人H1获1500米赛跑金牌;7)谷歌Gemini新增记忆功能和隐私聊天模式;8)香港大学开源OpenCUA框架,打造个性化电脑助手;9)OpenAI考虑在ChatGPT引入广告;10)谷歌发布超小型开源模型Gemma 3 270M,支持手机端运行。

  • AI模型选型太耗时?三分钟精准匹配需求的多维对比库

    文章介绍了AI模型选择面临的三大痛点:模型爆炸式增长导致选择困难、信息碎片化增加搜集成本、多维度对比效率低下。针对这些问题,AIbase模型库(https://model.aibase.cn/llm)提供了解决方案:一站式聚合主流AI模型信息,实时更新模型状态;结构化表格直观对比核心参数;支持自定义筛选条件快速锁定目标模型。该工具能帮助开发者、产品经理和研究者节省前期调研时间,将精力集中在更有价值的应用构建和创新探索上。

  • 百川开源最新医疗大模型,中国力量领跑医疗AI赛道

    专注医疗后,百川智能交出第一份答卷! 8月11日,百川智能发布第二款开源医疗增强推理大模型Baichuan-M2,其以32B的参数量,在OpenAI的Healthbench评测集上,超越其刚刚发布5天的开源模型gpt-oss-120b。

  • AI 大模型选型指南:如何在众多模型中找到最适合你的那一个?

    本文探讨了如何从众多AI大模型中选择最适合自身需求的模型。文章提出应从四个核心维度进行评估:1)核心能力对比,包括通用任务表现和特定领域专长;2)成本与效率,考量API调用成本和响应速度;3)本地化与数据安全,满足合规要求;4)生态与社区支持,关注开发者活跃度和文档完善度。为解决模型对比难题,推荐使用专业平台如AIbase模型广场,可一站式对比主流模型的多维参数和评测数据。通过系统化评估,开发者能更高效地选择契合业务需求的AI模型。

  • GPT-5和Claude 4 Opus谁更强?用这个AI大模型对比工具一眼明了

    OpenAI正式发布GPT-5,与Claude4Opus和Gemini2.5Pro进行对比测试。GPT-5在编程能力(SWE-bench测试74.9%)和数学推理(AIME2025测试94.6%)表现突出;Claude4Opus编程优异(72.5%)但数学较弱(33.9%);Gemini2.5Pro擅长长文本处理(100万token窗口)和多模态应用。价格方面,GPT-5和Gemini2.5Pro定价相近($1.25-$10),Claude4Opus较高($15-$75)。建议根据需求选择:GPT-5适合综合应用,Claude4Opus适合专业编程,Gemini2.5Pro适合长文档�

  • 迄今最先进的AI模型!ChatGPT-5具备博士级别的认知能力

    ChatGPT-5在多个领域表现出色,包括编程、数学、写作、健康和视觉感知等。 它具备增强的推理能力,能够根据对话类型选择最佳模型,并通过深度推理模型解决更具挑战性的问题。 OpenAI 表示,ChatGPT-5在知识工作方面表现卓越,其知识水平在40多种职业中均达到或超过专家水平,涵盖法律、物流、销售和工程等领域。 在基准测试中,ChatGPT-5 展现了出色的认知能力。 例如,�

今日大家都在搜的词: