首页 > 业界 > 关键词  > 麻省理工最新资讯  > 正文

麻省理工推出AI工具PhotoGuard 对抗生成式AI模型

2023-08-01 16:14 · 稿源:站长之家

站长之家(ChinaZ.com) 8月1日 消息:近年来,大型扩散模型,如 DALL-E 2 和 Stable Diffusion,因其生成高质量、逼真的图像以及执行各种图像合成和编辑任务的能力而受到认可。

人工智能 AI 数字人

但是,人们对用户友好的生成式 AI 模型的潜在滥用也越来越担忧,这些模型可能会导致不适当或有害的数字内容的创建。例如,恶意行为者可能利用公开分享的个人照片,通过使用现成的扩散模型,出于恶意目的对其进行编辑。

为了应对未经授权的图像操纵带来的日益严峻的挑战,麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究人员推出了一种名为“PhotoGuard”的 AI 工具,旨在对抗 DALL-E 和 Midjourney 等先进的生成式 AI 模型。 在研究论文《提高恶意 AI 驱动的图像编辑的成本》中,研究人员声称,PhotoGuard 可以检测像素值中不可察觉的“扰动”(干扰或不规则),这些扰动肉眼无法看到,但计算机模型可以检测到。

“我们的工具旨在在上传到互联网之前‘加固’图像,确保抵抗 AI 驱动的操纵尝试,”麻省理工学院 CSAIL 博士生兼论文第一作者 Hadi Salman 对 VentureBeat 说。“在我们的概念验证论文中,我们重点关注使用目前最流行的 AI 模型类别进行图像修改。这种抵抗力是通过在要保护的图像的像素中加入微妙地制作、不可察觉的扰动来建立的。这些扰动旨在破坏试图操纵图像的 AI 模型的功能。”

据麻省理工学院 CSAIL 的研究人员介绍,该 AI 采用了两种不同的“攻击”方法来创建扰动:编码器和扩散。

“编码器”攻击侧重于 AI 模型中图像的潜在表示,使模型将图像视为随机,并使图像操纵几乎变得不可能。同样,“扩散”攻击是一种更复杂的方法,涉及确定目标图像并优化扰动,使生成的图像与目标更加相似。 Salman 解释说,其 AI 使用的关键机制是“对抗性扰动”。

“这种扰动是对图像像素进行不可察觉地修改,已被证明非常有效地操纵机器学习模型的行为,”他说。“PhotoGuard 使用这些扰动来操纵处理受保护图像的 AI 模型,使其产生不现实或无意义的编辑。”

麻省理工学院 CSAIL 的研究生团队和主要作者 —— 包括 Alaa Khaddaj、Guillaume Leclerc 和 Andrew Ilyas —— 也参与了该论文。

该研究还于 7 月在国际机器学习会议上展示,并得到了国家科学基金会、开放哲学和国防高级研究项目局等机构资助。

Salman 说,尽管 DALL-E 和 Midjourney 等 AI 驱动的生成式模型因其能够从简单的文本描述中创建逼真的图像而受到关注,但滥用的风险也越来越明显。这些模型使用户能够生成高度详细和逼真的图像,为无辜和恶意的应用开辟了可能性。

Salman 警告说,欺诈性的图像操纵不仅会影响市场趋势和公众情绪,还会对个人图像构成风险。不恰当地修改的图片可能被用于敲诈勒索,从而在更大的范围内造成重大的财务影响。

举报

  • 相关推荐
  • 神州数码 x 嘉岳数智:以生成式AI打造绿色低碳行业的“懂碳帝”

    在"双碳"战略推动下,绿色转型成为产业升级和企业发展的重要方向。神州数码与嘉岳数智科技合作,探索AI技术在碳评估智能化领域的应用,解决传统碳评估面临的数据分散、专业性强等痛点。通过构建EPAG专家流程增强生成框架、Agent场景分类机制和自动化评估学习流程,显著提升专业术语理解准确率至95%以上,大幅减少人工编辑工作量。双方打造的智能评估产品已进入预发布阶段,为生成式AI在垂直行业落地树立标杆,助力企业实现绿色低碳转型目标。

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • ppt自动生成工具最好用的3个

    文章介绍了当前AI生成PPT工具的发展现状,重点推荐了"秒出PPT"这一专业平台。该平台具有三大特色功能:1)智能对话式生成,支持中途修改需求;2)提供三种编辑模式(纯文本、纯设计和文本+设计);3)支持导入文档自动排版,提供"保持原文"和"AI智能修改"两种模式。平台还拥有丰富的模板库,支持在线更换颜色、字体等设计元素。虽然需要购买会员,但相比市面上质量参差不齐的同类产品,该工具在交互体验和功能完整性上表现突出。

  • 最好用的AI生成PPT工具全球横评:谁才是用户效率与专业的首选?

    文章对比评测了5款主流AI驱动的PPT生成工具,重点从生成速度、内容逻辑、模板质量、国际化体验等维度进行分析。PPT.AI综合表现最佳,其极速响应、强大逻辑架构、海量国际模板库和无缝全球化体验尤为突出,特别适合跨境专业人士;Gamma以交互体验和设计感见长;Presentations.AI生成速度最快;ChatPPT对中文用户最友好;iSlide则依托强大设计资源库更适合团队协作。总体而言,P

  • 马斯克旗xAI推出Grok 4 宣称世界上最强大的AI模型

    据媒体报道,马斯克旗下人工智能公司xAI正式推出新一代旗舰模型Grok 4,并宣称其为世界上最强大的AI模型”。 该模型基于xAI的Colossus超级计算机训练,核心优势在于其深度推理能力,承诺带来显著增强的逻辑推理和文本生成水平。 此外,Grok 4还具备自然的人类对话风格、实时网络访问能力,以及对互联网文化(包括梗、俚语和幽默)的高精度理解。

  • 2025年国外AI工具排名TOP10|全球热门AI工具全面解析 + 最全AI工具库推荐

    文章介绍了2025年国外AI工具Top10榜单,包括ChatGPT(对话生成)、Claude(长文本处理)、Midjourney(图像生成)、Gemini(多模态生成)、GitHub C opilot(编程辅助)、Notion AI(知识管理)、Perplexity AI(智能搜索)、Runway ML(视频编辑)、ElevenLabs(语音合成)和Descript(音视频编辑)。推荐使用AIbase平台一站式查找和管理AI工具,该平台收录上千款工具,支持智能搜索分类,提供中文界面和实时更新。建议用户关�

  • 可灵AI推出可图2.1模型 多维能力跃升、会员限时7天免费

    可灵AI于7月10日上线可图2.1模型,图片生成能力全面升级:1)指令遵循能力显著提升,可精准捕捉复杂提示细节;2)新增180多种风格响应,支持特殊材质、数字艺术等创作需求;3)人像美感大幅优化,肌肤纹理与光影效果更自然;4)增强电影质感生成,能呈现大片级层次氛围;5)文字生成效果提升,支持中英文营销海报等设计。即日起面向会员免费开放7天,实测显示该模型在复杂场景还原和细节表现上达到新高度,累计已生成超3亿张图片。

  • 2025最好的AI工具是什么 2025全球最佳AI工具终极指南

    文章探讨了当前AI工具爆炸式发展的现状,指出不存在适用于所有场景的"最佳AI工具",而是要根据个人需求选择最适合的组合。作者推荐使用AIbase平台(https://app.aibase.cn/),这是一个AI工具导航和搜索引擎,收录了全球数千款主流和新兴AI工具,涵盖写作、绘画、视频处理、办公自动化等多个领域。平台提供详细分类、真实用户评价和实时更新,能帮助用户快速找到适�

  • Perplexity推出AI浏览器Comet:想用得开1400元/月的订阅

    由英伟达支持的Perplexity AI推出了一款名为Comet的AI驱动网络浏览器。 Comet浏览器的核心卖点是其AI驱动的交互体验,公司表示它将整个浏览会话转变为单一、无缝的交互,将复杂的工作流程简化为流畅的对话。

  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。