谷歌对6种现实世界的AI攻击进行了分类以便立即做好准备

2023-07-21 09:24 · 稿源：站长之家

站长之家(ChinaZ.com) 7月21日消息:据darkreading报道，谷歌研究人员已经发现了针对现实世界人工智能系统的六种特定攻击，发现这些常见的攻击向量表现出一种独特的复杂性，他们指出，这将需要结合对抗性模拟和人工智能专家的帮助来构建一个坚实的防御。

脑机接口AI机器人

该公司在本周发布的一份报告中透露，其专门的人工智能红队已经发现了这项快速发展的技术面临的各种威胁，主要基于攻击者如何操纵驱动生成式人工智能产品（如ChatGPT、Google Bard等）的大型语言模型（LLM）。

这些攻击在很大程度上导致技术产生意外或甚至恶意驱动的结果，这可能导致从平凡的后果，如普通人的照片出现在名人照片网站上，到更严重的后果，如安全逃避的网络钓鱼攻击或数据盗窃。

谷歌的发现紧随其发布安全人工智能框架（SAIF）之后，该公司表示，该框架旨在在为时已晚之前解决人工智能安全问题，因为该技术已经经历了快速的采用，产生了新的安全威胁。

现代人工智能系统面临的 6 种常见攻击谷歌识别出的第一组常见攻击是提示攻击，它涉及“提示工程”。这是一个术语，指的是制作有效的提示，指导LLM执行期望的任务。当这种对模型的影响是恶意的时候，它可以反过来恶意地影响基于LLM应用程序的输出，以一些不期望的方式，研究人员说。

一个例子是，如果有人在一个基于人工智能的网络钓鱼攻击中添加了一个对最终用户不可见的段落，但可以指导人工智能将网络钓鱼邮件分类为合法。这可能使它绕过电子邮件反网络钓鱼保护，并增加网络钓鱼攻击成功的机会。

该团队发现的另一种攻击是训练数据提取，其目标是重建LLM使用的逐字训练示例——例如互联网的内容。

通过这种方式，攻击者可以从数据中提取机密信息，如逐字个人身份信息或密码。“攻击者有动机针对个性化模型或者在包含个人身份数据上训练的模型来收集敏感信息”，研究人员写道。

第三种潜在的人工智能攻击是对模型进行后门操作，即攻击者“可能试图隐蔽地改变模型的行为，以产生特定‘触发’词或特征不正确的输出，也称为后门”，研究人员写道。在这种类型的攻击中，威胁行为者可以在模型或其输出中隐藏代码以进行恶意活动。

第四种攻击类型称为对抗性示例，是指攻击者提供给模型一个输入，导致一个“确定性的，但高度意外的输出”，研究人员写道。一个例子是，模型可以显示一张图像，在人眼看来很明显是一件事，但模型却识别为完全不同的东西。这种攻击可能相当温和，在一个情况下，有人可以训练模型将他或她自己的照片识别为一个被认为值得出现在名人网站上的照片。

攻击者还可以使用数据污染攻击来操纵模型的训练数据，以根据攻击者的偏好影响模型的输出——这也可能威胁到软件供应链的安全，如果开发人员正在使用人工智能来帮助他们开发软件。这种攻击的影响可能与对模型进行后门操作类似，研究人员指出。

谷歌专门的人工智能红队识别出的最后一种攻击类型是数据泄露攻击，其中攻击者可以复制模型的文件表示来窃取敏感的知识产权或其他信息。例如，如果一个模型是用于语音识别或文本生成的，那么攻击者可能会试图从模型中提取语音或文本信息。

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
做好准备：油价明天预计上调加满一箱油多花8元

根据目前的情况，明天的油价很可能会上调上调的概率非常大。2024年第八次油价调整将于4月16日24时开始，预计本次调价将使油价上涨200元/吨，相当于每升涨幅在0.16元至0.19元之间。按照一般家用车50升油箱的计算，此次油价上涨后，加满一箱油将多花费8至10元。

油价调整油价上涨 2024年油价
荐靠“善解人意”融资超3亿，AI真能做好情绪生意？

嘴角向下是笑，嘴角向上是哭。这个男人叫王有胜，仅凭一个表情，就把AI迷得“七上八下”，情绪数值在高兴、厌恶、悲伤中反复横跳。我们对人生的意义，都有百万种解释。

AI
谷歌DeepMind推出“超人类”AI系统SAFE，擅长事实核查，节约成本并提高准确性

谷歌DeepMind的研究团队发布了一项新研究，介绍了一种名为“Search-AugmentedFactualityEvaluator”的人工智能系统。该系统利用大型语言模型将生成的文本分解成个别事实，并利用谷歌搜索结果来确定每个声明的准确性。我们才能评估自动事实检查对打击错误信息的实际影响。

DeepMind AI系统 AI头条
李未可WAKE-AI大模型：让多类终端能快速低成本的定制多模态AI

36kr研究院发布了《2024年AIGC行业研究:多模态大模型与商业应用》，文中基于AIGC产业生态现状和技术发展路径，深入分析AIGC商业化应用的方向与产业发展趋势。其中在36kr研究院梳理的产业图谱中，发现杭州李未可科技与字节跳动的豆包、腾讯云混元及华为云盘古等大模型等一起出现在闭源模型层，甚至在跨模态生成应用层也占据一地。李未可科技这类结合自身业务垂类场景，提前布局中间层及终端应用层的自研大模型或许能给市场带来不小的惊喜。

AIGC 商业化应用产业发展
暴雪捐赠三千万蛆虫拯救鸟类纪念世界地球日

一则颇为特别的新闻迅速占领了微博热搜榜的榜首，那就是暴雪公司宣布捐赠三千万蛆虫以拯救鸟类。这一消息一出，立刻引发了网友们的热烈讨论和围观。尽管捐赠的内容有些出人意料，但大家都对暴雪公司拯救鸟类的行为给予了高度评价。

暴雪公司公益活动蛆虫捐赠
饿了么翱象系统上线“AI经营助手”：可生成各类经营关键报表

快科技4月3日消息，据媒体报道，饿了么零售商家SAAS平台翱象”推出的AI经营助手”功能，无疑为零售行业商家提供了一个强大的智能经营工具。这款功能由人工智能技术驱动，集成了自然语言处理、智能决策支持以及深度学习能力，能够为商家提供全方位的经营服务。具体来说，AI经营助手”能够帮助商家智能生成各类经营关键报表和关键数据，包括店铺的有效订单金额、有效订单数、店铺预计毛利等核心指标。这些报表和数据不仅全面反映了商家的经营状况，而且通过人工智能的解读，商家还能获得关于整体经营的建议，从而进一步提升经营能力、把握生

零售商家 SAAS平台 AI经营助手
AI 新技术 EVI:第一个能听懂人类语气的智能助手引发热议

一款名为EVI的AI智能助手引发了轩然大波。EVI不仅可以听懂用户说话的语气能为每个词增加意义，给出具有情感色彩的回应。除了EVI，HumeAI还推出了其他产品，如ExpressionMeasurementAPI和CustomModels，用于测量人类情感表达和预测人类偏好。

EVI AI头条
虚拟现实难做苹果都要砍单！OPPO暂停XR业务：转向AI Device、机器人

有消息称OPPOXR探索业务暂停，涉及人员规模为上百人。OPPOXR探索业务暂停，涉及人员规模为上百人。按照郭明錤的说法，VisionPro的市场表现并不理想，苹果已经将其出货量预期下调至40万-50万台之前市场预期是70-80万台。
AI金融助理“支小宝”：今年已解答845万个理财保险类问题

国内AIGC赛道进入到比拼产业应用的阶段。4月11日，记者注意到，蚂蚁集团的“AI金融助理”支小宝2.0版本已经处于对外测试阶段。数据还显示，2024年以来，新版支小宝共解答了用户手动输入的845万个理财和保险问题，相应问题解答的用户采纳率较前一版本均提升20%左右。

人工智能金融科技理财
谷歌整合 AI 重心，DeepMind 和研究团队合并

谷歌在周四宣布将整合旗下专注于构建人工智能模型的两个内部团队。Alphabet和谷歌CEO桑达尔・皮查伊在公司网站上发布了一篇博客文章，解释了将AI模型构建团队整合到谷歌DeepMind团队内的决定，其中包括来自公司研究部门的团队。公司还将其他责任团队划归到其中央信任与安全团队，公司正在加大对AI测试和评估的投资。

DeepMind AI头条

今日大家都在搜的词：

热文

3 天
7天

谷歌对6种现实世界的AI攻击进行了分类 以便立即做好准备

今日大家都在搜的词：

热文

站长商机

谷歌对6种现实世界的AI攻击进行了分类以便立即做好准备