富士通推出新技术保护对话型AI免受幻觉和对抗性攻击

2023-09-26 10:31 · 稿源：站长之家

文章概要:
1. 富士通宣布推出两项新的人工智能信任技术，旨在提高对话型人工智能模型的可靠性，包括检测幻觉和对抗性攻击的技术。
2. 这些新技术将集成到富士通的人工智能平台“Kozuchi”中，旨在为企业和个人用户提供工具，评估对话型人工智能回复的可靠性，增强人工智能的安全性。
3. 这些技术的应用领域广泛，将有助于保护企业免受虚假信息、钓鱼攻击等威胁，从而促进更安全的人工智能使用。

站长之家（ChinaZ.com）9月26日消息:富士通于2023年9月26日宣布推出两项新的人工智能（AI）信任技术，旨在提高对话型人工智能模型的可靠性，从而增强其在各种用例中的安全性。这两项新技术包括检测对话型人工智能模型中的幻觉以及检测通过注入虚假信息进行的对抗性攻击所植入的网络钓鱼网址的技术。

第一项技术旨在高度精确地检测对话型人工智能回复中的幻觉。在业务运营中，企业经常使用对话型人工智能来提取与问题相关的信息，并将这些数据作为参考信息添加到向外部对话型人工智能提问时。尽管这种方法提供了准确的回复并减少了幻觉，但完全防止幻觉仍然是一个持续存在的问题。这是因为对话型人工智能在某些情况下无法正确提取与问题相关的信息，从而创建不相关或不正确的回复。

机器人上班打字

图源备注：图片由AI生成，图片授权服务商Midjourney

为了计算高度精确的幻觉评分，新技术首先将人工智能的回复分为三个部分（主语、谓语、宾语等），然后自动识别回复中的命名实体。接下来，技术将这些命名实体留空，并反复向外部人工智能提问，以更准确地定义这些特定表达方式。根据使用WikiBio GPT-3幻觉数据集等开放数据进行的基准测试显示，相对于其他用于检测AI幻觉的先进方法，如SelfCheckGPT，该技术可以将检测的准确性(AUC-ROC)提高约22%。

第二项技术旨在检测对话型人工智能回复中植入的网络钓鱼网址。由于对话型人工智能基于其训练数据创建回复，恶意实体可以通过在人工智能训练数据中注入恶意信息，欺骗人工智能以创建包含操纵信息的回复，例如导致虚假网站的网络钓鱼网址。

为了解决这个问题，富士通开发了一项技术，用于检测对话型人工智能回复中的操纵网址。一旦技术识别出网络钓鱼网址，它将向用户发出警告消息。这项新技术不仅可以检测网络钓鱼网址，还可以增强人工智能模型对现有攻击的抵抗力，以确保其提供高度可靠的回复。该技术是在富士通与以色列本古里安大学的合作下共同开发的，利用了恶意实体通常攻击单一类型的人工智能模型的倾向，通过使用不同的人工智能模型处理信息并评估判断结果的合理性差异来检测恶意数据。此技术不仅可用于检测网络钓鱼网址，还可用于预防欺骗使用表格数据的人工智能模型的一般攻击，从而避免对其他服务的攻击。

这两项新技术将纳入富士通的对话型人工智能核心引擎中，通过“富士通Kozuchi（代号）-富士通AI平台”提供给用户，使用户可以访问广泛的强大人工智能和机器学习技术。检测对话型人工智能中的幻觉的技术将于2023年9月28日起提供给日本用户，而检测对话型人工智能回复中的网络钓鱼网址的技术将于2023年10月起提供。这两项新技术将通过Kozuchi提供给企业用户作为演示环境，并通过专用门户网站提供给个人用户。富士通计划将这两项新技术未来推广到全球市场。

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
荐AI下一个重大飞跃是理解情感，第一个具有情商的对话型AI来了

【新智元导读】一家来自纽约的初创公司HumeAI发布了一款标榜为「第一个具有情商的对话式人工智能」的共情语音接口，并表示其能够从用户那里检测到53种不同的情绪。AI的下一个重大突破是理解情感吗?HumeAI表示是的。但这不过泛泛谈，当AI真的有了情感之后，如何用伦理、用法律去约束，人类还有很长的路要去探索。

人工智能情感识别对话式接口
新版对抗AI抓取工具Glaze 2发布，保护艺术家作品免受未经授权的AI抓取

在2023年2月，芝加哥大学的一个研究团队发布了一款名为Glaze的免费软件工具，旨在利用机器学习微调用户提供的艺术作品的像素，从改变其风格，以防止任何AI艺术生成模型对其进行抓取和训练。这项工具的目标是帮助艺术家防止AI模型模仿其艺术风格不会对其自身作品产生不利影响。Glaze2的发布标志着艺术家们在保护其创作免受未经授权的AI抓取方面迈出了更大的一步，这对�

Glaze2 AI AI头条
OpenAI推出声音克隆新技术：复刻你的声音仅需15秒

OpenAI公司最近推出了一项革命性的声音克隆技术VoiceEngine”。VoiceEngine通过文本输入和15秒的音频样本，便能生成与原始说话者声音极为相似、情感丰富且自然逼真的语音。当产品正式推向市场时，公司将设立一个禁止语音列表”，以检测并阻止与名人声音过于相似的人工智能生成声音，从避免潜在的版权和隐私问题。

OpenAI Voice Engine
AI 新技术 EVI:第一个能听懂人类语气的智能助手引发热议

一款名为EVI的AI智能助手引发了轩然大波。EVI不仅可以听懂用户说话的语气能为每个词增加意义，给出具有情感色彩的回应。除了EVI，HumeAI还推出了其他产品，如ExpressionMeasurementAPI和CustomModels，用于测量人类情感表达和预测人类偏好。

EVI AI头条
荐AI日报：可以在手机上跑的大模型Octopusv2一夜爆火；90后小伙AI“复活”逝者订单超1000；OpenAI允许构建自定义模型；第一个具有情商的对话型AI来了

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/📰🤖📢AI新鲜事斯坦福推可以在手机端跑的大模型Octopusv2超越GPT-4一夜爆火90后小伙用AI“复活”逝者，一年成交1000单OpenAI为开发者添加新功能允许构建自定义模型OpenAI转录了超过

Octopusv2
光速光合蔡伟：投增量与新技术，光速光合深耕中国绿色科技

风云变化的创投江湖驶入了绿色科技和硬科技投资的新时代。这注定是一场长期主义实践，投资初期是十分耕耘、一分回报。现在对科技企业和投资机构来讲正当时，光速光合希望能陪伴创业者们一起携手，助力中国创新，推动世界的可持续发展。

创投绿色科技硬科技
从大疆农业看农业新技术的未来：智能化、精准化农业解决方案

在农业领域，新技术的涌现正在彻底改变着传统的农业生产模式。以大疆农业为例，这家领先的农业科技公司通过引入智能化、精准化的农业解决方案，不仅极大地提升了农业生产的效率和质量为可持续农业的未来发展指明了方向。通过持续的技术创新和应用推广，农业新技术将有助于构建更加弹性的食品生产系统，提高全球食品安全水平，保障人类的长期福祉。

智能化农业大疆农业农业科技
荣登央视《新闻联播》利亚德借助创新技术深度赋能行业发展

显示行业发展进程不断加快，对于创新技术需求日益增长。量子点作为当下炙手可热的一种前沿技术，吸引了众多企业布局。利亚德将继续扎根显示行业，借助先进技术为行业发展深度赋能。

量子点技术利亚德赛富乐斯
支付宝悄悄推出新AI助理提供多项智能服务

支付宝正在悄悄推出一款全新的AI智能助理产品，正在进行灰度测试。这款AI助理隐藏在支付宝首页右上角的加号菜单中，如果你幸运地被纳入灰度测试范围，就能看到"智能助理"的入口。不过一旦正式上线，相信必将为支付宝用户带来更加智能化的使用体验。
微软推出新型AI工具VASA-1：可将照片转化为视频

微软亚洲研究院近期推出了一款革命性的人工智能工具VASA-1，这一工具的推出引起了业界和公众的广泛关注。VASA-1的独特之处在于，它能够将静态图像或绘画与音频文件结合，生成具有动态面部表情和头部动作的面孔。但令人惊讶的是，这一工具不仅适用于真实面孔的训练可以应用于艺术照片，如《蒙娜丽莎》等。

人工智能微软亚洲研究院 VASA-1

今日大家都在搜的词：

热文

3 天
7天

富士通推出新技术保护对话型AI免受幻觉和对抗性攻击

今日大家都在搜的词：

热文

站长商机