富士通推出新技术保护对话型AI免受幻觉和对抗性攻击

2023-09-26 10:31 · 稿源：站长之家

文章概要:
1. 富士通宣布推出两项新的人工智能信任技术，旨在提高对话型人工智能模型的可靠性，包括检测幻觉和对抗性攻击的技术。
2. 这些新技术将集成到富士通的人工智能平台“Kozuchi”中，旨在为企业和个人用户提供工具，评估对话型人工智能回复的可靠性，增强人工智能的安全性。
3. 这些技术的应用领域广泛，将有助于保护企业免受虚假信息、钓鱼攻击等威胁，从而促进更安全的人工智能使用。

站长之家（ChinaZ.com）9月26日消息:富士通于2023年9月26日宣布推出两项新的人工智能（AI）信任技术，旨在提高对话型人工智能模型的可靠性，从而增强其在各种用例中的安全性。这两项新技术包括检测对话型人工智能模型中的幻觉以及检测通过注入虚假信息进行的对抗性攻击所植入的网络钓鱼网址的技术。

第一项技术旨在高度精确地检测对话型人工智能回复中的幻觉。在业务运营中，企业经常使用对话型人工智能来提取与问题相关的信息，并将这些数据作为参考信息添加到向外部对话型人工智能提问时。尽管这种方法提供了准确的回复并减少了幻觉，但完全防止幻觉仍然是一个持续存在的问题。这是因为对话型人工智能在某些情况下无法正确提取与问题相关的信息，从而创建不相关或不正确的回复。

机器人上班打字

图源备注：图片由AI生成，图片授权服务商Midjourney

为了计算高度精确的幻觉评分，新技术首先将人工智能的回复分为三个部分（主语、谓语、宾语等），然后自动识别回复中的命名实体。接下来，技术将这些命名实体留空，并反复向外部人工智能提问，以更准确地定义这些特定表达方式。根据使用WikiBio GPT-3幻觉数据集等开放数据进行的基准测试显示，相对于其他用于检测AI幻觉的先进方法，如SelfCheckGPT，该技术可以将检测的准确性(AUC-ROC)提高约22%。

第二项技术旨在检测对话型人工智能回复中植入的网络钓鱼网址。由于对话型人工智能基于其训练数据创建回复，恶意实体可以通过在人工智能训练数据中注入恶意信息，欺骗人工智能以创建包含操纵信息的回复，例如导致虚假网站的网络钓鱼网址。

为了解决这个问题，富士通开发了一项技术，用于检测对话型人工智能回复中的操纵网址。一旦技术识别出网络钓鱼网址，它将向用户发出警告消息。这项新技术不仅可以检测网络钓鱼网址，还可以增强人工智能模型对现有攻击的抵抗力，以确保其提供高度可靠的回复。该技术是在富士通与以色列本古里安大学的合作下共同开发的，利用了恶意实体通常攻击单一类型的人工智能模型的倾向，通过使用不同的人工智能模型处理信息并评估判断结果的合理性差异来检测恶意数据。此技术不仅可用于检测网络钓鱼网址，还可用于预防欺骗使用表格数据的人工智能模型的一般攻击，从而避免对其他服务的攻击。

这两项新技术将纳入富士通的对话型人工智能核心引擎中，通过“富士通Kozuchi（代号）-富士通AI平台”提供给用户，使用户可以访问广泛的强大人工智能和机器学习技术。检测对话型人工智能中的幻觉的技术将于2023年9月28日起提供给日本用户，而检测对话型人工智能回复中的网络钓鱼网址的技术将于2023年10月起提供。这两项新技术将通过Kozuchi提供给企业用户作为演示环境，并通过专用门户网站提供给个人用户。富士通计划将这两项新技术未来推广到全球市场。

（举报）

相关推荐

关键词：

“AI+文旅”释放赋能效应，数字王国推动综合型体验落地上海

全球顶级视觉特效公司数字王国计划联合多家国际企业，在上海打造以人工智能为技术支撑、融合多个国际知名IP的综合性文旅项目。该公司拥有30年虚拟人、视觉特效技术积累，曾获奥斯卡奖项，并开发虚拟人邓丽君等经典IP。项目将结合VR/AR/MR技术，推出沉浸式体验，并计划引入好莱坞电影IP及中国原创文化内容，构建全球化沉浸体验空间。此举旨在推动科技与文化融合，助力上海静安、杨浦两区打造城市新地标与文旅新生态。

人工智能文旅项目视觉特效
免费！AI对话式搜索词挖掘工具，一键检测品牌在AI搜索中的可见度

本文探讨在AI搜索时代如何提升品牌、产品或内容的AI推荐可见度。关键在于挖掘AI对话式搜索词并优化内容，避免因未被AI抓取或排名靠后导致流量损失。推荐使用AIBase平台的GEO排名查询工具，免费检测品牌在主流AI搜索中的曝光度、排名及竞品对比，并提供优化建议，帮助抢占AI流量高地。该工具覆盖多平台，操作简单，适合企业、内容创作者及电商使用。

AI搜索品牌优化内容推荐
AI加持！千匠食材采销供应链平台解决方案激活食材流通新活力

传统食材流通领域存在供应商分散、中间环节冗长、信息不透明、采购成本高等痛点。千匠食材采销供应链平台通过S2B模式重构行业生态，聚合上游供应商资源，为下游餐饮企业等提供撮合、分销、物流、金融一站式服务。平台实现需求聚合-规模采购-智能配送-数据反馈闭环，帮助采购端降低成本、稳定品质，销售端拓展渠道、加速资金回笼，平台端沉淀数据资产提升运营效率。该系统具备全链路溯源、智能预测、移动化操作等技术特点，以数字化赋能食材流通全链条价值重塑。

食材流通供应链平台数字化改造
小鹅通扮演“技术合伙人”，助力创业者跨越数字化鸿沟

当前众多拥有优质产品与服务的创业者在数字化转型中遭遇瓶颈，面临技术门槛高、运营经验缺、数据分散等共性难题。小鹅通以稳定灵活的一站式解决方案，帮助创业者突破地域限制、零技术基础搭建平台，并支持功能随业务同步升级。通过实际案例展示其如何助力教育、非遗、三农等领域实现线上转型，未来将持续迭代技术，陪伴创业者将创意转化为可持续的线上业务。

数字化转型创业者痛点线上解决方案
为什么会收到美标审查意见？哪些细节会导致审查不通过_麦德通

美国商标注册审查日益严格，导致驳回率居高不下。主要原因包括：申请材料填写不规范、使用证据不符合要求、商品描述模糊、与在先商标近似、缺乏显著性等。收到驳回通知后，需在3个月答复期内精准判断驳回类型：非实质性驳回需按要求补充材料；实质性驳回需提交抗辩理由及证据。建议委托专业律师处理，通过前期检索和规范申请可显著提升通过率。商标注册全程约12-18个月，成功后需定期提交使用宣誓维持效力。

跨境电商美国商标 USPTO审查
Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发，专为多轮对话场景设计，支持中英川粤等多语言/方言与副语言风格，能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点，在播客、语音合成等场景表现突出，获开发者广泛关注。Hugging Face CEO也转发相关内容，团队未来将持续优化语音对话、拟人化表达等核心交互能力，深化开源生态建设。

SoulX-Podcast TTS 语音生成模型
小米17 Pro妙享背屏对话翻译上线：正屏说中文背屏即时翻译

小米13 Pro系列近日上线妙享背屏对话翻译功能，实测对着手机说中文即可实时显示译文，效率很高。背屏还新增大头贴模式，支持拍摄动态照片，并加入多款动态壁纸。游戏方面新增植物合成与雪人推箱子两款休闲游戏，搭配复古风格保护壳，操作简洁有趣。作为核心亮点，背屏采用与主屏同源的龙晶玻璃，支持LTPO自适应刷新率，横向覆盖后摄模组，辨识度拉满。小米总裁卢伟冰表示，该系列大胆创新获用户积极反馈，下一代旗舰将继续沿用背屏设计并加大研发投入。

小米17Pro 妙享背屏对话翻译
小米17 Pro系列妙享背屏新功能上线：包括对话翻译、新游戏等

小米17系列妙享背屏功能将于10月29日正式上线，包含四大亮点：动态大头贴支持拍摄生动瞬间并新增明亮风格模板；对话翻译实现正屏输入、背屏即时显示译文；新增动态壁纸提升界面趣味性；配合游戏手机壳可畅玩《愤怒的小鸟》等经典游戏。该背屏还支持倒计时、音乐控制等实用功能，尺寸设计合理，投入超10亿元研发，体现小米对用户体验的重视。

小米17系列妙享背屏动态大头贴
金蝶信用付再拓新局！“中标贷”赋能医疗器械流通

医疗器械经销商韩某中标后陷入资金困境：上游品牌要求全款订货，单台设备采购价达数百万元，而公立医院回款周期普遍延长至180天。行业普遍存在“先垫资后回款”模式，中小企业现金流断裂风险加剧。金蝶信用付推出中标贷融资服务，无需抵押担保，资金直接支付给上游供应商，破解垫资难题。该服务已覆盖全国二级以上公立医疗机构，户均授信276万元，年利率低至3.9%。案例显示，某公司中标后当天获300万额度，签约日即获83万垫付款，保障项目资金周转。中国医疗器械市场规模持续增长，2024年达1.11万亿元，供应链金融服务助力行业稳健发展。

医疗器械经销商中标困境资金周转压力
被AI引用才是真的流量：写出让GPT、Gemini主动引用的AI搜索友好型内容（实操清单 + 工具推荐）

本文系统介绍生成式引擎优化(GEO)的核心方法，帮助内容从“给人看”升级为“AI友好型”。关键策略包括：1.采用结构化写作框架，在开头设置可直接回答问题的“黄金段落”；2.运用分步清单、数据标注、FAQ等模块提升内容引用率；3.通过多平台同步分发增加曝光；4.使用AIBase等工具量化监测内容被AI引用的频率与场景，并给出5天落地执行表。

AI搜索友好型内容创作 GEO Generative

今日大家都在搜的词：

热文

3 天
7天

富士通推出新技术保护对话型AI免受幻觉和对抗性攻击

“AI+文旅”释放赋能效应，数字王国推动综合型体验落地上海

免费！AI对话式搜索词挖掘工具，一键检测品牌在AI搜索中的可见度

AI加持！千匠食材采销供应链平台解决方案激活食材流通新活力

小鹅通扮演“技术合伙人”，助力创业者跨越数字化鸿沟

为什么会收到美标审查意见？哪些细节会导致审查不通过_麦德通

Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

小米17 Pro妙享背屏对话翻译上线：正屏说中文背屏即时翻译

小米17 Pro系列妙享背屏新功能上线：包括对话翻译、新游戏等

金蝶信用付再拓新局！“中标贷”赋能医疗器械流通

被AI引用才是真的流量：写出让GPT、Gemini主动引用的AI搜索友好型内容（实操清单 + 工具推荐）

今日大家都在搜的词：

热文

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

华为Mate70 Air官宣今日开启预售

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

何小鹏回应机器人IRON里是真人质疑：感谢认可

华为路由X3 Pro今日开启预售：售价1299元起

俞敏洪发文确认孙东旭离职：保持着良好的沟通

OPPO Reno15系列官宣11月10日发布

iPhone Air 2或新增1颗镜头：继续沿用6.5英寸高刷中屏

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

鸿蒙HarmonyOS 6与iOS数据互传功能预计12月上线

阿里回应饿了么更名：正处于灰度测试阶段

AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功

DeepSeek崩了上热搜页面显示“服务器繁忙”

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

特斯拉Cybercab不配备方向盘和踏板预计2026年二季度下线

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

站长商机