首页 > 业界 > 关键词  > 富士通最新资讯  > 正文

富士通推出新技术保护对话型AI免受幻觉和对抗性攻击

2023-09-26 10:31 · 稿源:站长之家

文章概要:

1. 富士通宣布推出两项新的人工智能信任技术,旨在提高对话型人工智能模型的可靠性,包括检测幻觉和对抗性攻击的技术。

2. 这些新技术将集成到富士通的人工智能平台“Kozuchi”中,旨在为企业和个人用户提供工具,评估对话型人工智能回复的可靠性,增强人工智能的安全性。

3. 这些技术的应用领域广泛,将有助于保护企业免受虚假信息、钓鱼攻击等威胁,从而促进更安全的人工智能使用。

站长之家(ChinaZ.com)9月26日 消息:富士通于2023年9月26日宣布推出两项新的人工智能(AI)信任技术,旨在提高对话型人工智能模型的可靠性,从而增强其在各种用例中的安全性。这两项新技术包括检测对话型人工智能模型中的幻觉以及检测通过注入虚假信息进行的对抗性攻击所植入的网络钓鱼网址的技术。

第一项技术旨在高度精确地检测对话型人工智能回复中的幻觉。在业务运营中,企业经常使用对话型人工智能来提取与问题相关的信息,并将这些数据作为参考信息添加到向外部对话型人工智能提问时。尽管这种方法提供了准确的回复并减少了幻觉,但完全防止幻觉仍然是一个持续存在的问题。这是因为对话型人工智能在某些情况下无法正确提取与问题相关的信息,从而创建不相关或不正确的回复。

机器人上班打字

图源备注:图片由AI生成,图片授权服务商Midjourney

为了计算高度精确的幻觉评分,新技术首先将人工智能的回复分为三个部分(主语、谓语、宾语等),然后自动识别回复中的命名实体。接下来,技术将这些命名实体留空,并反复向外部人工智能提问,以更准确地定义这些特定表达方式。根据使用WikiBio GPT-3幻觉数据集等开放数据进行的基准测试显示,相对于其他用于检测AI幻觉的先进方法,如SelfCheckGPT,该技术可以将检测的准确性(AUC-ROC)提高约22%。

第二项技术旨在检测对话型人工智能回复中植入的网络钓鱼网址。由于对话型人工智能基于其训练数据创建回复,恶意实体可以通过在人工智能训练数据中注入恶意信息,欺骗人工智能以创建包含操纵信息的回复,例如导致虚假网站的网络钓鱼网址。

为了解决这个问题,富士通开发了一项技术,用于检测对话型人工智能回复中的操纵网址。一旦技术识别出网络钓鱼网址,它将向用户发出警告消息。这项新技术不仅可以检测网络钓鱼网址,还可以增强人工智能模型对现有攻击的抵抗力,以确保其提供高度可靠的回复。该技术是在富士通与以色列本古里安大学的合作下共同开发的,利用了恶意实体通常攻击单一类型的人工智能模型的倾向,通过使用不同的人工智能模型处理信息并评估判断结果的合理性差异来检测恶意数据。此技术不仅可用于检测网络钓鱼网址,还可用于预防欺骗使用表格数据的人工智能模型的一般攻击,从而避免对其他服务的攻击。

这两项新技术将纳入富士通的对话型人工智能核心引擎中,通过“富士通Kozuchi(代号)-富士通AI平台”提供给用户,使用户可以访问广泛的强大人工智能和机器学习技术。检测对话型人工智能中的幻觉的技术将于2023年9月28日起提供给日本用户,而检测对话型人工智能回复中的网络钓鱼网址的技术将于2023年10月起提供。这两项新技术将通过Kozuchi提供给企业用户作为演示环境,并通过专用门户网站提供给个人用户。富士通计划将这两项新技术未来推广到全球市场。

举报

  • 相关推荐
  • 免费!AI对话式搜索词挖掘工具,一键检测品牌在AI搜索中的可见度

    本文探讨在AI搜索时代如何提升品牌、产品或内容的AI推荐可见度。关键在于挖掘AI对话式搜索词并优化内容,避免因未被AI抓取或排名靠后导致流量损失。推荐使用AIBase平台的GEO排名查询工具,免费检测品牌在主流AI搜索中的曝光度、排名及竞品对比,并提供优化建议,帮助抢占AI流量高地。该工具覆盖多平台,操作简单,适合企业、内容创作者及电商使用。

  • AI加持!千匠食材采销供应链平台解决方案激活食材流通新活力

    传统食材流通领域存在供应商分散、中间环节冗长、信息不透明、采购成本高等痛点。千匠食材采销供应链平台通过S2B模式重构行业生态,聚合上游供应商资源,为下游餐饮企业等提供撮合、分销、物流、金融一站式服务。平台实现需求聚合-规模采购-智能配送-数据反馈闭环,帮助采购端降低成本、稳定品质,销售端拓展渠道、加速资金回笼,平台端沉淀数据资产提升运营效率。该系统具备全链路溯源、智能预测、移动化操作等技术特点,以数字化赋能食材流通全链条价值重塑。

  • 为什么会收到美标审查意见?哪些细节会导致审查不通过_麦德通

    美国商标注册审查日益严格,导致驳回率居高不下。主要原因包括:申请材料填写不规范、使用证据不符合要求、商品描述模糊、与在先商标近似、缺乏显著性等。收到驳回通知后,需在3个月答复期内精准判断驳回类型:非实质性驳回需按要求补充材料;实质性驳回需提交抗辩理由及证据。建议委托专业律师处理,通过前期检索和规范申请可显著提升通过率。商标注册全程约12-18个月,成功后需定期提交使用宣誓维持效力。

  • 山东河北现串珠型不明发光飞行物 网友纷纷猜测

    21日晚,山东日照五莲、潍坊诸城及河北多地夜空出现一串不明发光飞行物,呈线性排列的暖色光点引发民众热议。目击者纷纷拍摄记录,有人戏称“UFO现身”。网友猜测包括马斯克星链卫星、潍坊特色发光风筝或无人机表演等,但根据飞行高度低、亮度高等特征,基本排除星链可能性。这一现象覆盖范围广,具体成因仍待确认。

  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

  • 小米17 Pro妙享背屏对话翻译上线:正屏说中文 背屏即时翻译

    小米13 Pro系列近日上线妙享背屏对话翻译功能,实测对着手机说中文即可实时显示译文,效率很高。背屏还新增大头贴模式,支持拍摄动态照片,并加入多款动态壁纸。游戏方面新增植物合成与雪人推箱子两款休闲游戏,搭配复古风格保护壳,操作简洁有趣。作为核心亮点,背屏采用与主屏同源的龙晶玻璃,支持LTPO自适应刷新率,横向覆盖后摄模组,辨识度拉满。小米总裁卢伟冰表示,该系列大胆创新获用户积极反馈,下一代旗舰将继续沿用背屏设计并加大研发投入。

  • 石化盈科联合IDC发布《“新”型工业 “智”变运营——石油石化新智运营白皮书》

    2025年10月17日,石化盈科与IDC联合发布《石油石化新智运营白皮书》,首次系统性提出“新智运营”概念。该理念以数字化、智能化技术为基石,通过“智能感知、平台、决策”三大核心能力,构建覆盖全产业链的“数据×知识”双轮驱动运营体系,推动管理、研发、生产与服务模式创新,旨在实现高端化、智能化、绿色化发展目标,助力行业应对能源转型与全球化竞争挑战。

  • 小米17 Pro系列妙享背屏新功能上线:包括对话翻译、新游戏等

    小米17系列妙享背屏功能将于10月29日正式上线,包含四大亮点:动态大头贴支持拍摄生动瞬间并新增明亮风格模板;对话翻译实现正屏输入、背屏即时显示译文;新增动态壁纸提升界面趣味性;配合游戏手机壳可畅玩《愤怒的小鸟》等经典游戏。该背屏还支持倒计时、音乐控制等实用功能,尺寸设计合理,投入超10亿元研发,体现小米对用户体验的重视。

  • 金蝶信用付再拓新局!“中标贷”赋能医疗器械流通

    医疗器械经销商韩某中标后陷入资金困境:上游品牌要求全款订货,单台设备采购价达数百万元,而公立医院回款周期普遍延长至180天。行业普遍存在“先垫资后回款”模式,中小企业现金流断裂风险加剧。金蝶信用付推出中标贷融资服务,无需抵押担保,资金直接支付给上游供应商,破解垫资难题。该服务已覆盖全国二级以上公立医疗机构,户均授信276万元,年利率低至3.9%。案例显示,某公司中标后当天获300万额度,签约日即获83万垫付款,保障项目资金周转。中国医疗器械市场规模持续增长,2024年达1.11万亿元,供应链金融服务助力行业稳健发展。

  • 被AI引用才是真的流量:写出让GPT、Gemini主动引用的AI搜索友好型内容(实操清单 + 工具推荐)

    本文系统介绍生成式引擎优化(GEO)的核心方法,帮助内容从“给人看”升级为“AI友好型”。关键策略包括:1.采用结构化写作框架,在开头设置可直接回答问题的“黄金段落”;2.运用分步清单、数据标注、FAQ等模块提升内容引用率;3.通过多平台同步分发增加曝光;4.使用AIBase等工具量化监测内容被AI引用的频率与场景,并给出5天落地执行表。

今日大家都在搜的词: