首页 > 业界 > 关键词  > 富士通最新资讯  > 正文

富士通推出新技术保护对话型AI免受幻觉和对抗性攻击

2023-09-26 10:31 · 稿源:站长之家

文章概要:

1. 富士通宣布推出两项新的人工智能信任技术,旨在提高对话型人工智能模型的可靠性,包括检测幻觉和对抗性攻击的技术。

2. 这些新技术将集成到富士通的人工智能平台“Kozuchi”中,旨在为企业和个人用户提供工具,评估对话型人工智能回复的可靠性,增强人工智能的安全性。

3. 这些技术的应用领域广泛,将有助于保护企业免受虚假信息、钓鱼攻击等威胁,从而促进更安全的人工智能使用。

站长之家(ChinaZ.com)9月26日 消息:富士通于2023年9月26日宣布推出两项新的人工智能(AI)信任技术,旨在提高对话型人工智能模型的可靠性,从而增强其在各种用例中的安全性。这两项新技术包括检测对话型人工智能模型中的幻觉以及检测通过注入虚假信息进行的对抗性攻击所植入的网络钓鱼网址的技术。

第一项技术旨在高度精确地检测对话型人工智能回复中的幻觉。在业务运营中,企业经常使用对话型人工智能来提取与问题相关的信息,并将这些数据作为参考信息添加到向外部对话型人工智能提问时。尽管这种方法提供了准确的回复并减少了幻觉,但完全防止幻觉仍然是一个持续存在的问题。这是因为对话型人工智能在某些情况下无法正确提取与问题相关的信息,从而创建不相关或不正确的回复。

机器人上班打字

图源备注:图片由AI生成,图片授权服务商Midjourney

为了计算高度精确的幻觉评分,新技术首先将人工智能的回复分为三个部分(主语、谓语、宾语等),然后自动识别回复中的命名实体。接下来,技术将这些命名实体留空,并反复向外部人工智能提问,以更准确地定义这些特定表达方式。根据使用WikiBio GPT-3幻觉数据集等开放数据进行的基准测试显示,相对于其他用于检测AI幻觉的先进方法,如SelfCheckGPT,该技术可以将检测的准确性(AUC-ROC)提高约22%。

第二项技术旨在检测对话型人工智能回复中植入的网络钓鱼网址。由于对话型人工智能基于其训练数据创建回复,恶意实体可以通过在人工智能训练数据中注入恶意信息,欺骗人工智能以创建包含操纵信息的回复,例如导致虚假网站的网络钓鱼网址。

为了解决这个问题,富士通开发了一项技术,用于检测对话型人工智能回复中的操纵网址。一旦技术识别出网络钓鱼网址,它将向用户发出警告消息。这项新技术不仅可以检测网络钓鱼网址,还可以增强人工智能模型对现有攻击的抵抗力,以确保其提供高度可靠的回复。该技术是在富士通与以色列本古里安大学的合作下共同开发的,利用了恶意实体通常攻击单一类型的人工智能模型的倾向,通过使用不同的人工智能模型处理信息并评估判断结果的合理性差异来检测恶意数据。此技术不仅可用于检测网络钓鱼网址,还可用于预防欺骗使用表格数据的人工智能模型的一般攻击,从而避免对其他服务的攻击。

这两项新技术将纳入富士通的对话型人工智能核心引擎中,通过“富士通Kozuchi(代号)-富士通AI平台”提供给用户,使用户可以访问广泛的强大人工智能和机器学习技术。检测对话型人工智能中的幻觉的技术将于2023年9月28日起提供给日本用户,而检测对话型人工智能回复中的网络钓鱼网址的技术将于2023年10月起提供。这两项新技术将通过Kozuchi提供给企业用户作为演示环境,并通过专用门户网站提供给个人用户。富士通计划将这两项新技术未来推广到全球市场。

举报

  • 相关推荐
  • 小鹏汽车与华为达成合作 XHUD相关新技术将发布

    近日,小鹏汽车正式官宣与华为乾崑智能汽车解决方案达成合作。小鹏汽车方面表示,汽车行业许久未出现令人眼前一亮的变革,而此次合作将开启改变,让行业“看见未来”,并预告“明天见”,引发外界诸多期待。 从官方发布的预热海报中,能捕捉到不少关键信息。海报上出现了HUAWEI XHUD字样以及HUD画面,由此可推测小鹏汽车将采用华为提供的AR - HUD抬头显示技术。

  • REDMI K Pad杀到!首发多项新技术 4K内配置最豪华小平板

    今日,REDMI官宣旗下首款旗舰小平板REDMI K Pad。 小米中国区市场部总经理、REDMI品牌总经理王腾表示,REDMI K Pad全面超越iPad mini,做到4K以内配置最豪华的小平板”,推动安卓小平板全面进入旗舰时代。 据了解,REDMI K Pad采用LCD屏幕,与手机只需一颗DDIC驱动屏幕不同,K Pad为了让屏幕更清晰、采用超高分辨率,需要两颗IC来驱动屏幕。 王腾指出,双驱动IC的难度在于数据、亮度�

  • 国际先进!itc保伦股份这项新技术顺利通过中国电器工业协会科技成果鉴定

    5月27日,中国电器工业协会在ITC保伦股份组织召开了"智能超高清视讯系统关键技术研究与应用"项目科技成果鉴定会。该项目由广东保伦电子、华南理工大学等单位共同完成,经专家鉴定整体技术达到国际先进水平。项目攻克了多项关键技术:实现4K60帧超高清视频画质;开发抗30%网络丢包的视频传输技术;创新实时智能语音处理技术等。已获32件发明专利,参与制定2项团体标准。鉴定委员会一致认为项目成果可广泛应用于政府、企业等领域,将有力支持远程视频会议系统建设发展。ITC表示将持续推动国产音视频技术创新发展。

  • Anthropic首席执行官:AI 模型的“幻觉”比人类少!

    Anthropic 首席执行官达里奥·阿莫代伊(Dario Amodei)表示,他认为当前的 AI 模型出现“幻觉”(即编造虚假事实并将其当作真实信息呈现)的频率,比人类还要低……

  • 中文大模型忠实性幻觉评测:豆包大模型幻觉率仅4%,位居全球收之首

    SuperCLUE+最新评测显示,豆包大模型1.5Pro以仅4%的幻觉率和96%的准确率位居全球榜首,超越DeepSeek、Gemini-2.5-pro和GPT-4o等主流模型。该模型在文本摘要、多文本问答等关键任务中表现优异,尤其在中文理解任务上国内领先。基于MoE架构设计,其综合性能超过多款超大规模预训练模型,推理成本显著降低。截至2025年3月,豆包大模型日均调用量达12.7万亿tokens,是一年前的106倍。IDC报告指出火山引擎以46.4%市场份额领跑中国公有云大模型市场。据悉,6月11日将发布豆包大模型最新升级进展。

  • 欧税通:加拿大市场常见检测认证类型有哪些?什么产品需要?

    本文介绍了跨境电商进入加拿大市场所需的合规认证要求。重点解析了两种关键认证:SOR认证针对儿童玩具,需检测有害物质确保安全性;CCPSA认证适用于纺织服装,包含阻燃性、化学物质限制等测试。文章还提及需遵守标签法规、环保法规等要求,如魁北克省需法语标签。这些认证是进入加拿大市场的"通行证",帮助卖家突破贸易壁垒,拓展全球业务。

  • 用DeepSeek徒手造一个能对话的AI简历,助你当场拿下Offer。

    ​故事是这样的。 我最近一直在招人,想招点人帮我分担一些压力,全职的实习的啥的都可以。 我这再怎么说,也是一个跟AI有关的地方,所以很多人在投简历的时候,都会写很多跟AI相关的经历,我甚至收到过很多AI生成的简历。 很多写的很玄乎,什么掌握全链路工作流,独立搭建xx系统,深度参与xx项目,掌握xx行业资源等等,但是一面,问用过最惊艳的AI产品是啥,10个�

  • 新店型落地、大手笔收购、自研AI玩具上市 | 孩子王“开放无界”战略深化

    孩子王近期加速推进"开放无界"战略,通过多元化门店布局和产业投资实现业务升级。6月推出全新Ultra门店,融合潮玩、AI等元素打造儿童时尚空间;同时加快精选店在下沉市场扩张,已布局12家自营优选小店。公司还通过1.62亿元收购上海幸研生物60%股权切入美妆赛道,并完成对江苏星丝域65%股权收购强化产业链协同。在AI领域,孩子王推出自研智能情感陪伴玩偶"啊贝贝",并升级基于DeepSeek V3大模型的KidsGPT系统,提升95%育儿知识问答覆盖率。目前直营门店突破1200家,覆盖全国200+城市,服务9400万会员,正从商品销售向"兴趣社交+科技陪伴"的体验经济转型。(来源:CBME洞察)

  • 今年第一批吃菌子中毒的人出现了:小伙出现幻觉 隔空抓物

    微博话题今年第一批吃菌子中毒的人出现了”引发关注。 据媒体报道,云南的胡先生吃野生菌后中毒致幻,躺在病床上隔空抓物,胡先生称自己看到了乌贼、水母、蜘蛛、螃蟹等等生物。 目前毒菌中毒尚无特效疗法,因为毒菌成分复杂,一般发现的野生菌中毒症状有胃肠中毒型、神经精神型、溶血型、呼吸与循环衰竭型、肝脏损害型等,其中肝脏损害型最为凶险,典型表现�

  • 火山引擎推出豆包·语音播客模型:文本秒变双人对话播客,5 秒生成热点音频!

    5月20日,火山引擎推出豆包·语音播客模型,实现文本秒转专业播客内容。该模型三大优势:1)自然流畅的双人对话效果,语音拟真度高;2)支持热点话题即时生成,5秒产出最新资讯播客;3)提供端到端创作链路,支持超长文本/网页链接转播客。相比传统AI播客,解决了内容重复、机械感强等问题。模型即将登陆豆包APP及PC端,6月11日将在火山引擎大会上展示更多功能。