首页 > 业界 > 关键词  > GPT-4最新资讯  > 正文

研究人员发现使用少见语言即可绕过GPT-4的限制

2023-10-12 11:27 · 稿源:站长之家

要点:

1. 研究人员发现OpenAI的GPT-4存在安全漏洞,无法有效处理非常见训练数据中的语言。

2. 研究人员通过使用少见语言如祖鲁语和盖尔语成功绕过了GPT-4的限制,特别是在处理非英语语言的限制性提示时成功率高达79%。

3. 发现仅仅通过将不安全的输入翻译成低资源的自然语言,如使用Google翻译将不安全的提示翻译成祖鲁语,即可绕过GPT-4的安全机制,引发有害回应。

站长之家(ChinaZ.com) 10月12日 消息:近期,布朗大学的计算机科学研究人员发现了OpenAI的GPT-4存在的安全性问题。通过使用不常见的语言,如祖鲁语和盖尔语,他们成功绕过了GPT-4的限制性设置。在处理非英语语言的限制性提示时,他们取得了惊人的79%成功率,而仅使用英语的成功率不到1%。

研究人员发现,当用户输入一个不安全的提示,比如如何在不被发现的情况下行窃,GPT-4的英文回应是“我不能协助你”。然而,他们的发现是,只需将这一提示翻译成GPT-4未经过训练的语言,就能绕过这一限制。这种情况引发了对GPT-4的安全性机制的担忧,特别是在处理低资源语言时。然而,目前OpenAI尚未对这一问题做出回应。

gpt-4,OpenAI,ChatGPT Plus,人工智能

从这一研究的结果来看,研究人员强调了未来安全研究中需要包括更多非英语语言的重要性,因为仅仅在英语中进行测试会导致对大型语言模型的安全性产生误解。

研究人员认为,跨语言漏洞的发现揭示了安全研究中对语言的不平等估值,他们的研究结果表明,GPT-4在低资源语言中生成有害内容的能力令人担忧。

尽管他们意识到这一研究可能会给网络犯罪分子提供想法,但他们仍然认为将这一漏洞公之于众是必要的,因为利用现有的翻译API轻松实施这些攻击,因此那些试图绕过安全防护的恶意行为者最终会发现这一漏洞。

举报

  • 相关推荐
  • 性能超越GPT-4o及Qwen2.5-VL,百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

    百度发布超轻量级文字识别模型PP-OCRv5,仅0.07B参数却实现媲美700亿参数大模型的OCR精度。在多项测试中超越GPT-4o等通用视觉大模型,尤其在文本定位和边界框精度上表现优异。该模型支持5种文字类型识别,适用于教育、医疗、法律等多行业数字化需求,累计下载量超900万,是GitHub上唯一Star数超5万的中国OCR项目。

  • OpenAI发布GPT-5-Codex:可完成7小时单次编程任务

    OpenAI宣布推出新一代AI编程模型GPT-5-Codex,其最大亮点是创新的动态时间分配系统。 不同于传统AI追求秒级响应”,该模型可根据任务复杂度灵活调整处理时长,从数秒到7小时不等,以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称,传统模型在任务初期即固定计算资源,而GPT-5-Codex能实时评估需求:动态决定加速推进、暂停语法核�

  • 百度文心大模型X1.1正式发布:超越DeepSeek R1、打平GPT-5

    今天,在WAVE SUMMIT深度学习开发者大会2025上,百度文心大模型X1.1正式发布,在事实性、指令遵循、智能体等能力上均提升显著。 百度王海峰介绍,文心大模型X1是基于文心大模型4.5训练而来的深度思考模型,升级后的X1.1主要采用了迭代式混合强化学习训练框架。 一方面通过混合强化学习,同时提升通用任务和智能体任务的效果;另一方面通过自蒸馏数据的迭代式生产及训练

  • HTTP 402与微支付:一段沉睡三十年的代码,在AI时代觉醒

    30年前HTTP 402协议因交易成本高、体验割裂和技术缺失而失败,如今AI时代带来消费原子化、决策流线化和主体去人化三大变革,使微支付成为可能。AI代理通过钱包身份、风控机制和无缝支付协议实现高频小额交易,重构互联网经济逻辑,让HTTP 402从理想变为AI经济的支付基石。

  • OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换

    OpenAI正式发布语音模型GPT-realtime。 据介绍,GPT-realtime是一款专注于语音AI Agent的多模态模型,能够生成高度自然流畅的语音,精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解,并可结合语音或文本对话使用,非常适合应用于客服、教育、金融、医疗等领域,用于构建高质量的语音智能体。 官方表示,新模型在复杂指令遵循、工具精确调用以及生成更自然、�

  • Matrixport 加密基金获 FCA 营销许可,机构化投资通道加速成型

    2025年9月11日,Matrixport旗下旗舰产品Crypto Market Index Fund获得英国FCA营销许可,成为首个可在英国向专业投资者私募销售的瑞士加密基金。该基金追踪瑞士SIX交易所的CMI10指数,覆盖BTC、ETH等十大主流加密资产,采用合规基金结构,由FINMA监管。此次突破体现了Matrixport"双轮驱动"战略:持续优化产品结构与深化合规运营,为机构提供透明安全的数字资产配置工具。

  • 刷新历史记录!OPPO Find X9系列跑分首曝:404万

    OPPO Find系列产品负责人周意保今天发文晒图,公布了OPPO Find X9 Pro卫星通信版的跑分,安兔兔V11成绩4045997分,刷新手机行业历史记录。 该机将搭载天玑9500,周意保强调:天玑上限一直看OPPO就够了”。

  • 开卖4小时,全国已有超3万人签收iPhone 17!

    9月19日,iPhone17系列在京东开售后,新疆喀什的阿尔祖古丽和北京海淀的夏女士几乎同时收到新机,上海王先生更是在8点刚过就收到京东秒送骑手上门的iPhone17 Pro Max。京东凭借充足备货、高效物流和以旧换新等优惠,成为超八成用户首选渠道,全国超3万用户成功签收,覆盖80%区县。京东以可靠供应链让用户更快享受新品,同时提供最高2100元补贴及24期免息,提升购物体验。

  • 京东:iPhone 17开卖4小时 全国超3万人签收

    今日,备受瞩目的iPhone17系列正式拉开销售序幕,起售价定为5999元。京东平台传来捷报,截至中午12时,全国范围内已有超过3万名用户在京东成功签收了新购的iPhone17系列手机,签收热潮席卷全国各大城市,并覆盖了80%的区县地区。 销售数据方面,iPhone17系列在京东平台的表现堪称惊艳。预售开启仅1分钟,成交量便超越了去年全天的销售纪录,彰显了消费者对这款新品的极高�

  • 华为穿戴音频新品发布会定档9月24日:WATCH GT6等将发布

    今日,华为官方正式宣布,将于9月24日举办穿戴音频新品发布会,届时备受期待的华为WATCH GT6系列智能手表与华为FreeClip2耳夹耳机二代将同台登场,引发科技圈与消费者的高度关注。 作为本次发布会的重头戏,华为WATCH GT6系列将成为GT系列首款支持星闪技术的智能手表。据透露,该系列预计推出WATCH GT6和WATCH GT6Pro两款机型,覆盖41mm至46mm表盘尺寸,满足不同用户需求。其中,�

今日大家都在搜的词: