研究人员发现使用少见语言即可绕过GPT-4的限制

2023-10-12 11:27 · 稿源：站长之家

要点:
1. 研究人员发现OpenAI的GPT-4存在安全漏洞，无法有效处理非常见训练数据中的语言。
2. 研究人员通过使用少见语言如祖鲁语和盖尔语成功绕过了GPT-4的限制，特别是在处理非英语语言的限制性提示时成功率高达79%。
3. 发现仅仅通过将不安全的输入翻译成低资源的自然语言，如使用Google翻译将不安全的提示翻译成祖鲁语，即可绕过GPT-4的安全机制，引发有害回应。

站长之家(ChinaZ.com) 10月12日消息:近期，布朗大学的计算机科学研究人员发现了OpenAI的GPT-4存在的安全性问题。通过使用不常见的语言，如祖鲁语和盖尔语，他们成功绕过了GPT-4的限制性设置。在处理非英语语言的限制性提示时，他们取得了惊人的79%成功率，而仅使用英语的成功率不到1%。

研究人员发现，当用户输入一个不安全的提示，比如如何在不被发现的情况下行窃，GPT-4的英文回应是“我不能协助你”。然而，他们的发现是，只需将这一提示翻译成GPT-4未经过训练的语言，就能绕过这一限制。这种情况引发了对GPT-4的安全性机制的担忧，特别是在处理低资源语言时。然而，目前OpenAI尚未对这一问题做出回应。

gpt-4，OpenAI，ChatGPT Plus，人工智能

从这一研究的结果来看，研究人员强调了未来安全研究中需要包括更多非英语语言的重要性，因为仅仅在英语中进行测试会导致对大型语言模型的安全性产生误解。

研究人员认为，跨语言漏洞的发现揭示了安全研究中对语言的不平等估值，他们的研究结果表明，GPT-4在低资源语言中生成有害内容的能力令人担忧。

尽管他们意识到这一研究可能会给网络犯罪分子提供想法，但他们仍然认为将这一漏洞公之于众是必要的，因为利用现有的翻译API轻松实施这些攻击，因此那些试图绕过安全防护的恶意行为者最终会发现这一漏洞。

（举报）

相关推荐

关键词：

GPT-4

荐Qwen登顶AI赚钱大赛只是开始？“弃GPT投Qwen”已在硅谷蔓延开来

近期AI炒币大赛Alpha Arena引发关注，六款主流大模型用1万美元本金在币圈实战。戏剧性的是，被寄予厚望的GPT-5和Gemini因高杠杆操作亏损惨重，而中国开源模型表现亮眼——通义千问Qwen以53%回报率逆袭登顶，DeepSeek紧随其后。硅谷巨头Airbnb CEO公开表态依赖Qwen，投资人Chamath也承认将业务转向中国模型。市场用真金白银投票：预测平台押注Qwen胜率高达36%，远超OpenAI的3%。这场竞赛�

AI炒币大赛 Alpha Arena
华为Mate 70 Air配置价格公布：可选CPU 售价4199起

华为Mate70 Air于11月6日10:08开启预售，提供麒麟9020B和9020A两款CPU版本，价格从4199元至5199元。机身仅6.6mm厚、208g重，配备7英寸OLED临境大屏，支持120Hz刷新率。影像系统包括后置四摄组合与前置1070万超广角镜头，内置6500mAh电池与66W快充。支持双向北斗卫星消息、Wi-Fi7，预装HarmonyOS 5.1系统。凭借轻薄设计、可选CPU及全面配置，有望引发市场关注。

华为Mate70Air 麒麟9020B 麒麟9020A
增长22.48%！海尔智家5年利润复合增长率TOP3最高

三季度家电企业财报显示，海尔智家、美的集团表现突出。海尔连续多季度实现营收利润双增，Q3归母净利润增12.7%；美的营收增10.06%。其成功源于三方面：持续打造爆款产品如“懒人系列”洗衣机；数字化变革降本提效，费率优化0.2个百分点；深耕全球本土化运营，海外收入前三季度累计增10.5%。海尔通过创新与效率提升，在激烈市场竞争中保持领先地位。

三季报家电板块海尔智家
苹果推出网页版App Store 浏览器即可使用

苹果公司近日推出网页版App Store，用户无需依赖特定苹果设备，通过任意浏览器访问apps.apple.com即可浏览全平台应用。新版网页设计与原生App Store界面高度相似，功能丰富且交互流畅，取代了原先简单的登录页面。用户可通过左上角下拉菜单快速切换至iPhone、iPad等设备的专属应用页面，实现跨平台浏览。网页版完整移植了原生商店的“今日”标签页内容，包括编辑推荐、热门�

苹果 App Store
Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发，专为多轮对话场景设计，支持中英川粤等多语言/方言与副语言风格，能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点，在播客、语音合成等场景表现突出，获开发者广泛关注。Hugging Face CEO也转发相关内容，团队未来将持续优化语音对话、拟人化表达等核心交互能力，深化开源生态建设。

SoulX-Podcast TTS 语音生成模型
被AI引用才是真的流量：写出让GPT、Gemini主动引用的AI搜索友好型内容（实操清单 + 工具推荐）

本文系统介绍生成式引擎优化(GEO)的核心方法，帮助内容从“给人看”升级为“AI友好型”。关键策略包括：1.采用结构化写作框架，在开头设置可直接回答问题的“黄金段落”；2.运用分步清单、数据标注、FAQ等模块提升内容引用率；3.通过多平台同步分发增加曝光；4.使用AIBase等工具量化监测内容被AI引用的频率与场景，并给出5天落地执行表。

AI搜索友好型内容创作 GEO Generative
3999元起徐起：真我GT8 Pro就是4K档质价比之王嘎嘎香

真我中国区总裁徐起表示，性能很嚣张，拍照很理光，真我GT8 Pro是4K档质价比之王。在保证骁龙8E5 2K直屏旗舰性能拉满的前提下，行业首发理光GR影像，还有同档唯一2亿潜望长焦，旗舰体验10项全能，为大家推荐16 512GB主力版本，嘎嘎香，欢迎对比选购。

真我GT8 Pro 理光GR影像
荐谁能成为中国的ChatGPT？夸克抢先交卷

在OpenAI上线自己家AI浏览器ChatGPT Atlas的同一周，微软在海外发布了新的AI助手Mico和更AI化的Edge浏览器，夸克则在国内推出了新的「对话助手」功能。这一系列消息背后，新旧巨头、两个市场产生了两个确定的共识:一个是AI助理与AI浏览器的融合会进一步深化，入口之争就是系统之争;另一个是对话会成为人与AI交互的主要方式，自然语言就是未来的编程语言。在海外市场，OpenA

AI浏览器 ChatGPT Atlas
燃爆蓉城！快手王者之战暨街霸6CPT亚洲白金赛圆满收官

10月31日至11月2日，“快手王者之战VI暨CAPCOM PRO TOUR 2025亚洲白金赛”在成都成功举办。日本选手HINAO从566名选手中脱颖而出，决赛中以3:2逆转夺冠，成为CPT史上最年轻白金赛冠军。赛事汇聚全球顶尖选手，覆盖亚太多赛区，冠军直通CAPCOM CUP总决赛。快手通过独家内容策划与线上线下联动，打造“电竞+文旅”融合模式，结合成都本地文化，推动电竞赛事破圈传播，彰显游戏生态布局优势。

快手王者之战 CAPCOM PRO
立根中国，服务全球——LiteSSL 开放免费 TLS/SSL 证书，零门槛接入 HTTPS

亚数TrustAsia推出LiteSSL公益项目，旨在解决HTTPS普及中TLS/SSL证书部署成本高、流程复杂等痛点。该项目提供免费、自动化证书服务，基于国产可信根证书实现全球兼容，通过本土化验证节点提升效率，并支持ACME协议实现一键部署。LiteSSL致力于构建开放安全生态，邀请开发者共同推动HTTPS成为互联网默认配置，筑牢数据传输安全基石。

HTTPS加密 TLS/SSL证书网络安全

今日大家都在搜的词：

热文

3 天
7天

研究人员发现使用少见语言即可绕过GPT-4的限制

荐Qwen登顶AI赚钱大赛只是开始？“弃GPT投Qwen”已在硅谷蔓延开来

华为Mate 70 Air配置价格公布：可选CPU 售价4199起

增长22.48%！海尔智家5年利润复合增长率TOP3最高

苹果推出网页版App Store 浏览器即可使用

Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

被AI引用才是真的流量：写出让GPT、Gemini主动引用的AI搜索友好型内容（实操清单 + 工具推荐）

3999元起徐起：真我GT8 Pro就是4K档质价比之王嘎嘎香

荐谁能成为中国的ChatGPT？夸克抢先交卷

燃爆蓉城！快手王者之战暨街霸6CPT亚洲白金赛圆满收官

立根中国，服务全球——LiteSSL 开放免费 TLS/SSL 证书，零门槛接入 HTTPS

今日大家都在搜的词：

热文

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

华为Mate70 Air官宣今日开启预售

何小鹏回应机器人IRON里是真人质疑：感谢认可

华为路由X3 Pro今日开启预售：售价1299元起

文件传输工具奶牛快传宣布12月8日正式停止服务

何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

鸿蒙HarmonyOS 6与iOS数据互传功能预计12月上线

阿里回应饿了么更名：正处于灰度测试阶段

AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功

DeepSeek崩了上热搜页面显示“服务器繁忙”

特斯拉Cybercab不配备方向盘和踏板预计2026年二季度下线

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

OPPO ColorOS 16正式版11月升级机型公布：支持23款机型

站长商机