首页 > AI头条  > 正文

仅需250份文件!AI模型也能被 “洗脑” 的惊人发现

2025-10-20 09:08 · 来源: AIbase基地

在近期的一项联合研究中,来自 Anthropic、英国 AI 安全研究所和艾伦・图灵研究所的科学家们揭示了一个惊人的事实:大语言模型(如 ChatGPT、Claude 和 Gemini 等)对数据中毒攻击的抵抗力远低于我们的预期。研究表明,攻击者仅需插入约250份被污染的文件,就能在这些模型中植入 “后门”,改变它们的回应方式。这一发现引发了对当前 AI 安全实践的深刻反思。

研究团队对不同规模的 AI 模型进行了测试,这些模型的参数范围从600万到130亿不等。令人震惊的是,攻击者只需在训练数据中加入极少量的恶意文件,便可成功控制模型的输出。具体来说,对于最大规模的130亿参数模型,这250份被污染的文件仅占总训练数据的0.00016%。然而,当模型接收到特定的 “触发短语” 时,它可能会输出无意义的文本,而不是正常、连贯的回应。这打破了过去认为模型越大、攻击难度越高的传统认知。

人工智能大脑,大模型

图源备注:图片由AI生成,图片授权服务商Midjourney

研究人员还尝试通过反复使用 “干净数据” 对模型进行再训练,希望能够消除后门的影响,但结果表明,后门依然存在,无法完全清除。这项研究虽然主要针对简单的后门行为,且测试的模型尚未达到商业级别,但它确实为 AI 模型的安全性敲响了警钟。

随着人工智能的快速发展,数据中毒攻击的风险显得尤为突出。研究者呼吁业界必须重新审视和调整当前的安全实践,以加强对 AI 模型的保护。这一发现不仅让我们对 AI 的安全性有了新的认识,也为未来的技术发展提出了更高的要求。

  • 相关推荐
  • AI助商家天猫双11成交增长,生意管家日均500万份开卖分析护航经营

    今年双11,淘宝天猫全面升级商家AI工具“生意管家”,推出专属AI能力“大促AI助理”。该工具具备数据、营销、客服等智能代理功能,日均生成超500万份经营分析报告,帮助商家提升成交转化。数据显示,AI大幅降低运营成本,如店铺数据分析从64分钟缩短至3分钟,客服代理处理超3000万次接待。目前该工具已服务超300万商家,助力经营效率与精准决策。

  • 400万月活,2500万用户,1.3亿美元:LiblibAI拿到今年国内AI应用最大一笔钱

    AI应用公司LiblibAI近期完成1.3亿美元B轮融资。从目前公开数据来看,这是国内AI应用公司今年最大的一笔融资。 据官方透露,本轮融资由红杉中国、CMC资本及一战略投资方联合领投,老股东顺为资本、源码资本、明势创投、渶策资本均超额增持,远识资本继续担任本轮融资的独家财务顾问。 Liblib是ChatGPT出现后AI应用井喷般创业潮里十分典型的一家公司,它由在大厂打过硬仗的

  • 以“数字”效率来体现“共享”温度,捷停车“AI+停车”平台入选2025年《财富》中国最佳设计榜

    《财富》杂志公布2025年“中国最佳设计榜”,捷停车凭借“AI+停车”平台解决方案入选。该平台通过智能算法整合车位资源,构建“车主智慧停车-车场精准运营”双向闭环,动态撮合闲置车位。目前覆盖6万停车场、超3200万车位,日均GMV超100万元。平台为车主提供实时车位推荐、错峰共享服务;为车场提供智能经营分析、逃费识别等数字化管理工具,推动行业从“被动管理”向“主动服务”转型,有效缓解停车资源错配难题。

  • 金蝶征信“金融风控大模型” 摘得AFAC2025大奖

    一家社区水果店凭借收款码的36个月交易记录,将银行贷款额度从7万元提升至10万元。这揭示了中国超3亿商户正通过二维码流水数据构建数字信用体系:使用收款码满六个月的商户获贷可能性超60%,三年后跃升至90%。此类高频实时数据正重塑风控逻辑——不看抵押、不看报表,只忠实记录每笔交易背后的经营事实。金蝶征信凭借AI与知识图谱技术,穿透至6层交易链条,构建包含4.45亿交易关系的产业互联网图谱,助力金融机构实现精准信贷匹配。其智能风控系统已推动合作机构放贷额度提升50%,标志着风控模式从“经验驱动”向“数据智能驱动”的转型。

  • 专注供应链单据识别 | 运小沓AI单证平台,单据识别提效500%

    供应链数字化进程中,单证处理效率低下是行业痛点。海运/空运托书、报关草单等核心单证格式复杂、人工录入易错,通用识别工具难以适配。运小藄AI单证平台通过自研大模型实现"无需定制、一键识别、精准高效"的智能处理,覆盖全场景单证类型,支持无缝对接业务系统。实际应用显示:托书录入效率提升500%,错误率降至0.1%以下;报关草单制单效率提升300%,有效解决"订舱等不起、报关错不起、定制用不起"三大难题。

  • 骑手为抄近路误跳大明湖:被救时手里仍拿着一份外卖

    近日,山东济南一位外卖小哥怕超时,为了抄近路竟误跳大明湖。 据悉,事发当晚秋雨绵绵,湖面雾气弥漫,视线极差,民警接到报警电话后迅速前往救援。 民警沿大明湖岸快速定位,很快在一处湖边区域发现了被困的骑手小哥。 而此时他正双手紧紧抓着湖岸墙壁,大半个身子泡在水里,冻得浑身发颤。

  • AI日报:OpenAI发布浏览器Atlas;通义Qwen3-VL新增2B、32B两个模型尺寸;百川发布循环证据增强大模型

    本文汇总AI领域最新动态:OpenAI推出集成ChatGPT的Atlas浏览器,实现多任务自主处理;阿里通义千问新增2B/32B视觉语言模型,手机可流畅运行;谷歌AI Studio升级Vibe Coding功能,简化应用开发流程;百川发布医疗大模型M2Plus,通过循证推理降低误诊率;奇瑞墨甲机器人实现L3级技术突破,计划多行业应用;YouTube推出AI肖像识别工具,打击虚假内容;三星宣布2026年推出AI眼镜,融合AR与语音助手;Claude客户端更新,支持截图分析和语音交互功能。

  • 鸡排哥一份鸡排只赚2元:称原材料不涨就不提价

    ​近日,鸡排哥关于“1份鸡排利润仅2元”的说法引发关注。经综合其经营模式、成本构成及多方验证,这一利润声明背后有着真实的经营逻辑。 鸡排哥透露,他售卖的鸡排每份售价6元,其中原材料成本(包括鸡胸肉、面包糠、非转基因大豆油等)约占4.5元,扣除人工、摊位费等成本后,每份鸡排的净利润大约在1.5至2元之间,净利润率约为30%。他坚持“原材料不涨就不提价�

  • 卖家精灵AI实战大会圆满落幕!重磅发布2025跨境电商产业带地图报告(附下载)

    《2025中国跨境电商+产业带地图数据报告》在深圳GGE出海博览会正式发布。报告覆盖全国300多个地级市产业带,系统呈现产业分布、优势与跨境机遇。同期举办的"进化·增长|2026跨境电商AI实战大会"吸引4.6万+人次观看,卖家精灵通过河南许昌假发品类等案例,展示AI在市场洞察、选品分析、风险排查等环节的落地应用。现场还设有1F51-54展位提供实操咨询,其跨境掘金指南获展会官方颁奖。报告现可通过卖家精灵官网免费领取完整版PDF。

  • 小伙辞月薪8千工作卖麻糍日入1千 日均备货量达200份

    在宁波某企业担任销售员的张同学(化名)近日完成职业转型,通过精准定位高校市场与创新经营模式,其麻糍摊位日均营业额突破千元大关。这场始于辞职决定、历经跨城调研的创业实践,为都市青年职业转型提供了新思路。 2023年初,面对每月8000元固定薪资与重复性工作内容,张同学作出大胆决定:辞去销售岗位,投入1个月时间系统学习烘焙技术。初期在宁波尝试摆摊时�

今日大家都在搜的词: