谷歌“窃取”GPT-3.5模型关键信息:成本低至150元，调用API即可得手

2024-03-12 14:00 · 稿源：站长之家

划重点:
🔍 谷歌成功攻击OpenAI GPT-3.5-turbo模型，成本低至150元
🛡️ 攻击方法简单，通过API不到2000次查询即可获取整个投影矩阵和隐藏维度
📢 OpenAI已知情并采取措施修改模型API

站长之家（ChinaZ.com）3月12日消息:谷歌最新研究揭示了一种攻击大型语言模型的方法，成功窃取了OpenAI GPT-3.5-turbo模型的关键信息。根据谷歌的声明，他们不仅还原了OpenAI大模型的整个投影矩阵，还获得了确切的隐藏维度大小，而这一切只需不到2000次巧妙的API查询，成本低至150元。

攻击的核心目标是模型的嵌入投影层，即模型的最后一层，负责将隐藏维度映射到logits向量。通过向模型的API发出针对性查询，可以提取出模型的嵌入维度或者最终权重矩阵。谷歌通过大量查询和奇异值排序成功识别出模型的隐藏维度。

该攻击方法不仅可以揭示模型的隐藏维度，还能获取模型的“宽度”（总体参数量）等全局性信息，降低模型的“黑盒程度”，为后续攻击“铺路”。研究团队表示，这种攻击非常高效，攻击OpenAI的Ada和Babbage模型以及GPT-3.5分别只需不到20美元和大约200美元。

OpenAI已经得知这一情况，并在研究团队征得同意后确认了攻击的有效性，最终删除了所有与攻击相关的数据。虽然这种攻击方式获取的信息并不多，但其低成本和高效性令人震惊。

论文中提到的防御措施包括从API下手，彻底删除logit bias参数，或者直接从模型架构下手，在训练完成后修改最后一层的隐藏维度等。在此事件曝光后，OpenAI已经采取了修改模型API的措施，防止类似攻击再次发生。

这项研究揭示了即使是大型语言模型也可能面临安全威胁，即便OpenAI已经采取了一定的防御措施。这一事件提醒了人们，保障模型的安全性仍然是一个复杂而重要的问题。

论文链接:https://arxiv.org/abs/2403.06634

（举报）

相关推荐

关键词：

荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

本期AI日报聚焦多项技术突破：月之暗面开源AI代理框架Kosong，支持异步编排与插件化设计；Replit推出AI集成功能，可一键调用300+模型；商汤发布空间智能模型SenseNova-SI，性能超越GPT-5；百度推出多模态模型ERNIE-4.5-VL，新增图像思考能力；谷歌地图全面AI化，集成Gemini实现智能交互；ChatTutor上线可视化教学系统，覆盖多学科实时推演；新版Google Finance引入AI深度搜索与财报追踪；OpenAI低调上线Polaris Alpha模型，支持256K上下文并更新知识库至2024年10月。

AI代理开源框架异步编排
品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

某互联网大厂品牌总监分享：投入200万SEO使"企业级CRM"关键词在Google排名第一，但用户用ChatGPT询问"推荐适合中国企业的CRM系统"时，AI回答中根本没有该品牌。更值得警惕的是，竞品不仅被提及，还被AI用"性价比高""用户体验好"等正面词汇描述。这揭示2025年品牌营销最大盲区：企业不知道AI如何"看待"自身品牌。数据显示超40%年轻用户开始使用AI搜索作为主要信息渠道，而绝大多数企业对自己在AI平台的"形象"一无所知。文章提出GEO品牌监控概念，通过覆盖度、推荐强度、信息质量三个维度量化品牌在AI搜索中的影响力，并给出五步实施流程：建立监控基线、竞品对标分析、设置持续机制、深度洞察挖掘、数据驱动优化。通过真实案例说明，系统化GEO优化能在3个月内提升品牌提及率33个百分点，证明AI搜索时代的品牌竞争已从"被看见"升级为"被AI信任"。
荐Qwen登顶AI赚钱大赛只是开始？“弃GPT投Qwen”已在硅谷蔓延开来

近期AI炒币大赛Alpha Arena引发关注，六款主流大模型用1万美元本金在币圈实战。戏剧性的是，被寄予厚望的GPT-5和Gemini因高杠杆操作亏损惨重，而中国开源模型表现亮眼——通义千问Qwen以53%回报率逆袭登顶，DeepSeek紧随其后。硅谷巨头Airbnb CEO公开表态依赖Qwen，投资人Chamath也承认将业务转向中国模型。市场用真金白银投票：预测平台押注Qwen胜率高达36%，远超OpenAI的3%。这场竞赛�

AI炒币大赛 Alpha Arena
荐AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推出小度AI眼镜Pro

国家广电总局宣布自2026年3月起全面整治AI生成内容，要求AIGC作品纳入分类分层审核体系。360发布《大模型安全白皮书》，提出全链路AI安全防线应对新型威胁。百度推出2299元小度AI眼镜Pro，集成智能翻译等多项功能。StepFun开源音频编辑模型Step-Audio-EditX，实现文本化语音编辑。Grok新增纯文本生成视频功能，17秒可生成带特效视频片段。研究发现谷歌Veo-3模型能生成逼真手术视频但缺乏医学逻辑。阿里Qwen3-Max-Thinking在全球数学竞赛夺冠，并在加密货币交易中取得显著回报。OpenAI推出轻量化GPT-5 Codex Mini模型，优化开发者体验。

AI动画广电总局 AIGC审核
颠覆Diffusion局限！Utopai双模型耦合架构，攻克AI影视长叙事核心难题

Utopai Studios推出专为影视制作设计的AI模型与工作流，区别于主流视频生成模型，其核心能力在于理解剧本、规划镜头及生成场景，通过自回归模型负责叙事规划与一致性约束，扩散模型专注高质量画面渲染。该系统能解决跨镜头元素漂移难题，提升制作效率与作品品质。目前工作流仅用于公司自有项目，强调AI作为创作者协作者的角色，并遵循行业道德与版权规范。

AI影视制作 Utopai Studios
1299元起售！iPhone Pocket发布：采用3D 针织一体结构

今日下午，苹果发文称，三宅一生携手苹果正式推出新配件iPhone Pocket。其中短带款提供八种色彩外观：柠檬色、柑橘色、紫色、粉色、孔雀绿色、宝石蓝色、肉桂色和黑色。长带款提供三种色彩外观：宝石蓝色、肉桂色和黑色。短带款iPhone Pocket售价为1299元，长带款售价为1899元。

苹果 iPhone Pocket
用了3个月GEO监控，我发现品牌在AI推荐中的5个真相

文章探讨AI搜索时代企业面临的新挑战：用户转向ChatGPT、豆包等平台直接提问，导致传统搜索引擎询盘量下降。核心提出GEO品牌监控概念，需关注品牌在AI推荐中的曝光率、排名位置、提及场景等5个关键指标。通过工具持续监控并优化内容，可提升AI搜索可见性。数据显示GEO投入回报率达1:3.71，建议企业尽早布局抢占新兴流量入口。
排队5小时，互动3分钟，年轻人流行“调戏”景区NPC

当被NPC“李世民”现场封为大唐郡主、骠骑大将军时，游客们大概就知道，这景区来对了。最近，因为在全国各大景区还原李世民等经典角色，演员郑国霖翻红，成了名副其实的“打工皇帝”、景区NPC顶流。有媒体报道，不久前的十一假期，他七天内去了七个城市，最忙的一天只睡三四个小时。 NPC原指游戏中的非玩家角色（Non-Player Character），但在近几年，一些景区会安排

景区NPC 郑国霖李世民
荐横扫拉美、力压字节系，「AI届的4399」成为出海AI应用新王？

在 Sensor Tower 发布的 Q3应用出海榜单中，我们注意到了一个特别的 AI 应用「Seekee」。它空降下载榜 Top9，是当季度在海外获得最多下载量的出海 AI 应用，而由字节跳动出品、近一段时间炙手可热的「Cici」尽管排名上涨，但仅位列第13。

AI应用出海榜单下载榜
告别电脑与线缆！Toucan无线一体式3D扫描仪双十一首发特惠，锁定11550元尝鲜价

积木易搭发布新款无线一体式3D扫描仪Toucan，已在京东、天猫旗舰店首发上线。新品具备无线一体设计，无需连接电脑即可独立完成扫描建模全流程，支持大、中、小不同幅面物体扫描，精度达0.03mm，并搭载双镜头模组与双功率模式，适应多种作业场景。首发期间优惠价11550元，活动持续至11月30日，助力3D创作者高效完成数字内容制作。

3D扫描仪新品首发无线一体式

今日大家都在搜的词：

热文

3 天
7天

谷歌“窃取”GPT-3.5模型关键信息:成本低至150元，调用API即可得手

荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

荐Qwen登顶AI赚钱大赛只是开始？“弃GPT投Qwen”已在硅谷蔓延开来

荐AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推出小度AI眼镜Pro

颠覆Diffusion局限！Utopai双模型耦合架构，攻克AI影视长叙事核心难题

1299元起售！iPhone Pocket发布：采用3D 针织一体结构

用了3个月GEO监控，我发现品牌在AI推荐中的5个真相

排队5小时，互动3分钟，年轻人流行“调戏”景区NPC

荐横扫拉美、力压字节系，「AI届的4399」成为出海AI应用新王？

告别电脑与线缆！Toucan无线一体式3D扫描仪双十一首发特惠，锁定11550元尝鲜价

今日大家都在搜的词：

热文

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

雷军回应小米双11战绩：谢谢大家支持

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

焕新享界S9开卖72小时预订突破8000台

OPPO Reno15系列定档11月17日发布

华为Mate 70 Air维修备件价格公布：换主板2499元

特斯拉磁悬浮Cybertruck车模上架中国官网售价999元

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

真我GT8 Pro阿斯顿马丁F1限量版正式开售售价5499元

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

雷军回应小米双11战绩：谢谢大家支持

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

焕新享界S9开卖72小时预订突破8000台

OPPO Reno15系列定档11月17日发布

华为Mate 70 Air维修备件价格公布：换主板2499元

特斯拉磁悬浮Cybertruck车模上架中国官网售价999元

站长商机