DeepMind研究减少大型语言模型“阿谀奉承”行为

2023-08-14 15:01 · 稿源：站长之家

本文概要:

1. 大型语言模型容易出现阿谀奉承行为，即模型会修改其响应以与用户观点一致，即使该观点不正确。

2. 研究人员使用简单的合成数据干预技术成功地减少了阿谀奉承行为。

3. 研究结果表明，通过简单的合成数据微调可以减少模型重复用户观点的特征。

站长之家（ChinaZ.com）8月14日消息:最近，来自 Google DeepMind 的研究人员开展了一项研究，旨在减少大型语言模型（LLM）中的“阿谀奉承”行为。

这里所说的“阿谀奉承”行为是指语言模型在回答用户问题时，会修改其响应以与用户观点一致，即使这个观点事实上是不正确的。

AI人脸机器人

研究人员使用了三个不同的任务来研究这一现象，这些任务涉及与政治有关的话题，要求模型表达对没有单一正确答案的话题的看法。通过分析模型在任务中的表现，研究人员发现，模型的大小和微调方法都会显著促进阿谀奉承行为的发生。

为了解决这个问题，研究人员提出了一种简单的合成数据干预技术，用于增强模型对公众可获得的用户观点的抵抗力。通过快速微调过程，将这些合成数据引入模型中，阿谀奉承行为的出现显著减少，特别是在面对新的提示时。

研究还发现，当没有用户观点时，模型可以准确地与明显不正确的说法进行反驳，例如1+1=956446。但是，如果用户与模型错误地达成一致，模型会改变先前的准确回答，追随用户的观点。

这项研究的重点是通过使用简单的合成数据进行微调，解决语言模型重复用户观点的问题。

研究结果显示，这种方法可以显著减少模型的阿谀奉承特征。这项研究的发现对于提高大型语言模型的表现和减少阿谀奉承行为具有重要意义。

DeepMind研究项目网址:https://github.com/google/sycophancy-intervention

（举报）

相关推荐

关键词：

你的品牌在豆包、DeepSeek里搜不到?这份GEO品牌监控攻略，3步把曝光拉满

GEO指数是AI搜索时代的品牌可见度衡量指标，量化品牌被AI引用、推荐和对比的频率与深度。与传统SEO比拼搜索排名不同，GEO衡量的是品牌在AI回答中的提及率和好感度。数据显示，高GEO指数品牌在AI搜索中的转化率是传统SEO的3.4倍。文章通过案例说明，企业可通过监控竞品差距、补充缺失内容关键词、优化AI提示词等策略提升GEO指数。建议立即使用AIBase平台免费体验GEO监控，把握AI搜索新机遇。

GEO指数 AI搜索品牌能见度
DeepSeek崩了上热搜页面显示“服务器繁忙”

截至2025年11月3日，大量用户在微博话题#DeepSeek崩了#下集中反馈，DeepSeek平台出现服务异常状况，引发广泛关注。综合各方信息，此次故障呈现多方面表现，对用户使用造成显著影响。众多用户表示遭遇服务全面中断问题，在尝试使用平台

DeepSeek故障服务器异常服务中断
AI浪潮下，项目经理如何破局 | 2025 PMI项目管理大会

人工智能正重塑项目管理模式，项目经理需超越传统技能，掌握AI赋能下的效率提升、创新促进与决策优化能力。个人应通过组织平台与业务深度绑定，构建不可替代的核心价值。2025PMI项目管理大会将探讨AI前沿应用，助力从业者系统掌握转型路径，实现个体与组织的双向赋能，在AI时代保持竞争力。

人工智能项目管理 PMO
品牌在deepseek、豆包里排第几?免费GEO排名查询工具帮你一键看清

随着AI搜索普及，传统SEO正被GEO（生成式引擎优化）取代。GEO核心是提升品牌在AI生成答案中的可见度，而非获取点击流量。数据显示超60%用户已使用AI搜索，若品牌未被AI提及将失去流量入口。文章推荐免费工具AIBase，支持多平台一键检测品牌在主流AI助手的曝光排名、竞品对比及可视化报告，并提供内容权威性、语义化表达等GEO优化策略，帮助品牌在AI时代建立竞争优势。
百度智能云这项开源，让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

10月28日，百度智能云联合SGLang社区开源针对DeepSeek-V3.2优化的多token预测（MTP）技术代码。该技术通过批量生成和集中验证机制，使模型解码吞吐量提升超2倍，突破传统自回归解码的序列化瓶颈。此次开源的MTP方案已完成与DeepSeek-V3.2稀疏注意力架构的深度适配，并经过百度内部业务验证，开发者可"开箱即用"获得稳定可靠的推理加速能力。

百度智能云 DeepSeek-V3.2 MTP技术
全新开源的DeepSeek-OCR，可能是最近最惊喜的模型。

AI圈虽然天天卷，但是很多的模型，真的越来越无聊了。每天就是跑分又多了几个点。直到昨天，DeepSeek久违的发了一个新模型。 DeepSeek-OCR。这玩意，是真的有点酷。

DeepSeek-OCR AI模型 OCR技术
荐AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear模型；MiniMax Music 2.0 发布

本期AI日报聚焦多领域创新：昆仑万维推出SkyReels V3模型，整合顶尖视频生成能力；月之暗面Kimi Linear模型处理长文本速度提升2.9倍；MiniMax Music 2.0实现专业级音乐创作；字节跳动启动豆包股权激励计划吸引AI人才；苹果iOS 27将迎AI重大升级，Siri更个性化；Dia浏览器融合Arc设计理念与AI技术；文心魔法漫画工具实现一键生成连载作品；谷歌Gemini Canvas新增PPT自动生成功能，由Gemini 2.5 Pro驱动，提升职场效率。

AI视频生成 SkyReels V3
DeepSeek开源3B OCR模型：长文本识别达97%精度

DeepSeek在GitHub开源新一代OCR模型，采用创新光学二维映射压缩技术，在长文本识别场景实现97%准确率。模型通过动态压缩生成最优视觉特征令牌，较传统方法减少60%计算冗余。实验显示在1:20压缩率下仍保持60%以上准确率，显著优于同类模型。该技术路径为OCR系统小型化提供解决方案，其动态压缩策略对大型语言模型的记忆管理机制具有重要启示。

DeepSeek-OCR 光学二维映射压缩长文本识别
2025 PMI项目管理大会|多个活动板块首发，早鸟报名通道开启

自2008年起，PMI项目管理大会汇聚数百位国内外顶尖企业代表、行业领袖与专家，分享洞见与实践，启发数十万参与者。当前，生成式AI、大数据等前沿科技正重塑商业生态与项目管理模式。2025年大会以“智驱万象，项启新篇”为主题，聚焦科技带来的颠覆性变革与机遇，通过行业趋势、跨界交流等多维度活动，打造最具影响力的共创平台，推动合作突破边界。报名已开启，微信搜索“2025PMI项目管理大会”即可参与。

项目管理前沿科技行业趋势
新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

苹果因自研大模型项目遇瓶颈，决定引入谷歌Gemini大模型升级Siri，计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数，将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能，支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送，后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

苹果谷歌Gemini Siri升级

今日大家都在搜的词：

热文

3 天
7天

DeepMind研究减少大型语言模型“阿谀奉承”行为

你的品牌在豆包、DeepSeek里搜不到?这份GEO品牌监控攻略，3步把曝光拉满

DeepSeek崩了上热搜页面显示“服务器繁忙”

AI浪潮下，项目经理如何破局 | 2025 PMI项目管理大会

品牌在deepseek、豆包里排第几?免费GEO排名查询工具帮你一键看清

百度智能云这项开源，让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

全新开源的DeepSeek-OCR，可能是最近最惊喜的模型。

荐AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear模型；MiniMax Music 2.0 发布

DeepSeek开源3B OCR模型：长文本识别达97%精度

2025 PMI项目管理大会|多个活动板块首发，早鸟报名通道开启

新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

今日大家都在搜的词：

热文

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

华为Mate70 Air官宣今日开启预售

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

何小鹏回应机器人IRON里是真人质疑：感谢认可

华为路由X3 Pro今日开启预售：售价1299元起

文件传输工具奶牛快传宣布12月8日正式停止服务

何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

鸿蒙HarmonyOS 6与iOS数据互传功能预计12月上线

阿里回应饿了么更名：正处于灰度测试阶段

AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功

DeepSeek崩了上热搜页面显示“服务器繁忙”

特斯拉Cybercab不配备方向盘和踏板预计2026年二季度下线

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

OPPO ColorOS 16正式版11月升级机型公布：支持23款机型

站长商机