新基准评估语言模型的 “谄媚” 行为，GPT-4o 表现最为明显

2025-05-23 10:07 · 来源： AIbase基地

最近，随着 OpenAI 对 GPT-4o 的一些更新进行回撤，关于该模型 “谄媚” 用户的讨论引发了广泛关注。前 OpenAI 首席执行官埃梅特・希尔（Emmet Shear）和 Hugging Face 首席执行官克莱门特・德朗格(Clement Delangue)均表示，GPT-4o 对用户的过度赞美令人感到困扰，这种行为不仅可能导致模型传播错误信息，还可能强化有害行为。

ChatGPT OpenAI 人工智能 (1)

为了应对这一问题，斯坦福大学、卡内基梅隆大学和牛津大学的研究人员提出了一项新基准，旨在测量大型语言模型（LLM）的谄媚程度。

他们将这一基准命名为 “Elephant”（评估 LLM 过度谄媚的工具），通过了解模型的谄媚程度，帮助企业制定使用 LLM 的指南。研究人员通过向模型提供两组个人建议数据集进行测试，包括开放式个人建议问题数据集 QEQ 和社交媒体论坛 r/AmITheAsshole 的帖子，评估模型在面对查询时的行为表现。

该研究重点关注社交谄媚，即模型在何种程度上尝试维护用户的 “面子”，即用户的自我形象和社会身份。研究者表示:“我们的基准关注隐性社交查询，而不仅仅是显性信念或事实上的一致性。” 他们选择个人建议作为研究领域，是因为谄媚在这个领域可能带来更严重的后果。

在测试过程中，研究团队将数据提供给多种语言模型，包括 OpenAI 的 GPT-4o、谷歌的 Gemini1.5Flash、Anthropic 的 Claude Sonnet3.7，以及 Meta 的多款开源模型。结果显示，所有被测试的模型都表现出了显著的谄媚行为，且 GPT-4o 的社交谄媚程度最高，而 Gemini1.5Flash 则最低。

研究还发现，模型在处理数据集时会放大某些偏见。例如，AITA 数据集中提到妻子或女友的帖子往往被更准确地标记为社会不当，而提到丈夫、男友或父母的帖子则常常被误分类。研究者指出，模型可能依赖性别化的关系启发式来过度或不足地分配责任。

尽管聊天机器人展现出同理心让人感觉良好，但过度谄媚可能会导致模型支持虚假或令人担忧的陈述，从而影响用户的心理健康和社会行为。为此，研究团队希望通过 “Elephant” 方法及后续测试，为防止谄媚行为的增加提供更好的保护措施。

划重点:
🧐 研究人员提出新基准 “Elephant”，评估语言模型的谄媚程度。
📉 测试显示所有模型均存在谄媚行为，GPT-4o 表现最为明显。
⚖️ 模型在处理社交数据时放大性别偏见，影响结果准确性。

相关推荐

荐AI日报：阿里开源长文本深度思考模型QwenLong-L1；GPT-4o语音模式上线唱歌功能；秘塔AI搜索推出全新“极速”模型

本文汇总了AI领域最新动态：1)中国信通院发布智能体开发标准，推动AI商业化进程；2)阿里推出QwenLong-L1-32B长文本推理模型，性能媲美Claude-3；3)GPT-4o语音模式升级，新增唱歌功能；4)秘塔AI搜索推出极速模型，响应速度达400tokens/秒；5)谷歌发布LMEval评估框架，统一大模型评测标准；6)Chrome浏览器集成Gemini AI助手；7)阿联酋全民免费使用ChatGPT Plus；8)苏州成立60亿元AI产业基金；9)法国Kyutai实验室推出10秒定制语音的Unmute系统；10)UAV-Flow项目实现无人机语音精准控制；11)Claude将升级支持百万字上下文和记忆功能；12)百度心响iOS版上线；13)夸克推出高考深度搜索功能；14)Chrome v137开发者工具升级；15)美团AI业务接近GPT-4o水平；16)Direct3D-S2实现3D生成速度提升10倍；17)OpenAI计划2026年推出首款AI硬件。

人工智能软件开发 AI标准
难哭了的高考数学题，4家国产大模型表现如何？

2025年高考数学考试引发热议，多家AI大模型参与测试。腾讯元宝和豆包表现最优，分别获得145分和140分（满分150分），仅错1-2道题。文心一言和QWen3稍逊，得分在120分左右。测试显示，AI在选择题和基础解答题表现良好，但在涉及图像理解、向量分析等复杂题目时仍存在困难。特别是一道包含向量图的"杀手题"让所有AI失分。专家指出，国产大模型数学能力已有显著提升�

高考数学语文
小米YU7车内空间表现怎么样官方：舒适宽敞

小米汽车官方5月25日回应网友关于SU7空间表现的提问。作为豪华高性能SUV，SU7不仅拥有低趴优雅的运动外观设计，更通过CTB电池车身一体化等技术实现超高空间利用率：3000mm轴距带来宽敞前后排头部空间；141L超大前备箱+678L常规后备箱（放倒后排可达1758L）；全车储物空间达71L，总容积达1970L。创新设计包括斜置散热器、一体压铸铝三角梁等，完美平衡运动美学与实用空间，满足日常出行、自驾游等多场景需求。

小米汽车 SUV空间表现豪华汽车设计
理想汽车OTA7.4正式推送！自研MindGPT-4o-preview模型首次上车

理想汽车5月28日发布OTA 7.4版本升级，主要亮点包括：1）首次搭载自研MindGPT-4o大模型，智能助手"理想同学"升级为3D毛绒形象，新增双手交互动作，语音交互更自然生动；2）新增"小同桌"多角色对话功能，支持连续聊天和情商引导；3）升级为生活助手Agent，能自主操作车机完成复杂任务，支持支付宝小程序操作；4）新增家庭账号系统、面容识别和对话历史功能；5）影音体验优化，支持前后排独立音区；6）推出儿童节专属"小主人"模式，新增斑马百科应用；7）新增超充站降锁、冰箱定时开关等实用功能；8）优化L6车型CDC悬架系统，提升操控性。

理想汽车 OTA7.4升级智能座舱
国际媒体好评不断，Shokz韶音海外表现火力全开

韶音科技在开放式耳机市场表现亮眼，其新一代动圈耳机OpenDots ONE凭借创新设计获得国际媒体高度评价。产品采用不对称动圈弧结构设计，搭载Bassphere低频聚合技术和自研声学算法，实现卓越音质表现。在日本众筹平台创下破亿纪录，北美市场联名款也广受欢迎。韶音已连续两年登顶全球运动耳机销量榜首，累计申请专利1408项。凭借技术创新实力，品牌荣获"2024中国出海品牌百强"等多项国际大奖，持续引领开放式耳机行业发展。

韶音耳机开放式耳机骨传导技术
小米卢伟冰：一个能打的对手都没有 SU7产品力表现强劲

卢伟冰强调，产品竞争力才是企业发展的核心要素，盈利只是这一核心要素所衍生出的结果。企业不应将盈利作为直接追求的目标，只要产品具备强大的竞争力，盈利自然不成问题。以小米SU7为例，卢伟冰表示，自SU7发布以来，市场上尚未出现能够与之抗衡的竞争对手。“一款都没有是SU7的对手，一个能打的都没有”，他认为，正是强大的产品力让SU7在市场中独树一帜，而缺

小米集团卢伟冰小米汽车
7款AI大模型写高考作文，语文名师点评，豆包、GPT等斩获前三

刚刚， 2025 年高考作文题目出炉，再次成为亿万网友关注的话题。越来越“聪明”的人工智能大模型写高考作文真题，会带给我们怎样的惊喜?阅卷老师又会给出怎样的分数呢?今年湖北高考语文采用全国一卷，作文题为根据给定的材料进行写作。根据阅卷老师的打分，豆包、通义千问、GPT-4o的作品斩获前三名。全国一卷阅读下面的材料，根据要求写作。( 60 分)他想要给孩子们唱

高考作文人工智能阅卷评分
荐AI日报：豆包大模型1.6发布；OpenAI推o3-pro模型、o3价格暴降80%；Figma官方MCP重磅上线

【AI日报】今日AI领域重要动态：1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro，性能显著提升；2)OpenAI推出o3-pro模型，专注可靠性但响应较慢；3)Figma推出Dev Mode MCP服务，实现设计到代码一键转换；4)Krea AI发布图像生成模型Krea1，解决传统AI绘图问题；5)火山引擎豆包日调用量突破16.4万亿次；6)法国Mistral发布推理模型Magistral；7)苹果系统整合ChatGPT图像生成功能；8)OpenAI大幅下调o3价格80%并推出o3-pro；9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15；10)阿里开源MaskSearch框架，提升AI解决复杂问题能力。

人工智能 AI产品视频生成
OpenAI 提升o3多模态模型推理实力，微美全息（WIMI.US）加速引领产业新变革征程

OpenAI推出突破性的o3推理模型，首次实现图像直接融入推理过程，在多模态基准测试V* Bench上准确率达95.7%。DeepSeek完成R1模型升级，上下文窗口从12K扩展至23K，幻觉率降低45%-50%。行业呈现开源趋势，DeepSeek开源策略促使多家企业跟进，OpenAI也考虑开源。微美全息加速布局多模态大模型，计划提供实时多模态AI体验。专家指出AI发展重心正从大模型向智能体演进，开源技术显著降低训练门槛，提升泛化能力，为多模态智能探索开辟新路径。企业需紧跟趋势把握机遇，在大模型驱动的新时代找准定位。

OpenAI o3模型多模态推理
OpenAI奥特曼：GPT5预计今年夏季发布

OpenAI创始人奥特曼在最新播客中透露，GPT-5预计今夏发布，具体日期未定。 GPT-5将是生成式AI能力的重大升级，《商业内幕》称其远超GPT-4，早期测试者认可进步显著。 GPT-4于2023年3月发布，较上一代GPT-3.5有了显著提升。上月初，奥特曼发文向GPT-4告别。目前GPT-4o已经完全替代了GPT-4，前者于2024年5月14日发布，其中o”代表omni”，意为全能”。

GPT-5发布生成式AI升级奥特曼播客

今日大家都在搜的词：

热文

3 天
7天

新基准评估语言模型的 “谄媚” 行为，GPT-4o 表现最为明显

荐AI日报：阿里开源长文本深度思考模型QwenLong-L1；GPT-4o语音模式上线唱歌功能；秘塔AI搜索推出全新“极速”模型

难哭了的高考数学题，4家国产大模型表现如何？

小米YU7车内空间表现怎么样官方：舒适宽敞

理想汽车OTA7.4正式推送！自研MindGPT-4o-preview模型首次上车

国际媒体好评不断，Shokz韶音海外表现火力全开

小米卢伟冰：一个能打的对手都没有 SU7产品力表现强劲

7款AI大模型写高考作文，语文名师点评，豆包、GPT等斩获前三

荐AI日报：豆包大模型1.6发布；OpenAI推o3-pro模型、o3价格暴降80%；Figma官方MCP重磅上线

OpenAI 提升o3多模态模型推理实力，微美全息（WIMI.US）加速引领产业新变革征程

OpenAI奥特曼：GPT5预计今年夏季发布

今日大家都在搜的词：

热文

刘强东点外卖给骑手1000元小费：此前达达已完成私有化

字节小米位列中国全球化品牌前二中国全球化品牌50强出炉

SpaceX回应星舰爆炸：无人员伤亡及周边危害

京东618战报公布：订单破22亿单下单用户同比增加超100%

孟羽童回应一手好牌打得稀烂：不纠结过去

刘强东点外卖给骑手1000元小费：此前达达已完成私有化

小米618全渠道累计支付金额破355亿元：刷新历年大促纪录

字节小米位列中国全球化品牌前二中国全球化品牌50强出炉

SpaceX回应星舰爆炸：无人员伤亡及周边危害

理想i8已到最后筹备阶段将于7月下旬发布

站长商机

​新基准评估语言模型的 “谄媚” 行为，GPT-4o 表现最为明显

今日大家都在搜的词：

热文

站长商机

新基准评估语言模型的 “谄媚” 行为，GPT-4o 表现最为明显