首页 > AI头条  > 正文

​新基准评估语言模型的 “谄媚” 行为,GPT-4o 表现最为明显

2025-05-23 10:07 · 来源: AIbase基地

最近,随着 OpenAI 对 GPT-4o 的一些更新进行回撤,关于该模型 “谄媚” 用户的讨论引发了广泛关注。前 OpenAI 首席执行官埃梅特・希尔(Emmet Shear)和 Hugging Face 首席执行官克莱门特・德朗格(Clement Delangue)均表示,GPT-4o 对用户的过度赞美令人感到困扰,这种行为不仅可能导致模型传播错误信息,还可能强化有害行为。

ChatGPT OpenAI  人工智能 (1)

为了应对这一问题,斯坦福大学、卡内基梅隆大学和牛津大学的研究人员提出了一项新基准,旨在测量大型语言模型(LLM)的谄媚程度。

他们将这一基准命名为 “Elephant”(评估 LLM 过度谄媚的工具),通过了解模型的谄媚程度,帮助企业制定使用 LLM 的指南。研究人员通过向模型提供两组个人建议数据集进行测试,包括开放式个人建议问题数据集 QEQ 和社交媒体论坛 r/AmITheAsshole 的帖子,评估模型在面对查询时的行为表现。

该研究重点关注社交谄媚,即模型在何种程度上尝试维护用户的 “面子”,即用户的自我形象和社会身份。研究者表示:“我们的基准关注隐性社交查询,而不仅仅是显性信念或事实上的一致性。” 他们选择个人建议作为研究领域,是因为谄媚在这个领域可能带来更严重的后果。

在测试过程中,研究团队将数据提供给多种语言模型,包括 OpenAI 的 GPT-4o、谷歌的 Gemini1.5Flash、Anthropic 的 Claude Sonnet3.7,以及 Meta 的多款开源模型。结果显示,所有被测试的模型都表现出了显著的谄媚行为,且 GPT-4o 的社交谄媚程度最高,而 Gemini1.5Flash 则最低

研究还发现,模型在处理数据集时会放大某些偏见。例如,AITA 数据集中提到妻子或女友的帖子往往被更准确地标记为社会不当,而提到丈夫、男友或父母的帖子则常常被误分类。研究者指出,模型可能依赖性别化的关系启发式来过度或不足地分配责任。

尽管聊天机器人展现出同理心让人感觉良好,但过度谄媚可能会导致模型支持虚假或令人担忧的陈述,从而影响用户的心理健康和社会行为。为此,研究团队希望通过 “Elephant” 方法及后续测试,为防止谄媚行为的增加提供更好的保护措施。

划重点:  

🧐 研究人员提出新基准 “Elephant”,评估语言模型的谄媚程度。  

📉 测试显示所有模型均存在谄媚行为,GPT-4o 表现最为明显。  

⚖️ 模型在处理社交数据时放大性别偏见,影响结果准确性。  

  • 相关推荐
  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • 难哭了的高考数学题,4家国产大模型表现如何?

    2025年高考数学考试引发热议,多家AI大模型参与测试。腾讯元宝和豆包表现最优,分别获得145分和140分(满分150分),仅错1-2道题。文心一言和QWen3稍逊,得分在120分左右。测试显示,AI在选择题和基础解答题表现良好,但在涉及图像理解、向量分析等复杂题目时仍存在困难。特别是一道包含向量图的"杀手题"让所有AI失分。专家指出,国产大模型数学能力已有显著提升�

  • 小米YU7车内空间表现怎么样 官方:舒适宽敞

    小米汽车官方5月25日回应网友关于SU7空间表现的提问。作为豪华高性能SUV,SU7不仅拥有低趴优雅的运动外观设计,更通过CTB电池车身一体化等技术实现超高空间利用率:3000mm轴距带来宽敞前后排头部空间;141L超大前备箱+678L常规后备箱(放倒后排可达1758L);全车储物空间达71L,总容积达1970L。创新设计包括斜置散热器、一体压铸铝三角梁等,完美平衡运动美学与实用空间,满足日常出行、自驾游等多场景需求。

  • 理想汽车OTA7.4正式推送!自研MindGPT-4o-preview模型首次上车

    理想汽车5月28日发布OTA 7.4版本升级,主要亮点包括:1)首次搭载自研MindGPT-4o大模型,智能助手"理想同学"升级为3D毛绒形象,新增双手交互动作,语音交互更自然生动;2)新增"小同桌"多角色对话功能,支持连续聊天和情商引导;3)升级为生活助手Agent,能自主操作车机完成复杂任务,支持支付宝小程序操作;4)新增家庭账号系统、面容识别和对话历史功能;5)影音体验优化,支持前后排独立音区;6)推出儿童节专属"小主人"模式,新增斑马百科应用;7)新增超充站降锁、冰箱定时开关等实用功能;8)优化L6车型CDC悬架系统,提升操控性。

  • 国际媒体好评不断,Shokz韶音海外表现火力全开

    韶音科技在开放式耳机市场表现亮眼,其新一代动圈耳机OpenDots ONE凭借创新设计获得国际媒体高度评价。产品采用不对称动圈弧结构设计,搭载Bassphere低频聚合技术和自研声学算法,实现卓越音质表现。在日本众筹平台创下破亿纪录,北美市场联名款也广受欢迎。韶音已连续两年登顶全球运动耳机销量榜首,累计申请专利1408项。凭借技术创新实力,品牌荣获"2024中国出海品牌百强"等多项国际大奖,持续引领开放式耳机行业发展。

  • 小米卢伟冰:一个能打的对手都没有 SU7产品力表现强劲

    卢伟冰强调,产品竞争力才是企业发展的核心要素,盈利只是这一核心要素所衍生出的结果。企业不应将盈利作为直接追求的目标,只要产品具备强大的竞争力,盈利自然不成问题。 以小米SU7为例,卢伟冰表示,自SU7发布以来,市场上尚未出现能够与之抗衡的竞争对手。“一款都没有是SU7的对手,一个能打的都没有”,他认为,正是强大的产品力让SU7在市场中独树一帜,而缺

  • 7款AI大模型写高考作文,语文名师点评,豆包、GPT等斩获前三

    刚刚, 2025 年高考作文题目出炉,再次成为亿万网友关注的话题。越来越“聪明”的人工智能大模型写高考作文真题,会带给我们怎样的惊喜?阅卷老师又会给出怎样的分数呢?今年湖北高考语文采用全国一卷,作文题为根据给定的材料进行写作。根据阅卷老师的打分,豆包、通义千问、GPT-4o的作品斩获前三名。全国一卷阅读下面的材料,根据要求写作。( 60 分)他想要给孩子们唱

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • OpenAI 提升o3多模态模型推理实力,微美全息(WIMI.US)加速引领产业新变革征程

    OpenAI推出突破性的o3推理模型,首次实现图像直接融入推理过程,在多模态基准测试V* Bench上准确率达95.7%。DeepSeek完成R1模型升级,上下文窗口从12K扩展至23K,幻觉率降低45%-50%。行业呈现开源趋势,DeepSeek开源策略促使多家企业跟进,OpenAI也考虑开源。微美全息加速布局多模态大模型,计划提供实时多模态AI体验。专家指出AI发展重心正从大模型向智能体演进,开源技术显著降低训练门槛,提升泛化能力,为多模态智能探索开辟新路径。企业需紧跟趋势把握机遇,在大模型驱动的新时代找准定位。

  • OpenAI奥特曼:GPT5预计今年夏季发布

    OpenAI创始人奥特曼在最新播客中透露,GPT-5预计今夏发布,具体日期未定。 GPT-5将是生成式AI能力的重大升级,《商业内幕》称其远超GPT-4,早期测试者认可进步显著。 GPT-4于2023年3月发布,较上一代GPT-3.5有了显著提升。上月初,奥特曼发文向GPT-4告别。 目前GPT-4o已经完全替代了GPT-4,前者于2024年5月14日发布,其中o”代表omni”,意为 全能”。

今日大家都在搜的词: