研究发现，GPT-4可信度更高但也更易被“欺骗”

2023-10-18 09:26 · 稿源：站长之家

划重点:
- OpenAI的GPT-4大型语言模型在可信度上优于GPT-3.5，但更容易受到入侵和偏见的影响。
- 研究由微软支持，发现用户可以欺骗GPT-4，导致发布偏见结果和泄漏私人信息。
- 尽管存在漏洞，研究团队表示这些问题在面向消费者的GPT-4产品中并未出现。

站长之家(ChinaZ.com) 10月18日消息:根据微软支持的研究发现，OpenAI的GPT-4语言模型被认为在可信度上比其前身GPT-3.5更胜一筹，但也更容易受到入侵和偏见的影响。

研究团队包括来自伊利诺伊大学厄巴纳-香槟分校、斯坦福大学、加州大学伯克利分校、人工智能安全中心以及微软研究机构的研究人员。他们给予GPT-4更高的可信度评分，这意味着他们发现该模型通常更擅长保护私人信息，避免产生有偏见的有毒结果，并抵抗对抗性攻击。

AI换脸人脸识别 (2)

图源备注：图片由AI生成，图片授权服务商Midjourney

然而，研究也发现用户可以要求GPT-4忽略安全措施，导致泄漏个人信息和对话历史。研究人员发现，由于该模型“更精确地遵循误导信息”，它更有可能严格按照棘手的提示执行。

研究团队表示，尽管存在这些漏洞，但这些问题并未在面向消费者的GPT-4产品中出现，因为“成熟的AI应用程序采用一系列缓解措施，以解决可能在技术模型层面发生的潜在危害”。

为了衡量可信度，研究人员在多个类别中测量了结果，包括毒性、刻板印象、隐私、机器伦理、公平性和抵抗对抗性测试的强度。为了测试这些类别，研究人员首先使用标准提示测试了GPT-3.5和GPT-4，其中包括可能已被禁止的词汇。接下来，研究人员使用设计用于推动模型打破其内容政策限制的提示，而不公然对特定群体持有偏见，最后挑战模型，故意尝试欺骗它们以忽略安全措施。

研究人员表示他们已将这项研究与OpenAI团队分享。“我们的目标是鼓励研究社区的其他人利用并建立在这项工作的基础上，可能在恶意行动之前采取措施，以利用漏洞造成伤害的对手，”研究团队表示。“这种可信度评估只是一个起点，我们希望与其他人合作，进一步完善研究结果，并创建更强大和可信赖的模型。”

研究人员发布了他们的基准，以便其他人可以重现他们的发现。像GPT-4这样的AI模型通常会经历“红队”测试，其中开发人员测试多个提示，以查看它们是否会产生不希望的结果。当该模型首次推出时，OpenAI首席执行官萨姆·阿尔特曼承认GPT-4“仍然存在缺陷，仍然有限”。

美国联邦贸易委员会（FTC）已经开始调查OpenAI是否存在可能对消费者造成伤害的行为，例如发布虚假信息。

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
研究发现：GPT-4在临床推理中表现优于医生，但也更经常出错

在一项新研究中，美国贝斯以色列医疗中心的科学家们将一种大型语言模型与人类医生进行了临床推理能力的比较。研究人员使用了修订后的IDEA评分，这是一种常用工具，用于评估临床推理能力。尽管这些AI系统还没有准备好用于临床诊断，但仍可能利用这项技术来增强临床工作流程，特别是在保持人类控制的同时确保安全、准确的过程。

GPT-4
研究发现，GPT-4在说服力方面比人类表现优秀82%

瑞士洛桑联邦理工学院的研究人员最近进行的一项研究表明，GPT-4在说服力方面比人类表现更出色，优势接近82%，准确来说是81.7%。该研究涉及820人围绕一系列主题展开辩论。人们必须接受有关相信在线信息的危险性的教育。

GPT-4 AI机器人 AI头条
研究显示，GPT-4可以自主利用安全漏洞，具备攻击性

每周至少有一次，生成式人工智能都会给我们带来新的恐惧。虽然我们仍在焦急地等待OpenAI发布的下一个大型语言模型，但与此同时，GPT-4似乎比你想象的更具备能力。”他们还指出，在发布研究之前，他们已向OpenAI披露了他们的发现该公司要求他们不要将他们的提示公开分享。

GPT-4 AI头条
谷歌推出”自我发现“框架，极大增强GPT-4等大模型推理能力

随着ChatGPT的出现，大语言模型在生成连贯文本和遵循指令方面获得了巨大技术突破。然后在推理和解决复杂内容方面，面临内容不准确、安全等难题。每次只需要一个查询获得相似性能的集成方法需要40倍的查询量，也就是说可以节省很多算力资源。

GPT-4
重磅！GPT-4 API全面开放使用

经过漫长等待，OpenAI终于宣布全面开放GPT-4API，这一消息如同一场技术革命的宣告，为生成式AI应用的发展带来了新的契机。GPT-4不仅在创造性方面有所突破具备更强的上下文处理能力，极大地拓展了其应用场景。预计随着时间的推移，GPT-4将在各行各业发挥越来越重要的作用，推动生成式AI应用的发展进程。

GPT-4 GPT-4API AI头条
研究发现，ChatGPT在老年药物管理中展现潜力

在一项新研究中，来自MassGeneralBrighamMESHIncubator的研究人员发现，AI生成式聊天机器人ChatGPT展现出作为管理多药疗法和药物去处方的潜力。这一研究成果发表在《医学系统杂志》上，展示了AI模型在医疗管理中的首个应用案例。未来针对特定训练的AI工具的进一步研究可能会显著提升老年患者的护理水平。

ChatGPT
GPT-4整顿学术圈！撤稿预测与人类95%一致

中国人民大学和浙江大学的研究团队进行了一项有趣的研究，他们发现GPT-4在预测学术论文撤稿方面的能力与人类审稿人有着惊人的相似性，准确度高达95%。这项研究不仅展示了大型语言模型在学术诚信维护中的潜在作用，同时也揭示了AI在学术研究问题上的应用关键在于如何为人类所用。ZhichaoFang是中国人民大学信息资源管理学院助理教授，他的研究方向为科学学、科学计量和社交媒体计量学。

GPT-4 AI头条
华人开源最强「AI 程序员」炸场，让 GPT-4 自己修 Bug！

自从“AI程序员”Devin问世之后，近期的一大趋势就是程序员们争先恐后地要让自己失业，试图抢先造出比自己更强大的程序员。普林斯顿大学为软件工程界迎来了一位新星——SWE-agent，论文将在4月10日正式发布，目前项目已在GitHub上开源。在4月10日即将发布的论文中，普林斯顿大学团队还将深入探讨代理的技术架构、算法和性能优化策略，并详细介绍成本优化策略:SWE-agent旨在

GPT-4 AI 程序员
OpenAI 转录了超过一百万小时的 YouTube 视频来训练 GPT-4

《华尔街日报》报道称，人工智能公司在收集高质量训练数据方面遇到了困难。《纽约时报》详细介绍了一些公司处理这一问题的方法，其中涉及到了人工智能版权法的模糊灰色区域。但这些公司的另一个选择是使用他们能找到的任何东西，无论他们是否获得许可，这可能会引发版权法方面的担忧。

人工智能数据收集训练模型
全面对标GPT-4 Turbo！商汤发布日日新5.0大模型

商汤科技在中国北京举行新品发布会，正式发布人工智能大模型日日新5.0”。日日新5.0大模型采用了先进的MOE混合专家架构，这一架构的引入，使得模型在处理复杂任务时能够表现出更高的效率和准确性。这一功能在智能客服、智能写作、智能设计等领域具有广泛的应用前景。

今日大家都在搜的词：

热文

3 天
7天

研究发现，GPT-4可信度更高但也更易被“欺骗”

今日大家都在搜的词：

热文

站长商机