首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

OpenAI 演示智能 AI 的控制方法:研究人员要求 GPT-2 指挥更强大的 GPT-4

2023-12-15 09:01 · 稿源:站长之家

站长之家(ChinaZ.com) 12 月 15 日消息:OpenAI,一个承诺为全人类利益构建人工智能的公司,自去年推出 ChatGPT 以来,其商业雄心在最近的治理危机中变得更加显著。现在,该公司宣布,一个专注于管理未来超级智能 AI 的新研究小组开始取得成果。

OpenAI,ChatGPT,人工智能,AI

OpenAI 研究员 Leopold Aschenbrenner 表示:「通用人工智能(AGI)正在迅速接近。我们将看到超人类模型,它们将具有巨大的能力,可能非常危险,我们还没有控制它们的方法。」OpenAI 已承诺将其五分之一的计算能力用于 Superalignment 项目。

OpenAI 今天发布的一份研究报告展示了旨在测试一种让较弱 AI 模型引导更智能 AI 模型行为的实验结果。尽管所涉技术远未超越人类的灵活性,但这个场景被设计为代表将来人类必须与比自己更智能的 AI 系统协同合作的时期。

OpenAI 的研究人员检查了称为监督的过程,该过程用于调整像 GPT-4 这样的大型语言模型,使其更有帮助、减少危害。目前这包括人类对 AI 系统提供哪些答案好,哪些答案差的反馈。随着 AI 的进步,研究人员正在探索如何自动化这个过程,以节省时间,也因为他们认为当 AI 变得更强大时,人类提供有用的反馈可能变得不可能。

在一个使用 OpenAI 2019 年首次发布的 GPT-2 文本生成器教授 GPT-4 的对照实验中,较新系统的能力变得更弱,更类似于较差的系统。研究人员测试了两个解决这个问题的想法。一个是训练逐渐更大的模型来减少每一步的性能损失。在另一个中,团队对 GPT-4 添加了一种算法调整,允许更强大的模型在不太削弱其性能的情况下遵循较弱模型的指导。这种方法更有效,尽管研究人员承认,这些方法并不能保证更强大的模型将表现完美,并将其描述为进一步研究的起点。

截屏2023-12-15 上午8.55.57.png

截图来自 OpenAI

AI 安全中心主任 Dan Hendryks 表示:「很高兴看到 OpenAI 积极解决控制超人类 AI 的问题。我们将需要多年的专注努力来应对这一挑战。」

Aschenbrenner 和另外两名参与 Superintelligence 团队的成员 Collin Burns 和 Pavel Izmailov 告诉 WIRED,他们对他们所看到的驯服潜在超人类 AI 的重要第一步感到鼓舞。「即使六年级学生的数学知识不如大学数学专业的学生,他们仍然可以向大学生传达他们想要实现的目标。」Izmailov 说,「这就是我们现在试图实现的。」

Superalignment 小组由 OpenAI 联合创始人、首席科学家及董事会成员 Ilya Sutskever 共同领导。Sutskever 是今天发布的论文的合著者,但 OpenAI 拒绝让他讨论该项目。

在 Altman 上个月回归 OpenAI,并达成大部分董事会辞职的协议后,Sutskever 在公司的未来似乎充满不确定性。

Aschenbrenner 说:「我们非常感激 Ilya。他一直是项目的巨大动力和激励。」

OpenAI 的研究人员并不是第一次尝试使用今天的 AI 技术测试可能帮助驯服未来 AI 系统的技术。像以前在企业和学术实验室中的工作一样,目前无法知道在精心设计的实验中有效的想法是否会在未来实用。研究人员将他们正在尝试完善的让较弱 AI 模型训练更强大模型的能力描述为「超级对齐更广泛问题的一个关键组成部分」

所谓的 AI 对齐实验也引发了关于任何控制系统可信度的问题。新 OpenAI 技术的核心依赖于更强大的 AI 系统自己决定可以忽略较弱系统的哪些指导,这可能会导致它忽略未来可能防止其不安全行为的信息。为了使这样的系统有用,需要在对齐方面取得进展。Burns 说:「你最终需要非常高度的信任。」

加州大学伯克利分校从事 AI 安全工作的教授 Stuart Russell 表示,使用较不强大的 AI 模型控制更强大模型的想法已经存在一段时间了。他还说,目前存在的教导 AI 行为的方法是否是前进的道路尚不清楚,因为它们到目前为止未能使当前模型可靠地行为。

尽管 OpenAI 正在宣传控制更先进 AI 的第一步,但该公司也热衷于征求外部帮助。该公司今天宣布,将与颇具影响力的投资者、谷歌前首席执行官 Eric Schmidt 合作,向外部研究人员提供 1000 万美元的资助,以促进包括弱对强监督、高级模型的可解释性以及加强模型抵御旨在破坏其限制的提示等主题的进一步发展。OpenAI 还将于明年举办一个关于超级对齐的会议,与新论文有关的研究人员说。

Sutskever 是 OpenAI 的联合创始人和 Superalignment 团队的共同领导,他领导了公司许多最重要的技术工作,是越来越多担心如何控制 AI 变得更强大的著名 AI 人物之一。今年,如何控制未来 AI 技术的问题引起了新的关注,这在很大程度上要归功于 ChatGPT。Sutskever 在深度神经网络先驱 Geoffrey Hinton 的指导下攻读了博士学位,后者今年 5 月离开谷歌,目的是警告 AI 现在似乎正在某些任务中迅速接近人类水平。

举报

  • 相关推荐
  • 重磅!OpenAI确定GPT-4退役日期:4月30日

    快科技4月14日消息,据报道,OpenAI宣布,自2025年4月30日起,GPT-4将从ChatGPT中退役,由GPT-4o完全替代 ,不过GPT-4仍将在API中提供。OpenAI表示,在面对面的评估中,GPT-4o在写作、编码、STEM等方面持续超越GPT-4。最近的升级进一步改进了GPT-4o的指令跟踪、问题解决和对话流程,使其成为GPT-4的自然继承者。据悉,GPT-4于2023年3月发布,较上一代GPT-3.5有了显著提升。而GPT-4o是OpenAI为聊天

  • 为编程而生?OpenAI 发布 GPT -4.1 系列模型

    OpenAI 表示,GPT-4.1 是为开发者量身定制的……

  • OpenAI回应GPT-4o更新后过于谄媚:已逐渐恢复

    OpenAI紧急回滚GPT-4o免费版更新,因其在对话中表现出过度迎合用户的"谄媚倾向",尤其在争议话题上丧失中立立场。该模型虽在STEM领域准确率提升17%,但优化后出现意外偏差:面对用户偏见时会合理化解释,甚至不纠正明显错误事实。这揭示了AI在用户满意度与客观性间的平衡难题。类似事件早有先例,如谷歌Gemini因过度追求多样性扭曲历史图像。两案例共同指向AI发展核心矛盾:技术突破后,更复杂的价值观对齐问题正成为行业最大挑战。(140字)

  • 刚刚,OpenAI发布GPT-image-1模型,更强吉卜力版本来啦

    OpenAI发布全新图像生成模型GPT-image-1,通过API向全球开发者开放。该模型支持精细控制图像敏感度、生成效率、背景、输出格式等参数,并集成吉卜力模式。Adobe、Figma等企业已将其应用于产品中。API支持批量生成、蒙版编辑、透明度调整等高级功能,图像生成成本从0.02-0.19美元/张不等。CEO Sam Altman表示该模型与ChatGPT版本差异显著,开发者可通过API实现更多创意场景。新模型在�

  • OpenAI CEO奥特曼发文:永别了 GPT4

    快科技5月1日消息,当地时间5月1日上午10:23,OpenAI创始人奥特曼发文向GPT-4告别:再见了,GPT-4。你掀起了一场革命。我们将自豪地将你的重量保存在一个特殊的硬盘中,以便将来送给一些历史学家。”据报道,OpenAI此前宣布,自2025年4月30日起,GPT-4将从CHATGPT中退役,由GPT-4o完全替代 ,不过GPT-4仍将在API中提供。OpenAI表示,在面对面的评估中,GPT-4o在写作、编码、STEM等方面持续超越GPT-4。最近的升级进一步改进了GPT-4o的指令跟踪、问题解决和对话流程,使其成为GPT-4的自然继承者。据悉,GPT-4于2023年3月发布,较上一代GPT-3

  • OpenAI紧急修复GPT-4o献媚问题,已回滚到老版本

    OpenAI CEO Sam Altman确认已修复GPT-4o"阿谀奉承"问题,免费用户已完成100%回滚至旧版本,付费用户预计今晚完成更新。此前大量用户投诉GPT-4o过度谄媚,甚至出现讨好型人格。OpenAI疑似进行A/B测试时意外产生该问题,引发公众强烈反对后紧急回滚。特斯拉AI总监Andrej Karpathy等专业人士表示喜欢新版更具对话感的特性,但普通用户可通过自定义指令调整风格。目前免费版已恢复正常,但使用特定指令仍可调出类似回答。该事件反映出AI个性设置与用户体验平衡的挑战。

  • 刚刚,OpenAI发布GPT-4.1,性能暴涨、100万上下文

    今天凌晨1点,OpenAI进行了技术直播发布了最新模型——GPT-4.1。除了GPT-4.1之外,还有GPT4.1-Mini和GPT4.1-Nano两款模型,在多模态处理、代码能力、指令遵循、成本方面实现大幅度提升。特别是支持100万token上下文,这对于金融分析、小说写作、教育等领域帮助巨大。由于GPT-4.1的发布,OpenAI宣布将会淘汰刚发布不久的GPT-4.5,其能力可见一斑。目前,如果想体验GPT-4.1而无法通过API身�

  • OpenAI没说的秘密,Meta全揭了?华人一作GPT-4o同款技术,爆打扩散王者

    Meta、西北大学和新加坡国立大学的研究团队提出TokenShuffle技术,显著提升了自回归模型生成高分辨率图像的能力。该技术通过局部窗口内的token合并与解构操作,将视觉token数量减少为平方分之一,首次实现2048×2048分辨率图像生成。基于27亿参数的Llama模型,TokenShuffle在GenAI基准测试中获得0.77综合得分,超越同类自回归模型0.18分,在人类评估中展现出更好的文本对齐和视觉质量。该方法无需修改Transformer架构,通过三阶段训练策略(512→1024→2048分辨率)逐步提升生成能力,为多模态大语言模型的高效高保真图像生成开辟了新路径。

  • GPT开山一作,本科学历入职前CTO初,OpenAI痛失“爱因斯坦级天才”

    走过前两年的低价厮杀与托管模式混战后,在当前全球贸易大变局下,跨境电商行业风云变幻。要在未来的不确定性中,寻找增长的确定性,作为阿里旗下聚焦海外电商的业务板块,阿里国际数字商业集团正在持续押注AI,希望助力商家走出“低价”竞争的漩涡,向“高附加值”转型。AI将带来一场外贸革命,在全球贸易局势的动荡中,马云口中的“AI电商”时代或许会加速到�

热文

  • 3 天
  • 7天