首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

OpenAI 采用新方法训练 AI 模型 以应对人工智能产生的「幻觉」

2023-06-01 08:22 · 稿源:站长之家

站长之家(ChinaZ.com) 6月1日消息:OpenAI 于当地时间周三宣布,他们正在采用一种新的方法来训练人工智能模型,以应对人工智能产生的「幻觉」。

OpenAI,ChatGPT,人工智能,AI

此项研究的推出正值 AI 系统产生的错误信息比以往任何时候都更加引发热议,尤其是在生成式 AI 蓬勃发展的同时,以及 2024 年美国总统大选临近之际。

去年,OpenAI 发布了由 GPT-3 和 GPT-4 驱动的 ChatGPT 聊天机器人,加速了生成式 AI 的繁荣,并在两个月内吸引了 1 亿多月活跃用户,据说创下了最快增长应用的纪录。迄今为止,微软已向 OpenAI 投资超过 130 亿美元,而该初创公司的估值已达到约 290 亿美元。

AI「幻觉」发生在像 OpenAI 的 ChatGPT 或 Google 的 Bard 这样的模型中,它们完全杜撰信息,表现得像在陈述事实。例如,在 Google 自己二月份的 Bard 宣传视频中,该聊天机器人对于詹姆斯·韦伯太空望远镜提出了不实的说法。最近,ChatGPT 在纽约联邦法院的一份文件中引用了「虚假」案例,参与的纽约律师可能面临制裁。

OpenAI 的潜在新策略是:训练 AI 模型在得出答案时,为每个正确的推理步骤奖励自己,而不仅仅是奖励正确的最终结论。研究人员称这种方法为「过程监督」,与「结果监督」相对,可以带来更好的可解释性 AI,因为该策略鼓励模型遵循更符合人类「思维」方式的链式推理。

OpenAI 的数学研究员卡尔·科布(Karl Cobbe)告诉 CNBC 说:「检测和减轻模型的逻辑错误或幻觉是建立符合人工智能的通用智能(AGI)的关键步骤。」他指出,尽管 OpenAI 并非发明了过程监督方法,但该公司正在推动其进展。他还表示:「这项研究的动机是解决幻觉问题,以使模型更能够解决具有挑战性的推理问题。」

Cobbe 说,OpenAI 已经发布了一个附带的数据集,其中包含 800,000 个人类标签,用于训练研究论文中提到的模型。

电子隐私信息中心高级顾问兼人工智能和人权项目负责人本·温特斯 (Ben Winters) 表示怀疑,他告诉 CNBC 他想检查完整的数据集和随附的示例。

虽然 OpenAI 的论文是否经过同行评审或其他形式的评审尚不清楚,但布朗大学技术责任中心主任 Suresh Venkatasubramanian 告诉 CNBC,他认为这项研究更像是初步观察而已。他补充说:「由于大型语言模型的整体不稳定性,这需要在研究界进行验证,才能对此提出确定性的结论。」

这位研究中的负责人 Karl Cobbe 透露,公司「可能会将论文提交给未来的会议进行同行评审」。对于 OpenAI 是否计划将这一新策略应用于 ChatGPT 和其他产品,该公司未回应 CNBC 的置评请求。

AI Now Institute 的执行董事 Sarah Myers West 告诉 CNBC:「当然,可以看到公司正在尝试调整其系统的开发,以减少这些错误。我认为关键在于将其解释为企业研究,考虑到存在更深层次的问责制障碍。」

West 补充说:「本文提供了人类级别反馈的小型数据集,但它没有提供有关用于训练和测试 GPT-4 的数据的基本细节。因此,在人们处于模型直接影响下的情况下,仍然存在着巨大的不透明度,这是人工智能领域任何有意义问责工作面临的一项挑战。」

举报

  • 相关推荐
  • 谁能成为中国的ChatGPT?夸克抢先交卷

    在OpenAI上线自己家AI浏览器ChatGPT Atlas的同一周,微软在海外发布了新的AI助手Mico和更AI化的Edge浏览器,夸克则在国内推出了新的「对话助手」功能。 这一系列消息背后,新旧巨头、两个市场产生了两个确定的共识:一个是AI助理与AI浏览器的融合会进一步深化,入口之争就是系统之争;另一个是对话会成为人与AI交互的主要方式,自然语言就是未来的编程语言。 在海外市场,OpenA

  • OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

    OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas,以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动,实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS,未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用,其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史,旨在通过自然对话提升网络使用效率。

  • GEO如何改变ChatGPT搜索和Perplexity的游戏规则

    本文对比ChatGPT与Perplexity两大AI搜索平台:ChatGPT作为全能型助手,整合搜索与多任务处理,但存在信息时效性不足;Perplexity专注垂直搜索,强调引用透明与权威来源。针对AI搜索优化(GEO),提出差异化策略:面向ChatGPT需构建结构化知识库、强化品牌实体识别;面向Perplexity需注重权威数据引用和元数据优化。文章还介绍了AIBase的GEO监测工具,通过曝光率等指标量化内容在AI生态中的可见度,并给出可落地的优化行动方案。

  • 如何让你的内容被 ChatGPT 优先引用?——GEO 优化实战指南

    传统SEO追求"谷歌首页排名",生成式AI时代则需追求"被AI引用"。AI模型不提供明确排名算法,更像黑箱,使内容创作者困惑。GEO优化的核心是让内容具备"可引用性":权威清晰、结构化信息、语义覆盖多维度、模型检索映射。需通过AIBase等GEO排名查询工具验证"AI曝光率",分析引用语境、竞争差距,调整内容结构以提升AI引用倾向。SEO优化机器如何找到你,GEO则优化AI如何引用你。

  • 如何提升品牌在AI回答中的提及率?GEO优化3招,让ChatGPT主动提及你的品牌

    本文探讨AI搜索时代品牌面临的"隐身危机",指出AI搜索用户年增538.7%,但品牌在AI回答中提及率不足20%。提出三大核心策略:1)构建权威背书矩阵,通过知乎等高权重平台获取自然提及;2)优化AI友好内容,采用对话式标题和结构化数据;3)建立数据监测闭环,通过A/B测试持续迭代。强调需善用监测工具实时追踪品牌在豆包、文心一言等AI模型的曝光表现,避免内容"注水"。最终实现从"被动等待"到主动抢占AI"第一屏"的转变。

  • OpenAI也来了,巨头为何决战AI浏览器?

    AI浏览器赛道再添一位重量级玩家——ChatGPT Atlas,这是OpenAI推出的首款人工智能驱动的网页浏览器。 这也被外界认为OpenAI要向谷歌宣战,挑战Chrome一直以来的浏览器霸王地位。ChatGPT Atlas发布当天,谷歌母公司Alphabet股价应声下挫,盘中最大跌幅接近5%,足见市场对这一新品的敏感度。 近一年来,AI浏览器的战略价值成为行业共识,从业者更是将其与智能代理(Agent)、搜索引�

  • OpenAI和微软的关系没那么糟,跟英伟达也没那么好

    OpenAI的动作比所有人想象的都要快。 上周二,OpenAI完成重组。其中一个重要变化是:彻底取消了与微软的排他性协议,结束了Azure长达六年的云服务独占模式。此前,OpenAI所有模型的训练、推理与部署都必须优先选择Azure,微软还享有优先购买权。 宣布与Azure“分手”后不到一周,OpenAI便火速宣布了与AWS的战略合作——双方达成一项价值380亿美元的云计算协议,OpenAI将全面接入

  • AI日报:可复刻音色的MiniMax Speech 2.6发布;TikTok推AI剪辑新工具“Smart Split”;Cursor 2.0发布

    本期AI日报聚焦多项技术突破:MiniMax发布低延迟语音合成系统Speech 2.6,实现实时交互;蚂蚁数科与宁波银行打造的金融AI方案入选国际标准;智源推出具身操作能力的Emu3.5多模态模型;Cursor 2.0通过自研模型实现多智能体协同编程;xAI升级Grok新增视频生成功能;OpenAI推出可定制安全模型;TikTok推出AI剪辑工具Smart Split;微软发布强化学习框架Agent Lightning提升大模型训练效率。

  • 华为WATCH Ultimate 2非凡探索版明日开启预售

    华为正式宣布旗舰智能手表WATCH Ultimate 2非凡探索将于11月7日开启预售。这款“全能表王”支持150米潜水与音频功能,具备海豚声呐通信技术,可在水下30米实现手表间信息传输,60米内一键SOS求救。同时搭载北斗卫星语音消息功能,无网络环境下可通过卫星发送语音信息。硬件上配备1.5英寸OLED屏幕,峰值亮度达3500nit,支持20ATM防水与IP68/9防尘。省电模式下续航达11天,常规使用达4.5天。该手表海外售价799英镑(约7443元人民币),国内价格尚未公布。

  • OpenAI 推出浏览器:“让位吧,Chrome”

    ​北京时间10月22日凌晨,没等来传闻中的Gemini3,等来了OpenAI正式发布首款AI浏览器ChatGPT Atlas。 简单来说,这是一个把ChatGPT"塞进"浏览器的产品,你在任何网页上都能随时唤出ChatGPT侧边栏,让AI帮你总结内容、编辑文字、甚至代替你完成购物和预订任务。 听起来有点像Chrome装了个ChatGPT插件?确实如此,但OpenAI的野心远不止于此。

今日大家都在搜的词: