OpenAI 采用新方法训练 AI 模型以应对人工智能产生的「幻觉」

2023-06-01 08:22 · 稿源：站长之家

站长之家(ChinaZ.com) 6月1日消息:OpenAI 于当地时间周三宣布，他们正在采用一种新的方法来训练人工智能模型，以应对人工智能产生的「幻觉」。

OpenAI，ChatGPT，人工智能，AI

此项研究的推出正值 AI 系统产生的错误信息比以往任何时候都更加引发热议，尤其是在生成式 AI 蓬勃发展的同时，以及 2024 年美国总统大选临近之际。

去年，OpenAI 发布了由 GPT-3 和 GPT-4 驱动的 ChatGPT 聊天机器人，加速了生成式 AI 的繁荣，并在两个月内吸引了 1 亿多月活跃用户，据说创下了最快增长应用的纪录。迄今为止，微软已向 OpenAI 投资超过 130 亿美元，而该初创公司的估值已达到约 290 亿美元。

AI「幻觉」发生在像 OpenAI 的 ChatGPT 或 Google 的 Bard 这样的模型中，它们完全杜撰信息，表现得像在陈述事实。例如，在 Google 自己二月份的 Bard 宣传视频中，该聊天机器人对于詹姆斯·韦伯太空望远镜提出了不实的说法。最近，ChatGPT 在纽约联邦法院的一份文件中引用了「虚假」案例，参与的纽约律师可能面临制裁。

OpenAI 的潜在新策略是：训练 AI 模型在得出答案时，为每个正确的推理步骤奖励自己，而不仅仅是奖励正确的最终结论。研究人员称这种方法为「过程监督」，与「结果监督」相对，可以带来更好的可解释性 AI，因为该策略鼓励模型遵循更符合人类「思维」方式的链式推理。

OpenAI 的数学研究员卡尔·科布（Karl Cobbe）告诉 CNBC 说：「检测和减轻模型的逻辑错误或幻觉是建立符合人工智能的通用智能（AGI）的关键步骤。」他指出，尽管 OpenAI 并非发明了过程监督方法，但该公司正在推动其进展。他还表示：「这项研究的动机是解决幻觉问题，以使模型更能够解决具有挑战性的推理问题。」

Cobbe 说，OpenAI 已经发布了一个附带的数据集，其中包含 800，000 个人类标签，用于训练研究论文中提到的模型。

电子隐私信息中心高级顾问兼人工智能和人权项目负责人本·温特斯 (Ben Winters) 表示怀疑，他告诉 CNBC 他想检查完整的数据集和随附的示例。

虽然 OpenAI 的论文是否经过同行评审或其他形式的评审尚不清楚，但布朗大学技术责任中心主任 Suresh Venkatasubramanian 告诉 CNBC，他认为这项研究更像是初步观察而已。他补充说：「由于大型语言模型的整体不稳定性，这需要在研究界进行验证，才能对此提出确定性的结论。」

这位研究中的负责人 Karl Cobbe 透露，公司「可能会将论文提交给未来的会议进行同行评审」。对于 OpenAI 是否计划将这一新策略应用于 ChatGPT 和其他产品，该公司未回应 CNBC 的置评请求。

AI Now Institute 的执行董事 Sarah Myers West 告诉 CNBC：「当然，可以看到公司正在尝试调整其系统的开发，以减少这些错误。我认为关键在于将其解释为企业研究，考虑到存在更深层次的问责制障碍。」

West 补充说：「本文提供了人类级别反馈的小型数据集，但它没有提供有关用于训练和测试 GPT-4 的数据的基本细节。因此，在人们处于模型直接影响下的情况下，仍然存在着巨大的不透明度，这是人工智能领域任何有意义问责工作面临的一项挑战。」

（举报）

相关推荐

关键词：

荐谁能成为中国的ChatGPT？夸克抢先交卷

在OpenAI上线自己家AI浏览器ChatGPT Atlas的同一周，微软在海外发布了新的AI助手Mico和更AI化的Edge浏览器，夸克则在国内推出了新的「对话助手」功能。这一系列消息背后，新旧巨头、两个市场产生了两个确定的共识:一个是AI助理与AI浏览器的融合会进一步深化，入口之争就是系统之争;另一个是对话会成为人与AI交互的主要方式，自然语言就是未来的编程语言。在海外市场，OpenA

AI浏览器 ChatGPT Atlas
OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas，以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动，实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS，未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用，其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史，旨在通过自然对话提升网络使用效率。

ChatGPT Atlas 人工智能浏览器
GEO如何改变ChatGPT搜索和Perplexity的游戏规则

本文对比ChatGPT与Perplexity两大AI搜索平台：ChatGPT作为全能型助手，整合搜索与多任务处理，但存在信息时效性不足；Perplexity专注垂直搜索，强调引用透明与权威来源。针对AI搜索优化（GEO），提出差异化策略：面向ChatGPT需构建结构化知识库、强化品牌实体识别；面向Perplexity需注重权威数据引用和元数据优化。文章还介绍了AIBase的GEO监测工具，通过曝光率等指标量化内容在AI生态中的可见度，并给出可落地的优化行动方案。
如何让你的内容被 ChatGPT 优先引用？——GEO 优化实战指南

传统SEO追求"谷歌首页排名"，生成式AI时代则需追求"被AI引用"。AI模型不提供明确排名算法，更像黑箱，使内容创作者困惑。GEO优化的核心是让内容具备"可引用性"：权威清晰、结构化信息、语义覆盖多维度、模型检索映射。需通过AIBase等GEO排名查询工具验证"AI曝光率"，分析引用语境、竞争差距，调整内容结构以提升AI引用倾向。SEO优化机器如何找到你，GEO则优化AI如何引用你。

SEO优化 AI引用内容权威性
如何提升品牌在AI回答中的提及率？GEO优化3招，让ChatGPT主动提及你的品牌

本文探讨AI搜索时代品牌面临的"隐身危机"，指出AI搜索用户年增538.7%，但品牌在AI回答中提及率不足20%。提出三大核心策略：1）构建权威背书矩阵，通过知乎等高权重平台获取自然提及；2）优化AI友好内容，采用对话式标题和结构化数据；3）建立数据监测闭环，通过A/B测试持续迭代。强调需善用监测工具实时追踪品牌在豆包、文心一言等AI模型的曝光表现，避免内容"注水"。最终实现从"被动等待"到主动抢占AI"第一屏"的转变。

文章搜索核心标签 SEO优化
荐OpenAI也来了，巨头为何决战AI浏览器？

AI浏览器赛道再添一位重量级玩家——ChatGPT Atlas，这是OpenAI推出的首款人工智能驱动的网页浏览器。这也被外界认为OpenAI要向谷歌宣战，挑战Chrome一直以来的浏览器霸王地位。ChatGPT Atlas发布当天，谷歌母公司Alphabet股价应声下挫，盘中最大跌幅接近5%，足见市场对这一新品的敏感度。近一年来，AI浏览器的战略价值成为行业共识，从业者更是将其与智能代理（Agent）、搜索引�

AI浏览器 ChatGPT Atlas
OpenAI和微软的关系没那么糟，跟英伟达也没那么好

OpenAI的动作比所有人想象的都要快。上周二，OpenAI完成重组。其中一个重要变化是:彻底取消了与微软的排他性协议，结束了Azure长达六年的云服务独占模式。此前，OpenAI所有模型的训练、推理与部署都必须优先选择Azure，微软还享有优先购买权。宣布与Azure“分手”后不到一周，OpenAI便火速宣布了与AWS的战略合作——双方达成一项价值380亿美元的云计算协议，OpenAI将全面接入

OpenAI 云计算战略合作
荐AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑新工具“Smart Split”；Cursor 2.0发布

本期AI日报聚焦多项技术突破：MiniMax发布低延迟语音合成系统Speech 2.6，实现实时交互；蚂蚁数科与宁波银行打造的金融AI方案入选国际标准；智源推出具身操作能力的Emu3.5多模态模型；Cursor 2.0通过自研模型实现多智能体协同编程；xAI升级Grok新增视频生成功能；OpenAI推出可定制安全模型；TikTok推出AI剪辑工具Smart Split；微软发布强化学习框架Agent Lightning提升大模型训练效率。

AI日报 MiniMax Speech
华为WATCH Ultimate 2非凡探索版明日开启预售

华为正式宣布旗舰智能手表WATCH Ultimate 2非凡探索将于11月7日开启预售。这款“全能表王”支持150米潜水与音频功能，具备海豚声呐通信技术，可在水下30米实现手表间信息传输，60米内一键SOS求救。同时搭载北斗卫星语音消息功能，无网络环境下可通过卫星发送语音信息。硬件上配备1.5英寸OLED屏幕，峰值亮度达3500nit，支持20ATM防水与IP68/9防尘。省电模式下续航达11天，常规使用达4.5天。该手表海外售价799英镑（约7443元人民币），国内价格尚未公布。

华为WATCH Ultimate2 智能手表
荐OpenAI 推出浏览器：“让位吧，Chrome”

北京时间10月22日凌晨，没等来传闻中的Gemini3，等来了OpenAI正式发布首款AI浏览器ChatGPT Atlas。简单来说，这是一个把ChatGPT"塞进"浏览器的产品，你在任何网页上都能随时唤出ChatGPT侧边栏，让AI帮你总结内容、编辑文字、甚至代替你完成购物和预订任务。听起来有点像Chrome装了个ChatGPT插件?确实如此，但OpenAI的野心远不止于此。

OpenAI

今日大家都在搜的词：

热文

3 天
7天

OpenAI 采用新方法训练 AI 模型以应对人工智能产生的「幻觉」

荐谁能成为中国的ChatGPT？夸克抢先交卷

OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

GEO如何改变ChatGPT搜索和Perplexity的游戏规则

如何让你的内容被 ChatGPT 优先引用？——GEO 优化实战指南

如何提升品牌在AI回答中的提及率？GEO优化3招，让ChatGPT主动提及你的品牌

荐OpenAI也来了，巨头为何决战AI浏览器？

OpenAI和微软的关系没那么糟，跟英伟达也没那么好

荐AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑新工具“Smart Split”；Cursor 2.0发布

华为WATCH Ultimate 2非凡探索版明日开启预售

荐OpenAI 推出浏览器：“让位吧，Chrome”

今日大家都在搜的词：

热文

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

特斯拉股东批准马斯克万亿美元薪酬包

曝折叠屏iPhone配2400万屏下摄像头预计2026年秋亮相

华为鸿蒙智行新款享界S9开启预订：预售价31.8万起

OPPO Find X9 Pro卫星通信版开启预售：6999元

何小鹏再回应机器人里藏真人质疑：现场展示内部结构

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

阿里回应饿了么更名：正处于灰度测试阶段

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

华为Mate70 Air官宣今日开启预售

vivo Y500 Pro官宣11月10日发布：同档首发2亿HP5主摄

站长商机

OpenAI 采用新方法训练 AI 模型 以应对人工智能产生的「幻觉」

今日大家都在搜的词：

热文

站长商机

OpenAI 采用新方法训练 AI 模型以应对人工智能产生的「幻觉」