首页 > 业界 > 关键词  > CoVe最新资讯  > 正文

Meta提出CoVe提示工程方法 减少ChatGPT等聊天机器人幻觉问题

2023-10-13 10:28 · 稿源:站长之家

划重点:

💡 Meta提出了链式验证(Chain-of-Verification,简写CoVe)方法,让聊天机器人根据初步回复自我生成验证问题,从而减少错误信息。

📊 CoVe可将列表式问题的准确度提高一倍以上,即使长文本的事实准确性也可提高28%。

🔮 未来可结合外部知识提升CoVe效果,如让聊天机器人访问外部数据库回答验证问题。

站长之家(ChinaZ.com)10月13日 消息:近日,Meta AI研究人员提出了一种新的基于提示的方法,称为链式验证(Chain-of-Verification,简写CoVe),可显著减少ChatGPT等语言模型产生的错误信息。

image.png

研究显示,ChatGPT和其他语言模型会重复复制不正确的信息,即使它们已经学到了正确的信息。Meta AI的研究人员发现,让聊天机器人根据其最初的回复自行生成验证问题,然后独立执行这些问题而不受最初输入的影响,可以减少语言模型的“幻想”。

具体来说,在CoVe方法中,聊天机器人首先响应诸如“Name some politicians who were born in New York”之类的提示,根据这个常包含错误的初始输出,语言模型随后生成诸如“Where was Donald Trump born?”之类的问题来验证其语句。这些“验证问题”然后作为一个新的提示执行,独立于第一个输入,以防止从第一个输出中获取不正确信息。然后,语言模型会根据分别收集的事实来验证第一个输入。所有测试都是在Llama65B模型上进行的。

在他们的测试中,Meta 团队还可以证明指令调整和思维链提示不会减少幻觉,因此带有 CoVe 的 Llama65B 击败了更新的指令调整模型 Llama2。在较长的内容中,使用 CoVe 的模型也优于 ChatGPT 和PerplexityAI,后者甚至可以为其世代收集外部事实。Cove 完全利用模型中存储的知识来工作。

研究团队展示了,利用CoVe方法,单个问题的答案包含的错误显著减少,从而可以显著改进最终的提示输出。对于政治家示例中的列表式问题,CoVe可将准确度提高一倍以上,大大降低错误率。对于更复杂的问答场景,该方法仍可带来23%的改进。即使对于长文本,CoVe也可将事实准确性提高28%。但是对于更长的内容,团队也需要检查验证答案的不一致之处。

未来,这种方法可以通过整合外部知识来改进,例如允许语言模型通过访问外部数据库来回答验证问题。总Meta的研究为减少类似ChatGPT等对话系统中的错误信息提供了新的思路。

举报

  • 相关推荐
  • 灵巧手行业当去伪存真:别让“被动自由度”话术消解工程严谨

    灵巧手作为机器人核心部件,其“自由度”本应是衡量灵活性的关键指标。然而部分厂商为营销炒作,将仅有6个执行器的产品标榜为“20自由度”,并以“6主动+14被动”等话术混淆概念。这种偷换概念的行为不仅误导客户、扰乱行业认知,更践踏了工程技术的严谨底线。真正的自由度应严格对应独立执行器数量,被动关节无法纳入可控规划。行业需回归技术初心,建立统一标准,聚焦执行器性能等硬指标,才能摆脱营销乱象,彰显精密制造的真正价值。

  • 搜狗输入法 Kuikly AI 工程化:Spec coding 的探索与落地

    本文分享了搜狗输入法团队在跨端开发框架Kuikly项目中探索AI工程化的实践经验。团队从实际需求出发,逐步沉淀出一套AI工程化方案,旨在实现需求自动关联、代码生成与效果测试的一站式AI愿景。文章指出,单纯依赖Vibe Coding模式存在需求模糊、代码质量波动等问题。为实现真正的工程化,团队从几个关键层面推进:首先,构建高质量、结构化的AI上下文文档系统,通过生成器与评估器的多轮对抗迭代,为AI提供精准的项目理解。其次,采用Spec-Kit标准化需求流程,将产品需求、设计稿转化为结构化工程文档,并由AI主导实施,使开发从“提示词即兴发挥”变为“基于明确规格的稳定执行”。实践表明,在新页面开发场景中,该模式能大幅提升效率,生成代码在架构分层、状态管理等方面符合项目要求,代码Review阶段基本无需架构返工。最后,文章展望了未来在打通D2C工具链、构建自动化验证机制以及扩展更多开发场景等方面的持续探索方向。

  • 小爱同学何时会提示手机遗忘在车内?终于懂了

    不少小米车主都好奇,车里的小爱同学到底在啥情况下,会提醒手机忘在车里了。 这次小米汽车在答网友问里把这个问题讲得明明白白,其实小爱同学的手机遗落提醒不是随便触发的,得同时满足三个条件才行: 首先车辆得处于P挡状态,这是基础前提; 其次要检测到乘客打开车门下车,而且得是手机所在位置的那一个车门,主驾落了手机就得主驾车门打开,副驾则对应副�

  • 予之文化X火山引擎:AI MediaKit+Seedance 2.0,探索品牌与电商内容工业化新路径

    当前AIGC视频生成技术正从“技术探索”迈向“规模化应用”的关键阶段。以Seedance2.0为代表的新一代视频生成模型在创意、语义理解和画面一致性等方面表现出色,并在2026年央视春晚展示了8K/50FPS超清视频的生成能力。然而,商业化落地仍面临原生分辨率不足、帧率受限、生成成本高昂等瓶颈。火山引擎推出的AI+MediaKit画质增强产品,与Seedance2.0形成“最佳拍档”,通过“低分辨率生成+智能筛选+画质增强”的分层策略,在控制成本的同时提升输出画质,助力用户完成从“可用”到“好用”的品质跃升。该方案已在电商、品牌营销等场景得到验证,为AIGC视频的规模化、高质量生产提供了可靠路径。

  • 科大国创智銮CMEF首秀收官,“智驾助行”受关注

    第93届CMEF展会进入尾声,首次参展的科大国创智能出行品牌智銮,不仅成功展示了其首款量产车型智銮S5智能助行机器人,更向外界描绘了品牌未来的发展蓝图。智銮以稳健而积极的姿态,驶入发展的快车道。其采取“国内深耕+海外拓展”的双轮驱动模式:一方面聚焦国内重点一线及新一线城市,打造集展示、体验、交付、服务于一体的渠道网络;另一方面同步启动海外市场布局,通过线上业务推进品牌的全球化战略。智銮S5凭借其创新的产品设计受到多家行业及权威媒体争相报道,其产品团队表示,初心是打造一款有品质、有温度的产品,真正帮助到出行不便的老年人、残障人士。未来,智銮将持续推动产品的迭代升级,深化其在人工智能、大数据等领域的技术积累,重塑智能出行体验。

  • 谷歌Gemini再升级!解锁新玩法:输入提示词即可生成交互式3D模型

    近日,谷歌Gemini AI推出最新升级,用户只需输入提示词,就能让聊天机器人生成交互式3D模型和实时模拟。 这一新功能支持多种互动操作,包括旋转模型、拖动滑块调整参数或输入数值改变模拟结果。 例如,用户询问月球绕地球轨道时,Gemini会创建一个3D模型,并提供轨道速度滑块、路径线切换开关以及暂停按钮。

  • 聚焦AI+视听!itc保伦股份邀您相约2026北京InfoComm China展,共赴行业视听盛会

    北京InfoComm China 2026展会将于4月15日至17日在北京国家会议中心举行,标志着该品牌迎来二十周年里程碑。本届展会将汇聚全球400家参展企业,吸引超26,000名专业观众,集中展示AI技术应用、沉浸式体验、专业音视频与显示创新等前沿领域的最新成果。国内音视频系统解决方案服务商itc保伦股份将携六大场景展区及超15款明星产品亮相E3馆01展位,聚焦指挥中心、会议室等核心场景,呈现AI指挥调度、视频分析、智慧安防等一体化解决方案,并展示一系列行业前沿的音视频系统矩阵。展会还将提供详细的交通指南、周边酒店推荐及北京旅游攻略,方便参展观众规划行程。

  • 标杆力量!itc保伦股份荣膺双品工程“品牌引领·标杆企业”!

    近期,双品工程品牌建设委员会公布多项年度荣誉,ITC保伦股份凭借深厚行业积累、持续创新研发、卓越产品品质与广泛市场影响力,成功获评“品牌引领·标杆企业”称号。ITC自1993年创立以来,坚持自主创新,每年投入超亿元研发,已构建覆盖全生命周期的系统化品牌运营体系,为智慧教育、政务、文旅、医疗等多领域提供解决方案。公司拥有大量专利,主导参与多项标准制定,推动产业升级。目前,ITC全球合作伙伴超5万家,成功案例超150万,品牌价值达131.96亿元,彰显国产领军品牌实力。未来,ITC将继续深化品牌建设,加大技术攻关,打造具有国际竞争力的灯光音响产业体系,为全球客户提供更优质、智能的解决方案。

  • 售后工程师的“远程救命”工具哪家强?2026五款方案横评

    对于软件厂商、智能硬件企业、连锁品牌、ToB 服务型企业而言,售后技术支持一直是决定客户满意度、控制服务成本的核心环节。相信不少企业都遇到过这些困境:客户的设备/软件突发故障,工程师跨省上门往返要两三天,差旅成本高,客户等待时间长,服务口碑直接受损;面对零基础的终端客户,电话、视频指导根本说不清楚操作步骤,来回沟通几小时都解决不了一个小问题;

  • ClimeCo副总裁携团队专程来华到访碳企通,战略合作迈入新阶段

    2026年3月24日,美国碳管理与碳中和解决方案机构ClimeCo的副总裁Linda Kelly率产品认证团队访问碳企通(CarbonPass)深圳总部,双方进行了深度交流。此次访问标志着双方三年深度合作的重要里程碑,碳企通正式被授予ClimeCo一级代理(最高等级)和战略合作伙伴资质。双方围绕碳中和认证、产品级减排路径设计、国际认证体系对接及跨境电商绿色合规解决方案持续深化合作,逐步升级为覆盖认证、数据、供应链与市场应用的全链路协同体系。碳企通展示了其基于区块链、人工智能与大数据的数字化碳管理平台,帮助跨境卖家及制造企业顺利通过多项国际绿色认证,尤其在亚马逊气候承诺友好(CPF)认证领域形成成熟的数字化解决方案。未来,双方将继续携手完善碳中和认证与绿色合规体系,助力中国跨境企业构建全球绿色供应链竞争力。

今日大家都在搜的词: