首页 > 业界 > 关键词  > Ghostbuster最新资讯  > 正文

UC伯克利研究人员推出Ghostbuster:用于检测 LLM 生成文本的进 AI 方法

2023-11-21 16:23 · 稿源:站长之家

划重点:

🔍 加州大学伯克利分校的研究人员开发了一种名为 Ghostbuster 的新方法,用于检测 LLM 生成的文本。

🧠 Ghostbuster 使用结构化搜索和线性分类的三阶段训练过程,表现出强大的性能。

📈 Ghostbuster 在不同数据集上均表现出色,优于 DetectGPT 和 GPTZero。

站长之家(ChinaZ.com)11月21日 消息:LLM,如 ChatGPT,可以轻松地产生各种流利的文本,但是它们的准确性有多高呢?语言模型容易产生事实错误和幻觉,这让读者在决定是否相信一个信息来源时知道是否使用了这些工具来做新闻文章或其他信息文本的幽灵写作。这些模型的发展也引发了对文本的真实性和原创性的担忧,许多教育机构也限制了 ChatGPT 的使用,因为内容很容易生成。

目前存在许多用于检测 LLM 是否生成内容的框架,如 DetectGPT 和 GPTZero。然而,这些框架在原本未经评估的数据集上的性能有所下降。

近日,加利福尼亚大学伯克利分校的研究人员推出了一种名为Ghostbuster的先进人工智能方法,旨在检测大型语言模型(LLM)生成的文本。这一方法基于结构化搜索和线性分类,通过三个阶段的训练过程,名为概率计算、特征选择和分类器训练,取得了显著的性能提升。

image.png

Ghostbuster首先将每个文档转换为一系列向量,通过在一系列语言模型下计算每个令牌的概率来实现。接下来,它通过在向量和标量函数空间上运行结构化搜索过程,选择特征。这些特征通过定义一组操作,将这些概率结合起来,并运行前向特征选择。最后,Ghostbuster在最佳的基于概率的特征和一些额外手动选择的特征上训练一个简单的分类器。

Ghostbuster的分类器是根据通过结构化搜索选择的基于概率的特征和基于词长和最大令牌概率的七个额外特征的组合进行训练的。这些其他特征旨在包含观察到的关于人工智能生成文本的定性启发。

在性能方面,Ghostbuster在训练和测试数据集相似性方面表现稳健。在所有条件下,Ghostbuster的F1分数平均达到97.0,比DetectGPT高出39.6,比GPTZero高出7.5。

Ghostbuster 在除创意写作领域以外的所有领域中优于 RoBERTa 基线,而 RoBERTa 的越域表现要差得多。F1分数是一种常用的衡量分类模型性能的指标。它将精确度和召回率结合成一个单一的值,特别适用于处理不平衡的数据集。

Ghostbuster的出现填补了在非原始评估数据集上性能不佳的检测框架的空白,为更可靠地判断LLM生成文本的真实性提供了新的工具。这对于那些依赖于AI生成内容做出决策的用户来说,具有重要的意义。

论文网址:https://arxiv.org/abs/2305.15047

官网博客:https://bair.berkeley.edu/blog/2023/11/14/ghostbuster/

举报

  • 相关推荐
  • AI日报:扣子空间开放测试;腾讯混元开源视频生成工具HunyuanCustom;阿里开源大模型搜索引擎ZeroSearch

    本文汇总了近期AI领域多项重要进展:1)扣子空间开放测试,无需邀请码即可体验AI协作平台;2)腾讯推出HunyuanCustom视频生成工具,实现音视频同步编辑;3)阿里巴巴ZeroSearch技术降低AI训练成本88%;4)OpenAI新增GitHub连接器,强化代码分析功能;5)联想发布天禧个人超级智能体,具备感知交互能力;6)OpenAI在亚洲推出数据驻留计划;7)Multiverse发布全球首款AI生成多人游戏;8)秘塔AI上线"讲题"功能辅助家长辅导;9)Genspark推出智能电子表格工具AI Sheets;10)Google Gemini API新增缓存功能可节省75%成本;11)PixVerse v4视频生成速度质量双提升;12)快手推出内容净化器KuaiMod;13)英伟达开源新一代OCR代码推理模型。这些创新覆盖AI应用、开发工具、成本优化等多个维度,展现了AI技术的快速发展和广泛应用。

  • 技嘉正式推出 RTX™ 5060 Ti 和 5060 显卡,先进散热方案提升游戏与 AI 体验

    北京时间 2025 年 4 月 15 日技嘉科技(GIGABYTE)今(15)日宣布正式推出搭载 NVIDIA Blackwell 架构的 GeForce RTX™ 5060 Ti 与GeForce RTX™ 5060 系列显卡,并将于 4 月 16 日起陆续上市。此系列产品专为主流游戏玩家、创作者与 AI 入门使用者设计,通过升级版 WINDFORCE 散热系统,在性能与散热效率间达到绝衡,带来更流畅的游戏与多任务体验。新升级的WINDFORCE 散热方案通过提升风量、减少扰流与�

  • ChatGPT上线图库功能:可管理AI生成图片

    快科技4月16日消息,据报道,OpenAI近日宣布将为ChatGPT推出全新的Image Library图库功能,该功能将帮助用户更高效地管理和查看AI生成的图像。这项创新功能将逐步向所有用户开放,包括移动端和网页端的免费版、Plus版及Pro版用户。新功能的设计充分考虑了用户体验的便捷性。用户只需点击ChatGPT侧边栏的Library入口,就能进入一个直观的图像网格界面。在这个界面中,用户可以轻�

  • GPTBots 集成阿里通义千问 3.0,持续为企业提供顶尖 AI 服务

    GPTBots.ai平台宣布完成与阿里通义千问3.0系列模型的技术集成,成为企业级AI智能体构建领域的标杆平台。该平台通过混合推理架构和多语言交互技术,支持119种语言服务,覆盖全球主要市场。平台提供双模式智能任务处理:针对复杂业务场景的"深度思考"模式,以及高频咨询的"即时响应"模式。搭载Qwen-3-235B旗舰模型和Qwen-3-30B轻量版,在代码生成、数学推理等核心能力上达到行业顶尖水平。平台实现与企业ERP、CRM等系统的无缝对接,推动数据价值变现。通过标准化流程自动化、全球化服务等核心价值,帮助企业提升运营效率70%、降低客服成本70%,并实现数据驱动的决策升级。

  • AI日报: OpenAI推出gpt-image-1图像生成API;纳米AI发布MCP万能工具箱;中国占全球AI专利60%

    【AI日报】栏目聚焦人工智能领域最新动态:1) OpenAI推出ChatGPT图像生成API,开发者可轻松集成AI绘图功能,已生成超7亿张图片;2) 谷歌Gemini月活用户突破3.5亿,但仍落后于ChatGPT的6亿用户;3) OpenAI预测2029年收入将达1250亿美元,AI代理业务成主要增长点;4) Ostris发布8B参数扩散模型Flex.2-preview,优化ComfyUI工作流;5) 英伟达推出多模态LLM模型Describe Anything,支持指定区域生成详细描�

  • 英伟达将首次在美制造 AI 超算、及 Blackwell 芯片

    站长之家(ChinaZ.com) 4月15日 消息:随着 AI 行业的蓬勃发展,英伟达位于美国的人工智能芯片和超 级计算机工厂将创造数千个就业机会。科技巨头英伟达(NVIDIA)宣布,其 AI 超 级计算机将完全在美国本土生产。在全球贸易战的背景下,英伟达这一举动是为了减少对海外市场的依赖,并促进美国国内的生产。英伟达确认,他们已开始在台积电位于美国亚利桑那州凤凰城的工厂生产�

  • AI把debug时间缩短到几分钟,Lightrun获7000万美元B轮融资

    2025年AI编程浪潮持续升温,OpenAI拟30亿美元收购AI编程助手公司Windsurf,Cursor母公司Anysphere获9亿美元融资。AI生成代码的可靠性引发关注,Lightrun公司推出Runtime Autonomous AI Debugger工具,可在IDE中精确定位问题代码并提供修复建议,将调试时间从数天缩短至几分钟。该公司近期完成7000万美元B轮融资,总融资达1.1亿美元。AI编程工具市场规模预计2032年达300亿美元,但AI生成代码的可靠性问题亟待解决。Lightrun的解决方案让开发者能在软件上线前发现并修复bug,防患于未然。

  • 微软CEO:公司多达 30% 的代码是由 AI 生成的!

    微软首席技术官凯文·斯科特(Kevin Scott)曾表示,预计到 2030 年,将有 95% 的代码是由 AI 生成的……

  • 网易数帆携手人民中科,联合发布首款可信ChatBI一体机

    近日,网易数帆与人民中科联合发布了行业内首款可信ChatBI一体机,为政府机构、高等院校、国央企等客户提供安全可靠的本地化智能办公方案,推动智能应用在关键业务的深度落地。01强强联合,打造自主可控的智能办公新设施在数字化转型加速的背景下,政企客户对数据安全与智能化办公的需求持续升级。为此,网易数帆与人民中科依托双方在AI大模型、高性能计算及信息�

  • MCP商店平台推荐 ​AIbase推出MCP Store应用商店

    AIbase宣布推出一个专注于ModelContextProtocol技术的资源网站,网址为https://www.aibase.com/zh/repos/topic/mcp。该网站旨在汇聚与MCP相关的热门GitHub仓库,为开发者提供一个探索最新开发趋势和创新的平台,助力开发者更好地了解和应用MCP技术。如果你对MCP技术感兴趣,希望在AI与数据系统融合的领域中探索更多可能,强烈推荐你访问AIbaseMCP资源网站。