UC伯克利研究人员推出Ghostbuster:用于检测 LLM 生成文本的进 AI 方法

2023-11-21 16:23 · 稿源：站长之家

划重点:
🔍 加州大学伯克利分校的研究人员开发了一种名为 Ghostbuster 的新方法，用于检测 LLM 生成的文本。
🧠 Ghostbuster 使用结构化搜索和线性分类的三阶段训练过程，表现出强大的性能。
📈 Ghostbuster 在不同数据集上均表现出色，优于 DetectGPT 和 GPTZero。

站长之家（ChinaZ.com）11月21日消息:LLM，如 ChatGPT，可以轻松地产生各种流利的文本，但是它们的准确性有多高呢?语言模型容易产生事实错误和幻觉，这让读者在决定是否相信一个信息来源时知道是否使用了这些工具来做新闻文章或其他信息文本的幽灵写作。这些模型的发展也引发了对文本的真实性和原创性的担忧，许多教育机构也限制了 ChatGPT 的使用，因为内容很容易生成。

目前存在许多用于检测 LLM 是否生成内容的框架，如 DetectGPT 和 GPTZero。然而，这些框架在原本未经评估的数据集上的性能有所下降。

近日，加利福尼亚大学伯克利分校的研究人员推出了一种名为Ghostbuster的先进人工智能方法，旨在检测大型语言模型（LLM）生成的文本。这一方法基于结构化搜索和线性分类，通过三个阶段的训练过程，名为概率计算、特征选择和分类器训练，取得了显著的性能提升。

Ghostbuster首先将每个文档转换为一系列向量，通过在一系列语言模型下计算每个令牌的概率来实现。接下来，它通过在向量和标量函数空间上运行结构化搜索过程，选择特征。这些特征通过定义一组操作，将这些概率结合起来，并运行前向特征选择。最后，Ghostbuster在最佳的基于概率的特征和一些额外手动选择的特征上训练一个简单的分类器。

Ghostbuster的分类器是根据通过结构化搜索选择的基于概率的特征和基于词长和最大令牌概率的七个额外特征的组合进行训练的。这些其他特征旨在包含观察到的关于人工智能生成文本的定性启发。

在性能方面，Ghostbuster在训练和测试数据集相似性方面表现稳健。在所有条件下，Ghostbuster的F1分数平均达到97.0，比DetectGPT高出39.6，比GPTZero高出7.5。

Ghostbuster 在除创意写作领域以外的所有领域中优于 RoBERTa 基线，而 RoBERTa 的越域表现要差得多。F1分数是一种常用的衡量分类模型性能的指标。它将精确度和召回率结合成一个单一的值，特别适用于处理不平衡的数据集。

Ghostbuster的出现填补了在非原始评估数据集上性能不佳的检测框架的空白，为更可靠地判断LLM生成文本的真实性提供了新的工具。这对于那些依赖于AI生成内容做出决策的用户来说，具有重要的意义。

论文网址:https://arxiv.org/abs/2305.15047

官网博客:https://bair.berkeley.edu/blog/2023/11/14/ghostbuster/

（举报）

相关推荐

关键词：

荐泡泡玛特不止一个LABUBU

不可否认，在本周举办的泡泡玛特中期业绩发布会上，LABUBU依然是最引人瞩目的话题中心。THE MONSTERS系列2025H1收入达到48.1亿元，同比增长668%，新品MINI LABUBU即将发售的消息也在海内外社媒引发巨大反响。尽管位列所有IP第一，THE MONSTERS系列在总收入中的占比也刚刚接近35%。2025年H1，泡泡玛特自有IP中有5个收入超10亿，收入过亿的IP更是达到13个，这其中有MOLLY这样历经十数年的�

泡泡玛特 LABUBU THE
罗永浩官宣明日将公布TBT项目号称九年磨一面

今日，罗永浩在微博上发布重磅消息，宣称“TBT终于要上了!”他感慨道，九年来赛道虽变，但自己一直特别想给新赛道带来不一样的创新，还表示要“重构你对泡面的想象，明天见”，引发网友广泛关注与猜测。

罗永浩 TBT项目科技圈
荐王宁掏出迷你版LABUBU

“这周就要发布Mini版LABUBU，以前可能大家是挂在包上，可能从下周开始，大家甚至可以挂在手机上，它的使用场景会更多，相信它会是一个超级受欢迎的爆款。” 8月20日，在泡泡玛特2025年中期业绩发布会上，泡泡玛特董事长兼CEO王宁化身“带货博主”，从胸前西装口袋中拿出了一个Mini版LABUBU介绍道。这款即将登场的 Mini 版 LABUBU 仅有掌心大小，延续了LABUBU标志性的搪胶毛�

泡泡玛特 LABUBU Mini版LABUBU
迷你LABUBU开售后卖爆多平台已售罄：电商平台销量破百万

昨晚22时整，泡泡玛特旗下备受瞩目的迷你版LABUBU系列新品正式开售，迅速点燃了消费者的热情。该系列单个盲盒定价79元，若整套购买则需1106元。其中，主打款心底密码系列搪胶毛绒挂件盲盒更是成为抢购焦点，上线瞬间即被抢购一空。不少网友提前守候在购买页面，准备第一时间抢购。然而，当时间一到，小程序页面迅速显示“太火爆了”，随后便提示商品已售罄，让众�

泡泡玛特 LABUBU系列盲盒
泡泡玛特王宁：本周将发布迷你版LABUBU

昨日，泡泡玛特公布了其2025年中期业绩报告，数据显示，报告期内公司收益高达138.76亿元，与去年同期相比增长了204.4%，业绩表现十分亮眼。在今日举行的泡泡玛特2025年中期业绩会上，创始人兼CEO王宁对公司未来发展充满信心。他透露，原本公司希望今年营收能够达到200亿，但就目前情况来看，实现300亿的营收目标也颇为轻松。

泡泡玛特业绩报告 IP收入
荐中国UP主成为不了MrBeast

影视飓风创始人Tim刚刚结束的“100小时荒岛直播挑战”，无疑是一次B站在这个夏天难得的现象级事件——B站累计超过四千万观众进入直播间，全平台总观看量超过两亿，弹幕数以百万计，甚至带动了直播带货的即时转化。从数据到热搜，此次直播堪称完美演绎了“爆款”的逻辑。质疑声同样随之而来:这场直播与其说是“荒岛生存”，不如说是“带电度假”;也评论认为，它

影视飓风荒岛直播 B站直播
Matrixport 旗下 Cactus Custody 与 OnChain 合作，完成招银国际美元货币市场基金化上链

新加坡Matrixport旗下合规数字资产托管商Cactus Custody与OnChain合作，将招商国际美元货币市场基金以化形式上链运营，成为全球首只港新互认基金上链案例。该合作解决市场缺乏可审计、可托管的现金类资产等痛点，通过链上净值计算、白名单管理等机制，为机构与合格投资者提供透明、合规的链上投资选项。未来双方将持续深化合作，推动RWA标准化发展。

数字资产托管 RWA上链港新互认基金
从“手动挡”进入“AI智能挡”：亚数TrustAsia 开启证书管理「服务化」CaaS 新时代

随着TLS/SSL证书有效期缩短至47天，企业面临信任中断风险加剧、内部系统协同困难及预警监测缺失三大挑战。亚数TrustAsia推出新一代智能证书管理体系TrustAsia CaaS，通过自动化流程实现证书全生命周期管理，提供六大核心能力：资产发现与管理、多CA自动化签发、自动化分发部署、实时监测告警、无缝集成定制及全流程自动化，有效应对加密敏捷性需求，助力企业构建安全可信�

数字化转型 TLS/SSL证书网络安全
华人风投登上《时代》VC榜单：Foothill入选全美顶尖VC，前沿科技投资力量凸显

Statista与《时代》杂志联合发布“美国顶尖350家风投机构”榜单，从全美逾万家机构中筛选出前3.5%，涵盖募资能力、投资管理能力、基金回报等关键指标。榜单呈现A16z、Greylock等老牌基金，同时凸显Foothill Ventures等新兴力量，反映美国风投格局日益多元化，包括移民、女性及学者创业等新趋势。

风险投资 A16z Greylock
8TB登场三星 9100 PRO PCIe 5.0 固态硬盘，性能规格上新

三星电子于2025年8月20日推出9100PRO系列8TB固态硬盘，包括标准版和散热片版。新品采用PCIe 5.0接口，顺序读写速度分别高达14,800MB/s和13,400MB/s，相比前代990PRO性能提升99%。支持多设备兼容，包括笔记本电脑、游戏主机等，适用于游戏、内容创作等高性能场景。8TB版本将于9月2日发售，建议零售价分别为999.99美元和1019.99美元。

固态硬盘 PCIe5.0 三星电子

今日大家都在搜的词：

热文

3 天
7天

UC伯克利研究人员推出Ghostbuster:用于检测 LLM 生成文本的进 AI 方法

荐泡泡玛特不止一个LABUBU

罗永浩官宣明日将公布TBT项目号称九年磨一面

荐王宁掏出迷你版LABUBU

迷你LABUBU开售后卖爆多平台已售罄：电商平台销量破百万

泡泡玛特王宁：本周将发布迷你版LABUBU

荐中国UP主成为不了MrBeast

Matrixport 旗下 Cactus Custody 与 OnChain 合作，完成招银国际美元货币市场基金化上链

从“手动挡”进入“AI智能挡”：亚数TrustAsia 开启证书管理「服务化」CaaS 新时代

华人风投登上《时代》VC榜单：Foothill入选全美顶尖VC，前沿科技投资力量凸显

8TB登场三星 9100 PRO PCIe 5.0 固态硬盘，性能规格上新

今日大家都在搜的词：

热文

首发iPhone 17系列！苹果Apple Store官方旗舰店入驻抖音商城

华为MatePad Mini外观公布支持蜂窝网络通话功能

抖音升级AI内容标识功能上线两项核心功能

特斯拉Model 3长续航后轮驱动版降价1万元售价25.95万起

AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃

小米汽车8月交付量超3万台全年交付量有望冲击42万

零跑汽车8月交付57066台增长超88%

小鹏汽车：8月共交付新车37709台单月交付量创历史新高

苹果上架翻新版Apple Pencil Pro售价849元

苹果首款折叠iPhone或不会采用屏下指纹将于明年发布

华为MatePad Mini官宣9月4日发布

2025民营企业500强揭晓：京东第一

SpaceX第10次试飞成功马斯克：星舰这次没有空中爆炸

小米澎湃OS3发布会官宣首批Beta版招募机型公布

今日七夕节微信 520 元大额红包限时上线

AI日报：字节视频模型Waver 1.0发布；百度AI搜索APP“梯子AI”

AI日报：字节OmniHuman-1.5发布；PixVerse V5模型上线；腾讯

realme真我15000mAh电池容量手机亮相

首发iPhone 17系列！苹果Apple Store官方旗舰店入驻抖音商城

华为三折叠屏手机Mate XTs非凡大师上架开启预约

站长商机