首页 > AI头条  > 正文

​研究揭示商业检测工具 Pangram 在 AI 文本检测中的卓越表现

2025-11-03 10:15 · 来源: AIbase基地

最近,芝加哥大学的一项研究揭示了市场上各类商业 AI 文本检测工具的显著差异。研究人员构建了一个包含1992篇人类撰写文本的数据集,涵盖亚马逊产品评论、博客文章、新闻报道、小说摘录、餐厅评论和简历等六种类型。同时,他们使用了四种领先的语言模型:GPT-41、Claude Opus4、Claude Sonnet4和 Gemini2.0Flash,生成了相应的 AI 写作样本。

为了比较这些检测工具的性能,研究团队主要跟踪了两个指标。假阳性率(FPR)用于衡量人类文本被错误标记为 AI 生成的频率,而假阴性率(FNR)则显示 AI 文本未被检测到的比例。在这次直接对比中,商业检测工具 Pangram 表现出色。对于中长文本,Pangram 的 FPR 和 FNR 几乎为零;在短文本方面,错误率也普遍低于0.01,唯有 Gemini2.0Flash 在餐厅评论中的 FNR 为0.02。

image.png

其他检测工具如 OriginalityAI 和 GPTZero 表现稍逊,虽然在较长文本上表现良好,FPR 保持在0.01以下,但在极短文本方面却不尽如人意。此外,它们对将 AI 文本伪装成人类写作的 “人性化” 工具也较为敏感。

Pangram 在识别 AI 生成文本方面表现出色,所有四种模型生成的文本 FNR 均未超过0.02。相比之下,OriginalityAI 的表现则受生成模型的影响更大,而 GPTZero 在模型选择上表现更为稳定,但仍不及 Pangram。

研究人员还测试了各检测工具对抗 StealthGPT 工具的能力,该工具能让 AI 生成的文本更难被检测。Pangram 在这些情况下表现较为稳健,而其他检测工具则面临较大挑战。

在经济效益方面,Pangram 的平均识别成本为每个正确识别的 AI 文本0.0228美元,约为 OriginalityAI 的一半和 GPTZero 的三分之一。研究提出了 “政策上限” 的概念,用户可以设定最大可接受的假阳性率,以便更好地调节检测工具。

image.png

研究团队警告,这些结果仅是当前形势的一个快照,未来将在检测工具、新 AI 模型和规避工具之间展开一场 “军备竞赛”。他们建议定期进行透明的审计,以跟上这一快速变化的领域。

项目:https://pangram.ai/

划重点:

🌟 Pangram 在检测准确性方面表现卓越,假阳性和假阴性率几乎为零。  

📊 其他工具在处理短文本时存在困难,Pangram 在识别 AI 生成文本方面更具优势。  

💰 Pangram 的识别成本最低,经济效益显著,为用户提供了实用的选择。

  • 相关推荐
  • GEO排名查询工具实测:如何监控你的品牌在AI搜索中的表现

    在为SaaS公司进行内容审计时发现,虽然官网在Google排名前三,但在ChatGPT和豆包等AI搜索平台询问"推荐项目管理工具"时却未被提及。这揭示了传统SEO与AI搜索排名的差异:AI搜索更看重内容权威性、信息新鲜度和结构化程度,而非外链和关键词密度。数据显示,58.5%的Google搜索为零点击,ChatGPT日查询量超10亿,AI搜索正分流传统流量。建议企业使用AIBase等工具监控多平台曝光数据,通过优化高质量内容提升AI搜索排名,尤其适合ToB企业、教育机构和本地服务商。

  • AI搜索优化工具推荐:如何免费检测品牌在AI回答中的可见度?

    随着AI搜索崛起,71%美国用户通过AI研究购买决策,ChatGPT日查询超10亿次。传统SEO面临挑战:58.5%谷歌搜索已成"零点击",用户看完AI摘要即离开。品牌若未进入AI推荐列表,将失去新流量入口。建议使用AIBase等工具监控国内五大AI平台曝光数据,重点关注高价值问题下的推荐质量,通过可视化数据优化内容策略,建立GEO(生成引擎优化)闭环。

  • 免费!AI对话式搜索词挖掘工具,一键检测品牌在AI搜索中的可见度

    本文探讨在AI搜索时代如何提升品牌、产品或内容的AI推荐可见度。关键在于挖掘AI对话式搜索词并优化内容,避免因未被AI抓取或排名靠后导致流量损失。推荐使用AIBase平台的GEO排名查询工具,免费检测品牌在主流AI搜索中的曝光度、排名及竞品对比,并提供优化建议,帮助抢占AI流量高地。该工具覆盖多平台,操作简单,适合企业、内容创作者及电商使用。

  • 免费 AI 可见度检测器工具推荐:监控你品牌在生成式搜索中的曝光

    AI搜索时代,58.5%的Google搜索已成"零点击",ChatGPT日查询超10亿次。品牌若未出现在AI工具推荐中,将错失新流量入口。文章提出GEO(生成引擎优化)概念,强调需监控品牌在豆包、DeepSeek等AI平台的曝光排名,并推荐AIBase工具实现数据可视化。建议企业建立监测基线,聚焦高价值问题优化内容,形成"监控-优化-验证"闭环,抢占AI推荐流量先机。

  • 免费神器!一键检测你的内容在AI搜索中的可见度,抢占品牌曝光先机

    文章指出AI搜索时代,品牌若未被ChatGPT、文心一言等主流AI模型抓取推荐,将面临流量流失、品牌曝光下降及营销成本增加的风险。为解决这一问题,推荐使用AIBase平台的免费GEO排名查询工具,可检测品牌在各大AI搜索中的可见度、排名及竞品对比,并提供优化建议,帮助提升AI曝光率,抢占流量高地。

  • GEO查询工具指南!这个免费方法可以检测你的品牌是否出现在AI回答中了

    文章指出AI搜索正取代传统搜索,63%年轻用户习惯直接询问AI。若品牌未被AI推荐,将失去潜在客户。传统手动测试存在样本量小、平台覆盖不全等缺陷。推荐使用AIBase的免费GEO查询工具,可一键检测在ChatGPT等主流平台的品牌提及率、排名及竞品对比。通过优化官网信息、增加结构化数据和第三方提及,能在1-2月提升AI可见度。强调GEO优化是持续过程,需定期复测迭代。

  • 绘王发布Kamvas Pro 24(Gen3)数位屏,色彩表现力大升级

    10月22日,绘王发布旗舰级数位屏新品Kamvas Pro 24(Gen3)。该产品配备23.8英寸4K屏幕,采用第三代防眩光玻璃,支持五种专业色彩模式,色准Delta E<1且提供出厂校色报告。标配双支压感笔,支持1.6万级压感与十点触控,兼容Windows/macOS系统,满足专业创作需求。

  • GEO排名怎么查?手把手教你检测品牌AI能见度,附最全工具推荐

    随着AI问答助手成为新信息入口,GEO(生成引擎优化)概念迅速崛起。文章指出手动查询GEO排名存在效率低、结果主观、缺乏数据支撑等痛点,并推荐使用AIBase等专业工具。这类工具支持多平台覆盖、模拟真实提问场景,能量化分析品牌提及频率、排名位置及竞品对比,同时提供内容优化建议。通过定期检测,企业可有效追踪AI可见度变化,针对性提升品牌在智能对话中的竞争力。

  • AI排名查询工具推荐:如何查询竞争对手在AI回答中的曝光

    AI搜索时代品牌面临新挑战:用户直接询问AI工具推荐,若品牌未被提及将流失流量。数据显示,2024年58.5%的谷歌搜索为零点击,ChatGPT日均查询超百亿次。AI推荐高度集中,平均每次仅引用2-7个品牌。建议使用专业GEO监控工具(如AIBase)追踪主流AI平台曝光情况,及时优化内容策略。核心逻辑已从“让用户搜到你”转变为“让AI推荐你”。

  • 国内首个!海尔智家获评TÜV认可智能家电检测免目击实验室

    海尔全球检测中心近日通过TÜV莱茵2025年度认证评审,升级为免目击实验室。这是国内首个在智能家电检测领域获此资质的企业,标志着其检测实力获国际权威认可。该资质可大幅缩短认证周期,提升产品上市效率,助力企业抢占市场先机。海尔还拥有CNAS、UL等多项国际认证,实现检测数据互认,未来将持续创新检测技术,为全球用户提供更优质产品体验。

今日大家都在搜的词: