首页 > AI头条  > 正文

Patronus AI 推出 Percival:一分钟诊断百步代理链中的隐藏故障

2025-05-15 09:28 · 来源: AIbase基地


随着企业越来越多地部署自主运行的 AI 代理系统,对这些复杂系统的监控与调试需求也迅速增长。总部位于旧金山的 AI 安全公司 Patronus AI 今日发布了其最新产品 Percival,一个能够自动识别 AI 代理系统中故障模式并提出修复建议的监控平台。

“Percival 是业界首个可以自动追踪代理轨迹、识别复杂故障,并系统化输出修复建议的智能代理。” Patronus AI CEO 兼联合创始人 Anand Kannappan 在接受 VentureBeat 独家采访时表示。

解决 AI 代理“不可控”的现实挑战

与传统机器学习不同,AI 代理能够自主执行包含多个阶段的大规模操作流程。但正是这种“多步骤自治”让故障调试变得极为棘手:一个早期小错误可能在后续流程中演变成严重偏差,而多代理协同场景更是加剧了这种复杂性。

Percival 针对这种痛点设计,能识别四大类超过20种常见故障,包括推理错误、执行错误、规划失调、特定领域错误等。更重要的是,它并非“事后诸葛”,而是主动监控整个代理轨迹,具备“情景记忆”能力,能够理解错误在具体上下文中的来龙去脉。

“Percival 本身也是一个 AI 代理,因此不像传统评估器那样静态判断,而是可以在系统级别追踪和学习故障演变路径。” Patronus 研究员 Darshan Deshpande 说。

全息投影 机器人设计 (2)

图源备注:图片由AI生成,图片授权服务商Midjourney

从一小时到一分钟:调试效率显著提升

在实际应用中,Percival 显著提升了故障分析效率。Patronus 表示,其早期客户已将调试复杂代理流程的时间从约1小时压缩到 1至1.5分钟,极大缓解了工程团队的运维负担。

为了标准化评估能力,Patronus 还同步发布了 TRAIL 基准测试(跟踪推理与代理问题定位),结果显示,即使是目前最强的模型,在该测试中的得分也仅为11%。这凸显了对专业 AI 监管工具的迫切需求。

企业级部署与集成:高复杂代理的安全护栏

Percival 已获得包括 Emergence AI 和 Nova 在内的多个客户采用。Emergence AI 致力于开发“代理创建代理”的系统,其 CEO Satya Nitta 表示,Percival 为实现大规模自治系统的可控性提供了关键保障。

Nova 则在利用 Percival 构建一个 AI 驱动的平台,帮助企业实现 SAP 系统迁移与旧代码集成,其代理系统流程多达上百步,复杂度远超人工可控范围。

Percival 可无缝集成 Hugging Face Smolagents、Langchain、Pydantic AI、OpenAI Agent SDK 等主流框架,覆盖广泛的代理开发生态。

AI 安全和监管赛道加速升温

随着 AI 技术快速商用化,企业每天生成的 AI 流程可能包含数十亿行代码。Kannappan 指出:“系统正变得越来越自主,而人类监督能力却远未跟上。”

Percival 的推出,正是在这个背景下填补监管空白。据分析师预测,AI 监管工具市场将随着代理系统普及迎来爆发式增长,Patronus AI 正以企业级产品切入这一高利润率赛道。

  • 相关推荐
  • 一分钟15元,花钱“晒黑”的年轻人,捧红“性感”生意

    “夏天怎么晒才能打造完美小麦色?” 随着徒步、溯溪和骑行等户外运动的火热与普及,“一白遮百丑,一黑毁所有”的传统概念被不少人抛弃,有着阳光照射痕迹的肤色成了户外生活的勋章,无数曾经为了防晒狂买装备、出门拿个快递也要把自己裹得严严实实的年轻人,纷纷爱上了晒太阳,只求拥有一身黑得发亮的小麦色皮肤。

  • 苹果Apple Store教育优惠支持支付宝认证:3步搞定 买Mac/iPad更便宜

    日前,支付宝宣布,苹果Apple Store教育优惠支持支付宝认证。 大学生和在职教师,在购买Mac、iPad 等产品时,可通过支付宝快速完成教育认证,享受Apple专属教育优惠。 支付宝表示,该认证方式在Apple Store零售店、在线教育商店及天猫官方旗舰店均可使用。 支付宝认证方式很简单,仅需3步就能搞定。 第1步:学生打开支付宝搜学生认证”,教职工可搜索芝麻名片”;

  • 华为旗舰平板MatePad Pro 12.2今日发布

    今日下午,华为将正式发布MatePad Pro12.22025款平板电脑,该机目前已在官网开启销售。作为华为平板系列的又一力作,MatePad Pro12.2提供了普通版和柔光版两种选择,并配备12GB内存与256GB/512GB两种存储组合,满足用户多样化的需求。在配色方面,该机推出了砚黑、宣白、飞天青三款时尚配色,供消费者挑选。

  • 华为MatePad Pro 12.2亮相 首款全面搭载鸿蒙5的平板

    今日,全新华为MatePad Pro 12.2正式发布,这是首款全面搭载鸿蒙操作系统5的平板,让平板拥有像电脑一样的生产力体验。 华为MatePad Pro 12.2不仅支持剪映专业版,还适配WPS Office、万兴脑图、中望CAD等多款鸿蒙电脑同款应用。 1:1还原了桌面端的界面布局与核心功能,实现流畅丝滑的操作体验。

  • AI日报:字节将发布AI编程工具TRAE2.0版本;Mistral重磅推出音频模型Voxtral;月之暗面回应Kimi K2 API速度慢

    AI日报栏目聚焦AI领域最新动态:1)字节跳动将发布TRAE 2.0编程工具,新增语音交互功能;2)Mistral推出开源音频模型Voxtral,支持多语言;3)月之暗面回应Kimi K2API速度慢问题,正在优化系统;4)昆仑万维发布AgentOrchestra框架,实现多智能体协作;5)OpenAI前CTO创立的Thinking Machines Lab获20亿美元融资;6)Kimi-2上线,性能超越GPT-4.1;7)TRAE推出Kimi-K2模型服务,国际版支持Grok-4;8)字节跳动Seed�

  • AI日报:12306 MCP Server上线;百度推AI搜索助手Tizzy.ai;ChatGPT录音模式面向Plus用户开放

    【AI日报】今日AI领域重要动态:1)百度推出无广告智能搜索助手Tizzy.ai,整合影视资源与深度思考功能;2)12306开源火车票查询引擎上线,采用FastAPI架构实现秒级响应;3)ChatGPT向Plus用户全面开放录音功能,支持实时记录与内容总结;4)开源SaaS模板FireGEO助力快速构建现代化Web应用;5)国产工具ReadMeX可一键生成高质量GitHub文档;6)百度AI助手新增视频通话功能,支持方言识别;7)Jacky

  • 新iPad Pro将配备前置双摄像头:横屏竖屏都能用

    据爆料,苹果将在下半年发布的新款iPad Pro M5将配备两颗前置摄像头,解决当前M4版本单摄像头在竖屏模式下体验不佳的问题。新机将搭载基于台积电3nm工艺的M5芯片,首次采用SoIC封装技术实现3D堆叠,带来性能和能效双重提升。屏幕方面延续M4版OLED方案,外观设计变化不大。

  • 华为 MatePad Pro 12.2 英寸 2025 官宣 7 月 24 日发布

    华为将于7月24日发布三款平板新品:旗舰款MatePad Pro 12.2英寸配备全新PaperMatte显示屏,采用Tandem OLED技术,功耗降低30%,支持144Hz刷新率、2000尼特峰值亮度,搭载麒麟9020A处理器,内置10100mAh电池和100W快充;MatePad 11.5 2025采用11.5英寸LCD屏,搭载麒麟8020处理器;MatePad Air 12 2025配备12英寸LCD屏,预计搭载麒麟9系新处理器。三款产品均主打高性能和长续航,满足不同用户需求。

  • 王振国谈肠癌的预防和诊断

    我国肠癌发病率显著上升,专家提醒需警惕早期症状。肠癌主要包括结直肠癌,与高蛋白、高脂肪饮食密切相关。早期症状包括便血、排便习惯改变等,易被误诊为痔疮。建议45岁以上人群定期做肠镜检查,高风险人群更应重视。预防需保持良好排便习惯,饮食遵循"鲜、野、淡、杂"原则,减少红肉摄入,增加膳食纤维。治疗强调早诊早治,中晚期需综合手术、放化疗及中医药治疗。

  • 华为MatePad Pro 12.2英寸发布:售价3999元起

    除了强大的软件支持,华为MatePad Pro12.2英寸在交互体验上也进行了全面升级。新品拥有全新分屏摘要功能,无需拖拽即可一键完成总结,大大提高了工作效率。同时,该设备还深度适配了手写笔HUAWEI M-Pencil Pro,新增AI功能快捷入口,用户只需轻捏笔身就能唤起小艺,支持即圈即搜,让创作更加便捷。自由多窗、全景多窗等创新功能的加入,更是实现了4个应用的前台显示和自由�

今日大家都在搜的词: