Patronus AI 推出 Percival:一分钟诊断百步代理链中的隐藏故障

随着企业越来越多地部署自主运行的 AI 代理系统，对这些复杂系统的监控与调试需求也迅速增长。总部位于旧金山的 AI 安全公司 Patronus AI 今日发布了其最新产品 Percival，一个能够自动识别 AI 代理系统中故障模式并提出修复建议的监控平台。

“Percival 是业界首个可以自动追踪代理轨迹、识别复杂故障，并系统化输出修复建议的智能代理。” Patronus AI CEO 兼联合创始人 Anand Kannappan 在接受 VentureBeat 独家采访时表示。

与传统机器学习不同，AI 代理能够自主执行包含多个阶段的大规模操作流程。但正是这种“多步骤自治”让故障调试变得极为棘手:一个早期小错误可能在后续流程中演变成严重偏差，而多代理协同场景更是加剧了这种复杂性。

Percival 针对这种痛点设计，能识别四大类超过20种常见故障，包括推理错误、执行错误、规划失调、特定领域错误等。更重要的是，它并非“事后诸葛”，而是主动监控整个代理轨迹，具备“情景记忆”能力，能够理解错误在具体上下文中的来龙去脉。

“Percival 本身也是一个 AI 代理，因此不像传统评估器那样静态判断，而是可以在系统级别追踪和学习故障演变路径。” Patronus 研究员 Darshan Deshpande 说。

Patronus AI 推出 Percival:一分钟诊断百步代理链中的隐藏故障

图源备注：图片由AI生成，图片授权服务商Midjourney

在实际应用中，Percival 显著提升了故障分析效率。Patronus 表示，其早期客户已将调试复杂代理流程的时间从约1小时压缩到 1至1.5分钟，极大缓解了工程团队的运维负担。

为了标准化评估能力，Patronus 还同步发布了 TRAIL 基准测试（跟踪推理与代理问题定位），结果显示，即使是目前最强的模型，在该测试中的得分也仅为11%。这凸显了对专业 AI 监管工具的迫切需求。

Percival 已获得包括 Emergence AI 和 Nova 在内的多个客户采用。Emergence AI 致力于开发“代理创建代理”的系统，其 CEO Satya Nitta 表示，Percival 为实现大规模自治系统的可控性提供了关键保障。

Nova 则在利用 Percival 构建一个 AI 驱动的平台，帮助企业实现 SAP 系统迁移与旧代码集成，其代理系统流程多达上百步，复杂度远超人工可控范围。

Percival 可无缝集成 Hugging Face Smolagents、Langchain、Pydantic AI、OpenAI Agent SDK 等主流框架，覆盖广泛的代理开发生态。

随着 AI 技术快速商用化，企业每天生成的 AI 流程可能包含数十亿行代码。Kannappan 指出:“系统正变得越来越自主，而人类监督能力却远未跟上。”

Percival 的推出，正是在这个背景下填补监管空白。据分析师预测，AI 监管工具市场将随着代理系统普及迎来爆发式增长，Patronus AI 正以企业级产品切入这一高利润率赛道。

{{userData.name}}已认证