AI Agent 事故分级：提示词偏差、工具失败和写入风险

AI Agent 进入生产以后，异常不能再笼统地叫“回答错了”。有的只是提示词语气偏了，有的是知识库引用冲突，有的是工具连续失败，还有的是已经把错误结果写进外部系统。它们的影响范围、处理速度和复盘方式完全不同。

事故分级的价值，是让团队在第一时间判断这件事有多严重、谁要接手、要不要暂停工作流。它应该接在值班表、质量门禁和变更复盘后面，成为生产运行的一部分。

先区分影响范围

最低一层通常是单次输出质量问题，比如表达不够准确、格式不符合预期、引用不完整。这类问题需要记录样本，但不一定要暂停系统。

再往上，是某类任务持续异常。比如某个知识库场景连续低置信度，或者某个工具节点频繁超时。这时就要进入值班处理，查看最近有没有知识库、提示词或接口变更。

最高风险是外部写入、批量外发、权限变更和客户可见错误。一旦出现这类信号，优先动作不是继续让 Agent 自我修复，而是暂停、接管、保留证据。

很多团队看到结果不好，就先改提示词。可如果根因是工具返回为空、接口字段变化、数据库查询超时，提示词改得再漂亮也解决不了问题。

事故分级里要单独保留工具失败类型，并把工具名称、失败时间、返回状态、重试次数和最终影响记录下来。这部分可以和观测指标一起看，判断是偶发故障还是持续退化。

成本突然升高不一定马上伤害客户体验，但它往往说明流程在异常重试、上下文过长或任务被错误拆分。如果只等账单出来再处理，团队会错过最佳止损时间。

前面写过成本归因和运行成本看板。当成本超过阈值时，也应该进入事故队列，而不是只做财务统计。

分级不是为了贴标签。每一级都要对应动作：记录样本、转人工复核、暂停工作流、回滚配置、通知负责人、发起复盘。没有动作的分级，只会变成另一张没人看的表。

事故处理完以后，要把样本放回评估集或失败回放库。下一次改提示词、换工具或更新知识库时，这些旧事故应该被重新跑一遍。

AI Agent 事故分级的核心，是把提示词偏差、知识库冲突、工具失败、成本异常和外部写入风险分开处理。分清严重程度，团队才能在生产异常出现时接得住、停得下、复盘得清。