AI Agent 一旦接入业务系统,最危险的不是它偶尔答错,而是低把握结果被当成确定结果继续流转。客服回复可以重写,分析报告可以修改,但客户状态、权限字段、合同备注、库存数据一旦被写错,后面就会牵出更多修正成本。
质量门禁就是给 Agent 输出加一道进入业务系统前的检查。它可以和 上线准入清单、OpenClaw 审批队列、人工接管台 放在一起看:上线前检查能不能跑,运行中检查能不能写,异常时检查能不能接回来。
先区分草稿和写入
同一条 Agent 结果,作为草稿和作为写入动作,风险完全不同。比如一段客户跟进建议可以先给销售看;但如果它要自动修改 CRM 阶段、发送邮件或关闭工单,就必须经过更严格的门禁。
所以质量门禁的第一条规则,是按动作分级。只读、草稿、提醒可以宽一点;写入、外发、删除、权限变更要严一点。不要把所有输出都当成同一种风险。
低置信度要自动降级
低置信度不一定代表失败,它更像一个交通信号:可以继续整理资料,但不该直接执行。触发低置信度的原因可能是资料冲突、工具失败、用户意图不清、字段缺失,也可能是 Agent 自己给出了不确定说明。
这时更好的处理不是让流程报错,而是降级为人工确认、补充资料或生成草稿。前面写过 意图识别置信度,它解决的是理解阶段;质量门禁解决的是执行前最后一关。
证据链不完整就不要写
很多错误不是模型不会推理,而是来源证据不完整。比如客户是否承诺续费、合同是否允许折扣、知识库哪条规则最新,如果没有明确来源,Agent 不应该把结论直接写入系统。
质量门禁要检查来源链接、资料时间、工具返回和字段来源。这个思路和 数据血缘说明 一致:结论要能追到来源,写入也要能追到依据。
格式校验只能算底线
JSON 合法、字段齐全、枚举值正确,只能说明结果格式没坏,不代表业务判断正确。很多团队把格式校验当成质量门禁,最后发现写进去的内容虽然格式正确,但业务含义错了。
真正的质量门禁应该同时看格式、证据、权限、影响范围和回滚方式。尤其是高风险动作,要和 授权边界 配合,确认这个 Agent 当前有没有资格执行这一步。
总结
AI Agent 质量门禁的价值,是阻止低置信度、证据不完整、格式异常或权限不清的结果直接进入业务系统。Agent 可以先生成草稿,可以请求人工确认,也可以暂停等待资料,但不应该把不确定性悄悄写进生产数据。