AI Agent 的人工接管,不应该等到它已经做错以后才启动。真正有用的接管机制,是在系统发现自己拿不准、动作风险变高、证据不完整或工具返回异常时,就把任务交给人。
所以接管阈值不是一个简单的置信度数字,而是一组判断规则。它要和 质量门禁、低置信度请求分流、事故分级 放在一起看,才能真正减少自动化失控。
置信度只是起点
很多团队会把接管阈值写成“低于 80% 转人工”。这有帮助,但不够。因为同样是 75% 的置信度,回答普通 FAQ 和修改客户合同完全不是一回事。
更稳的做法,是把置信度和动作风险一起看。低风险问答可以允许 Agent 继续补充证据,高风险写入、外发、退款、改权限和导出数据,只要证据不足就应该接管。
客户影响要单独加权
有些任务本身不复杂,但客户影响很大。比如关键客户的续费回复、公开渠道的品牌回应、投诉升级前的解释口径,都不适合只按模型分数决定是否自动发送。
这类场景可以接上 SLA 分层 和 值班表。接管不是简单转给某个人,而是转给当前有责任、有权限、能在时限内处理的人。
工具异常也要触发接管
Agent 调工具失败后,不能只靠重试。连续超时、返回字段缺失、权限被拒绝、价格或库存等关键数据为空,都应该进入接管判断。否则模型可能拿着残缺数据继续编一个看似完整的结果。
如果工具异常和外部写入有关,还要记录是否暂停流程、是否回滚、是否通知负责人。这些记录后面可以进入 变更复盘。
接管后要留下原因
人工接管不是把任务丢进人工队列就结束。接管原因、触发规则、人工修改了什么、最终是否放行,都应该进入任务日志。否则下一次训练评估集时,团队仍然不知道哪里需要改。
接管记录越清楚,后续越容易判断:是提示词要改,知识库要补,工具要修,还是业务规则本来就需要人工判断。
总结
AI Agent 人工接管阈值的核心,是把置信度、动作风险、客户影响、工具异常和证据缺口放到同一套规则里。接管越早、原因越清楚,自动化越不容易在关键节点失控。