很多团队上线 AI Agent 以后,会把聊天记录当成日志。出问题时再回头看,才发现聊天记录只能说明用户说了什么、Agent 回了什么,却很难回答更关键的问题:为什么它选择了这个工具,为什么没有接管,为什么引用了这条资料,为什么人工后来改了结果。
决策日志要记录的是 Agent 做判断的过程。它和 AI Agent 证据链、Agent 观测性、OpenClaw 事件总线 是一套东西:不是为了堆数据,而是为了让每一次自动化都能被解释、被审计、被改进。
先保存原始输入和任务入口
决策日志第一层应该保存原始输入,包括用户文本、附件、来源渠道、触发时间、触发人、任务类型和入口版本。不要只保存模型整理后的摘要,因为摘要本身可能已经遗漏了关键信息。
如果任务来自表单、Webhook、邮件或工单系统,还要记录外部对象 ID。这样后续才能把 Agent 的判断和业务系统里的真实结果对上。
规则命中要结构化
Agent 执行前通常会经过意图识别、风险分级、权限判断和路由规则。决策日志应该把这些结果结构化保存下来:命中了哪条规则、风险等级是什么、开放了哪些工具、是否需要人工接管、进入哪个队列。
这一步可以接上 AI Agent 任务路由。如果只记录最终回答,就无法判断错误到底发生在入口分流、工具选择,还是模型推理阶段。
工具调用不能只记成功失败
工具调用日志要记录请求参数、返回摘要、耗时、重试次数、错误码和被模型使用的关键字段。尤其是写入系统、发送消息、修改状态这类动作,要记录调用前后的状态差异。
这里不建议把所有敏感原文都长期保存。更稳妥的做法是保存必要摘要、对象 ID、哈希或脱敏片段,同时把访问权限收紧。日志可复盘,不等于日志无限暴露。
人工改动是最有价值的训练材料
人工接管、人工驳回、人工改写和人工补充证据,都应该进入决策日志。人工为什么改,改了哪里,是否影响后续流程,这些信息比单纯的点赞点踩更有价值。
如果接管队列已经按 人工接管队列 的方式设计,处理结果就可以回写到决策日志里,后续用于复盘规则缺口、知识库缺口和提示词缺口。
总结
AI Agent 决策日志不是聊天备份,而是自动化过程的审计记录。原始输入、规则命中、模型判断、工具调用、人工改动、版本和业务结果要放在一起看。只有知道 Agent 为什么这样做,团队才知道下一次该修哪里。