AI Agent 决策日志设计：输入、规则、工具和人工改动

很多团队上线 AI Agent 以后，会把聊天记录当成日志。出问题时再回头看，才发现聊天记录只能说明用户说了什么、Agent 回了什么，却很难回答更关键的问题：为什么它选择了这个工具，为什么没有接管，为什么引用了这条资料，为什么人工后来改了结果。

决策日志要记录的是 Agent 做判断的过程。它和 AI Agent 证据链、Agent 观测性、OpenClaw 事件总线是一套东西：不是为了堆数据，而是为了让每一次自动化都能被解释、被审计、被改进。

先保存原始输入和任务入口

决策日志第一层应该保存原始输入，包括用户文本、附件、来源渠道、触发时间、触发人、任务类型和入口版本。不要只保存模型整理后的摘要，因为摘要本身可能已经遗漏了关键信息。

如果任务来自表单、Webhook、邮件或工单系统，还要记录外部对象 ID。这样后续才能把 Agent 的判断和业务系统里的真实结果对上。

Agent 执行前通常会经过意图识别、风险分级、权限判断和路由规则。决策日志应该把这些结果结构化保存下来：命中了哪条规则、风险等级是什么、开放了哪些工具、是否需要人工接管、进入哪个队列。

这一步可以接上 AI Agent 任务路由。如果只记录最终回答，就无法判断错误到底发生在入口分流、工具选择，还是模型推理阶段。

工具调用日志要记录请求参数、返回摘要、耗时、重试次数、错误码和被模型使用的关键字段。尤其是写入系统、发送消息、修改状态这类动作，要记录调用前后的状态差异。

这里不建议把所有敏感原文都长期保存。更稳妥的做法是保存必要摘要、对象 ID、哈希或脱敏片段，同时把访问权限收紧。日志可复盘，不等于日志无限暴露。

人工接管、人工驳回、人工改写和人工补充证据，都应该进入决策日志。人工为什么改，改了哪里，是否影响后续流程，这些信息比单纯的点赞点踩更有价值。

如果接管队列已经按人工接管队列的方式设计，处理结果就可以回写到决策日志里，后续用于复盘规则缺口、知识库缺口和提示词缺口。

AI Agent 决策日志不是聊天备份，而是自动化过程的审计记录。原始输入、规则命中、模型判断、工具调用、人工改动、版本和业务结果要放在一起看。只有知道 Agent 为什么这样做，团队才知道下一次该修哪里。