很多 Agent 出错,不是推理错了,而是底层数据已经错了。表格缺字段、同一客户重复出现、上周数据被当成今天数据、接口返回只有部分结果,Agent 再努力也只能在错误底稿上生成漂亮结论。
OpenClaw 工作流里应该有一道数据质量门禁。它放在报告生成、客户通知、权限变更、系统写入之前,先判断数据能不能用。这个能力可以和 运行监控、异常阈值、审计日志 组合起来。
空值检查不能只看字段存在
字段存在,不代表字段可用。客户名称为空、金额为零、负责人缺失、时间戳不完整,都可能让后续判断偏掉。
门禁里可以把关键字段分成必填、可为空、可自动补全三类。必填字段缺失时,不要让 Agent 自己猜;可补全字段也要记录补全来源。
重复记录要按业务对象识别
重复不一定是整行完全相同。一个客户可能因为简称、英文名、历史系统 ID 不同,被拆成多条记录。一个工单也可能因为重试被创建两次。
OpenClaw 可以设置业务对象识别规则,比如客户 ID、邮箱、合同编号、工单编号和任务批次。发现疑似重复时,先合并提示或进入人工确认,不要直接写入新结果。
旧数据要有时效标记
Agent 做周报、价格监控、客户跟进时,数据时效非常关键。过期数据不是完全没用,但不能和最新数据放在同一个结论里。
数据质量门禁应该检查抓取时间、更新时间和适用周期。如果资料超过阈值,可以降级为参考资料,或者要求重新拉取。
异常波动要触发解释
指标突然翻倍、订单数突然归零、成本突然升高,都不应该直接进入最终报告。门禁可以先触发解释:是口径变化、数据缺失、业务波动,还是接口异常。
这一步和 事故演练 有关系。异常波动不是一定代表事故,但它应该触发暂停、标记或人工复核。
总结
OpenClaw 数据质量门禁的价值,是让 Agent 在执行动作前先检查底稿。空值、重复、旧数据、异常波动和来源缺失都拦住以后,报告才更可信,写入动作才更稳,后续复盘也能知道问题到底出在数据还是流程。