OpenClaw 数据质量门禁：空值、重复、旧数据和异常波动

很多 Agent 出错，不是推理错了，而是底层数据已经错了。表格缺字段、同一客户重复出现、上周数据被当成今天数据、接口返回只有部分结果，Agent 再努力也只能在错误底稿上生成漂亮结论。

OpenClaw 工作流里应该有一道数据质量门禁。它放在报告生成、客户通知、权限变更、系统写入之前，先判断数据能不能用。这个能力可以和运行监控、异常阈值、审计日志组合起来。

空值检查不能只看字段存在

字段存在，不代表字段可用。客户名称为空、金额为零、负责人缺失、时间戳不完整，都可能让后续判断偏掉。

门禁里可以把关键字段分成必填、可为空、可自动补全三类。必填字段缺失时，不要让 Agent 自己猜；可补全字段也要记录补全来源。

重复不一定是整行完全相同。一个客户可能因为简称、英文名、历史系统 ID 不同，被拆成多条记录。一个工单也可能因为重试被创建两次。

OpenClaw 可以设置业务对象识别规则，比如客户 ID、邮箱、合同编号、工单编号和任务批次。发现疑似重复时，先合并提示或进入人工确认，不要直接写入新结果。

Agent 做周报、价格监控、客户跟进时，数据时效非常关键。过期数据不是完全没用，但不能和最新数据放在同一个结论里。

数据质量门禁应该检查抓取时间、更新时间和适用周期。如果资料超过阈值，可以降级为参考资料，或者要求重新拉取。

指标突然翻倍、订单数突然归零、成本突然升高，都不应该直接进入最终报告。门禁可以先触发解释：是口径变化、数据缺失、业务波动，还是接口异常。

这一步和事故演练有关系。异常波动不是一定代表事故，但它应该触发暂停、标记或人工复核。

OpenClaw 数据质量门禁的价值，是让 Agent 在执行动作前先检查底稿。空值、重复、旧数据、异常波动和来源缺失都拦住以后，报告才更可信，写入动作才更稳，后续复盘也能知道问题到底出在数据还是流程。