用 AI Agent 做数据血缘说明：结论要能追到来源表

运营团队用 AI Agent 做报表、周报和异常分析时，最容易出现一种尴尬：结论写得很顺，图表也像那么回事，但别人追问“这个数字从哪里来”，现场没人说得清。

这不是小问题。Agent 生成的数据结论如果不能追到来源表、筛选条件和指标口径，就很难进入正式决策。前面写过运营风险周报、生产监控指标和续费预警，这些场景都需要数据血缘说明。

先让结论绑定来源

每一条自动化结论都应该绑定来源：用了哪张表、哪个接口、哪个文档，查询时间是什么，是否有缓存。如果结论来自多个来源，还要说明主数据和辅助数据分别是什么。

Agent 可以在生成报告时同步输出一个“证据区”。这个区域不需要写得很漂亮，但要足够清楚，让复核人能回到原始数据看一眼。

很多数据争议不是算错，而是口径不同。活跃用户按登录算还是按关键动作算，续费风险按合同日期算还是按使用下降算，失败率是否包含人工取消，这些都要写出来。

如果口径只是散落在正文里，后续复用时很容易丢。更好的做法是让 Agent 把指标名、定义、分母、分子、排除项和负责人单独列出来。

自动化报表常常需要筛选时间、部门、客户类型、任务状态和异常等级。筛选条件一旦被省略，读者就会误以为结论适用于所有情况。

所以数据血缘说明里要保留筛选条件。比如“过去 7 天、企业版客户、已上线 Agent、排除测试任务”。这样结论边界清楚，后续复盘也不会把局部现象当成整体趋势。

Agent 可以帮助整理数据血缘，但最后仍然需要人确认关键口径。复核记录要写清谁看过、改了哪里、为什么改，以及下次是否可以复用。

这和知识库问答抽检的思路一样：不要只留下最终答案，要留下来源、修正和复核过程。数据分析也需要可追溯。

用 AI Agent 做数据血缘说明，重点是让自动化结论能追到来源表、筛选条件、指标口径、更新时间和负责人。能追溯的结论，才有机会进入管理决策；追不回去的漂亮报告，只能当草稿。