OpenClaw 任务失败时,最浪费时间的不是失败本身,而是不知道为什么失败。很多人第一反应是改提示词,改完不行就换模型,再不行就怀疑工具坏了。这样当然也可能撞对,但长期来看效率很低。更好的方法是先做日志复盘,把问题拆成三类:提示词错、工具错、资料错。
如果你已经看过 OpenClaw 调试指南,这篇可以当作更细的一层补充。调试指南解决“为什么 Tools 和 Skills 明明配了却不工作”,日志复盘解决“出了问题以后我先看哪里”。
第一步:先还原任务链路
不要直接盯着最后的回答。一次 Agent 任务通常包含用户目标、模型理解、工具选择、工具参数、工具返回、最终生成几个阶段。只看最后一句,很容易把前面的问题误判成输出问题。
建议每次复盘都先问四个问题:它有没有理解目标;它选了哪些工具;工具有没有返回有效结果;最终回答有没有忠实使用这些结果。这四个问题可以快速定位错误发生在哪一段。
提示词错:通常表现为目标理解偏了
提示词问题的典型表现,是 Agent 一开始就往错误方向走。比如你要它整理“本周竞品变化”,它却写成“行业新闻摘要”;你要它基于知识库回答,它却自由发挥。此时再改工具没有意义,因为它根本没把任务定义对。
处理方法也很直接:把任务边界、输出格式、禁止事项和判断标准写清楚。尤其是知识库任务,要明确“找不到资料时说明缺失,不要补全”。这和 OpenClaw 本地知识库实战 里讲的检索优先原则是一致的。
工具错:通常表现为调用失败或参数不对
工具问题更像执行层错误。模型知道要搜索,但关键词太宽;知道要读文件,但路径错了;知道要发消息,但权限不足。日志里如果能看到工具调用参数,就优先检查参数是否符合预期。
这一类问题不要只改自然语言提示,最好补工具说明和失败兜底。比如要求 Agent 搜索前先生成 3 个具体关键词;工具返回为空时换关键词再试一次;权限不足时不要继续猜,而是把错误原文列出来。
资料错:通常表现为回答看似合理但事实旧
资料问题最隐蔽。Agent 的链路可能全都正确,工具也正常返回,但资料本身过期、不完整或互相冲突,最后答案自然会偏。内部问答尤其容易遇到这种情况,因为流程、价格、版本说明都在变化。
这时重点不是换模型,而是检查资料来源、更新时间和版本标记。相关问题可以结合 OpenClaw 做内部问答时最容易忽略的是资料更新 一起看。
一个实用复盘表
每次失败后,可以按这个顺序记一行:任务目标是什么,Agent 实际理解成什么,调用了什么工具,工具返回了什么,最终答案引用了什么,人工判断问题归类是什么。哪怕只坚持记录十次,你也会发现问题集中在少数几个环节,而不是到处都是。
对团队来说,这张复盘表还有一个额外价值:它能把“感觉不好用”变成可讨论的问题。到底是提示词边界不清、工具权限没配好,还是知识库资料太旧,只有拆出来,才知道该让谁负责修。
总结
OpenClaw 调试不要一上来就改模型。先看日志,先还原链路,再判断提示词、工具和资料分别有没有问题。只要复盘方式稳定下来,Agent 的可靠性会比单纯堆提示词提升得更快。