如何用 Dify 监控和日志定位应用性能问题？

Question

Levenx · Accepted Answer

Dify 的监控和日志主要用来回答三个问题：应用有没有被正常调用、慢在哪里、钱花在了哪里。面试里不要只背“有调用统计、对话日志、Token 统计”，更要说清楚怎么用这些数据定位问题。一般先看应用层监控里的请求量、成功率、平均响应时间和 Token 消耗，再回到具体会话日志检查用户输入、模型输出、上下文长度、工作流节点耗时和错误信息。真正做优化时，监控看趋势，日志看现场，成本统计看取舍，三者要一起看。追问Dify 里哪些指标最值得优先看？优先看请求量、错误率、响应时间和 Token 用量，因为它们分别对应稳定性、体验和成本。平均响应时间只能看大概，排查体验问题时更建议看 P95 或 P99，慢请求往往藏在长尾里。Token 用量不能只看总数，还要拆成输入和输出，输入过大通常说明知识库召回、历史上下文或提示词模板太臃肿。这里的取舍是，监控指标越细越利于定位，但也会增加解释成本，团队初期先固定 4 到 6 个核心指标更稳。发现 Dify 应用变慢时应该怎么排查？先确认是不是所有请求都慢，如果只有部分用户或部分问题慢，就从对话日志里找对应会话。然后看工作流节点耗时，区分是模型响应慢、知识库检索

如何用 Dify 监控和日志定位应用性能问题？

追问

Dify 里哪些指标最值得优先看？

发现 Dify 应用变慢时应该怎么排查？

如何通过日志优化 Token 成本？

Dify 日志能不能直接当审计日志使用？

私有化部署时需要补哪些监控配置？