我有两个"奴隶" prometheus severs,我的每个kubernetes集群中的一个。我有federation和alerting的一个集中的prometheus。
有时,它发生在"奴隶"停止提供指标。怎么检测呢?如何创建捕获这种情况的警报。
不幸的是,prometheus总是将其联盟对等体视为UP。无论如何。
答案 0 :(得分:0)
我们需要更多信息。如果up为1那么一切都还可以。真正的问题是为什么你在没有数据的情况下获得成功。你试过调试吗?
我还建议尽可能在堆栈中提醒,请参阅https://www.robustperception.io/federation-what-is-it-good-for/