我正在尝试找出如何针对可能崩溃并反复重启的进程创建警报。它可能会在启动时向Datadog提供一些数据,因此“无数据”警报将不会执行,因为在过程重新启动时,数据的不足永远不会达到持续时间阈值。我本来想提醒PID更改,但我终生无法弄清楚如何创建基于PID的监视器。可能吗?如何?有人对此情况有其他建议吗?
答案 0 :(得分:1)
也许您可以修改过程检查以通过PID(this is probly where you'd change that)标记过程号度量。这样,您可以按pid标签对显示器进行分组,并且无数据警报会告诉您pid何时切换。
但是这也会提醒您预期的pid变化,因此也许您必须过于主动地安排停机时间,这才是一个好主意?
也许用their Log Management tool监视一些崩溃日志会是更好的方法?