僵尸进程的Prometheus度量标准名称和登录用户数

时间:2018-03-14 17:03:25

标签: monitoring prometheus

我需要编写prometheus警报来查找僵尸进程和登录的用户总数。但我找不到上述2个警报的相关指标。

另外,如果特定的matric不可用,那么有没有办法在go / shell / python中编写我自己的代码并添加到node_exporter?

1 个答案:

答案 0 :(得分:1)

您的两个选项是撰写your own exporter或通过textfile collectors向node_exporter添加指标。

对于登录用户或僵尸流程等指标,我认为后一种方法很有意义,您可以找到示例here

因此,例如,要添加登录用户的数量,您可以制作一个运行的cronjob

echo users_logged_in $(who | wc -l) > /var/lib/node_exporter/textfile_collector/users.prom