我需要编写prometheus警报来查找僵尸进程和登录的用户总数。但我找不到上述2个警报的相关指标。
另外,如果特定的matric不可用,那么有没有办法在go / shell / python中编写我自己的代码并添加到node_exporter?
答案 0 :(得分:1)
您的两个选项是撰写your own exporter或通过textfile collectors向node_exporter添加指标。
对于登录用户或僵尸流程等指标,我认为后一种方法很有意义,您可以找到示例here。
因此,例如,要添加登录用户的数量,您可以制作一个运行的cronjob
echo users_logged_in $(who | wc -l) > /var/lib/node_exporter/textfile_collector/users.prom