我遇到一种情况,正在尝试计算正在监视的系统中加载的文件数。每次加载文件时,我都会向Datadog发送“加载时间”指标,并且每当没有出现所需文件时,我都需要发送警报。为此,我要计算24小时内发送到Datadog的“加载时间”指标的数量,然后使用异常检测来查看它是否小于预期的正常数量。但是,我很难找到一种方法来持续提取此计数以用于警报中。
我无法使用count_nonzero函数,因为我的一些文件为空并且加载时间为0。我确实知道.as_count()和count:metric {tags},但是我没有找到包含评估间隔的方法。我尝试使用.rollup(count,time)来计数发送的指标,但是此调用似乎基于汇总间隔返回变量结果。例如,如果我比较2000和4000秒的间隔,我希望每个4000秒的间隔在同一时间段内总计大约两个2000秒的间隔之和。这似乎根本不是发生的事情-较小间隔的计数加起来比较大间隔的计数多得多。另外,一些汇总间隔将十进制数显示为计数,如果此功能按照我的预期进行,这对我来说没有任何意义。
有人对如何实现这一目标有任何想法吗?我真的很感谢任何新想法。