我正在根据多个指标创建监视警报。
我在下面举两个例子: 1)数据流作业失败 2)更改防火墙规则或插入新规则
创建基于日志的指标并从中发出警报是可以的。但这是非常通用的。如何确定指向特定细节,例如此数据流作业(作业名称)失败或该用户创建的数据流作业失败? 防火墙规则也一样,我如何知道所有规则中的哪个被更新?
如何在警报消息本身中包含有问题的职位名称或定位点资源?
对于我提供的示例,配置如下-
使用以下过滤器创建防火墙更新指标:
resource.type="gce_firewall_rule" AND jsonPayload.event_subtype="compute.firewalls.patch" OR jsonPayload.event_subtype="compute.firewalls.insert"
对于数据流失败的作业,度量标准浏览器中有可用的度量-is_failed