我已经在自定义指标过滤器上为lambda([ERRORS])创建了警报。以下是度量标准过滤器和警报的配置。
logs.put_metric_filter(
logGroupName='/aws/lambda/' + functionname,
filterName=functionname +'_error_stage',
filterPattern='"ERROR"',
metricTransformations=[
{
'metricName': functionname +'_error_stage',
'metricNamespace': 'lamda_error',
'metricValue': '1',
'defaultValue': 0
},
]
)
公制警报的配置。
cloudwatch.put_metric_alarm(
ActionsEnabled=True,
AlarmActions=[
"arn:aws:sns:us-west-2:653453327677:logs_error_mail"
],
AlarmName=alarm_name,
ComparisonOperator= "GreaterThanOrEqualToThreshold",
EvaluationPeriods=1,
InsufficientDataActions=[],
MetricName=function_name + '_error_stage',
Namespace="lamda_error",
OKActions=[],
Period=300,
Statistic="Sum",
Threshold=1.0,
TreatMissingData="missing"
)
一切正常,但问题是只要触发警报,它也会在接下来的连续三个周期触发。这是因为五分钟后警报没有恢复到OK状态。如何更改配置,以免被错误触发。