AWS Cloudwatch警报不会从警报状态恢复为OK状态,连续三个时间通知SNS主题

时间:2019-02-05 06:17:07

标签: amazon-web-services amazon-cloudwatch

我已经在自定义指标过滤器上为lambda([ERRORS])创建了警报。以下是度量标准过滤器和警报的配置。

logs.put_metric_filter(
        logGroupName='/aws/lambda/' + functionname,
        filterName=functionname +'_error_stage',
        filterPattern='"ERROR"',
        metricTransformations=[
            {
                'metricName': functionname +'_error_stage',
                'metricNamespace': 'lamda_error',
                'metricValue': '1',
                'defaultValue': 0
            },
        ]
    )

公制警报的配置。

cloudwatch.put_metric_alarm(
        ActionsEnabled=True,
        AlarmActions=[
            "arn:aws:sns:us-west-2:653453327677:logs_error_mail"
        ],
        AlarmName=alarm_name,
        ComparisonOperator= "GreaterThanOrEqualToThreshold",
        EvaluationPeriods=1,
        InsufficientDataActions=[],
        MetricName=function_name + '_error_stage',
        Namespace="lamda_error",
        OKActions=[],
        Period=300,
        Statistic="Sum",
        Threshold=1.0,
        TreatMissingData="missing"
    )

一切正常,但问题是只要触发警报,它也会在接下来的连续三个周期触发。这是因为五分钟后警报没有恢复到OK状态。如何更改配置,以免被错误触发。

0 个答案:

没有答案