应用错误收集

我们每天多次收到此消息（通过电子邮件发送）：

ALARM：＆＃34; elb-production-UnHealthHostCount＆＃34;在美国 - 弗吉尼亚州。

您收到此电子邮件是因为您的Amazon CloudWatch警报   ＆＃34; ELB-生产UnHealthHostCount＆＃34;在美国 - 弗吉尼亚州的N.   进入ALARM状态，因为＆＃34; Threshold Crossed：1 datapoint（0.2）   大于阈值（0.0）。＆＃34;在＆＃34; 2016年1月21日星期四   17:39:39 UTC＆＃34;。

在AWS管理控制台中查看此警报：   https://console.aws.amazon.com/cloudwatch/home?region=us-east-1#s=Alarms&alarm=elb-production-UnHealthHostCount

警报详情：    - 姓名：elb-production-UnHealthHostCount    - 说明：    - 州改变：好的 - ＆gt;报警    - 状态变化的原因：阈值交叉：1个数据点（0.2）大于阈值（0.0）。    - 时间戳：2016年1月21日星期四17:39:39 UTC    - AWS账户：1234567890

阈值：    - 当度量标准为GreaterThanThreshold 0.0持续60秒时，警报处于ALARM状态。

受监控的指标：    - MetricNamespace：AWS / ELB    - MetricName：UnHealthyHostCount    - 尺寸：[LoadBalancerName = production]    - 时间：60秒    - 统计：平均值    - 单位：未指定

州改变行动：   - 好：    - 报警：[arn：aws：sns：us-east-1：1234567890：DevOps]    - INSUFFICIENT_DATA：

但是，在查看我们的nginx日志文件后，似乎AWS能够在警报出现的时候与我们的每台服务器联系并启动＃34;。换句话说，我们的ec2实例在2016年1月21日星期四17:39:39 UTC的每个请求中返回200 /healthcheck。

AWS似乎每30秒左右检查一次我们的实例。

有没有人遇到过这个问题？如果是这样，你对此做了什么？

如何停止AWS CloudWatch UnHealthHostCount错误警报？

1 个答案: