我想使用stackdriver监控发送AWS实例的度量标准警报(在组设置中)

时间:2017-09-28 12:35:16

标签: amazon-web-services google-cloud-platform stackdriver gcp

我的问题是在使用stackdriver监控AWS指标时进行设置。 我在下面尝试过,但是警报(策略)不起作用。 如何使用组设置发送警报(策略)? 我不想要单一监控,我想要的是组设置。

  • 我通过角色设置完成了aws帐户的stackdriver监控设置。对于下一步,我设置的组设置警报(策略)指标低于。
  • 负载平均值> 5
  • 磁盘使用情况> 80%

目标是一些ec2实例,这些是组设置。

  1. 我完成了这些设置。接下来,做了压力测试。
  2. 我查看了指标。然后图表超过了阈值。
  3. 但没有发出警报(政策),也没有打开事件。
  4. 以下是详细信息。

    警报(策略)创建

    1. 转到[提醒/政策/目标政策]
    2. [添加条件],下次选择[公制阈值]
    3. 资源类型是实例(EC2)
    4. 适用于群组
    5. 选择群组。该组包括EC2实例。
    6. 条件触发器如果:任何成员违反
    7. IF METRIC是[CPU负载平均值(过去1米)
    8. 条件在上面
    9. THRESHOLD是5次
    10. FOR是1分钟
    11. 按名称书写并按[保存政策]
    12. 压力测试

      1. ssh to target instances。
      2. 执行压力测试。
      3. 将负载平均值设置为高于5。
      4. 但没有发出警报(政策)
      5. 确认Stackdriver

        1. 使用警报设置页确认上述负载平均值达到5。
        2. 但没有打开事件。
        3. 我尝试了其他设置

          • 对于GCP实例,警报将正常运行。这是组设置和单一设置。
          • 警报适用于单个配置中的AWS实例,但不适用于组设置。

          版本信息

          • 为Stackdriver
            • stackdriver-agent版本:stackdriver-agent.x86_64 5.5.2-366.amzn1
          • AWS
            • 操作系统:亚马逊Linux
            • 版本:2016.03
            • ID_LIKE:rhel fedora

          更多细节请注释。

1 个答案:

答案 0 :(得分:1)

如果未正确配置代理并且正在将指标发送到错误的项目,则可能会导致所描述的行为。这适用于单个实例,但不适用于实例组。这可能适用于GCP,因为它是用于监视GCE实例的零设置。这会导致使用组过滤器的任何警报都不起作用。

https://cloud.google.com/monitoring/agent/troubleshooting#verify-project “如果您使用的是Amazon EC2 VM实例,或者您在Google Compute Engine实例上使用私钥凭据,那么凭据可能无效或者可能来自错误的项目。对于AWS账户,项目使用代理必须是AWS连接器项目,通常名为“AWS Link ...”。“

https://cloud.google.com/monitoring/agent/troubleshooting#verify-running处的这些说明有助于验证代理是否正确发送指标。