我在AWS上托管了一堆微服务。我正在使用StatsD,Graphite和Grafana监视它们。现在,我想扩展它以监视这些微服务通过其进行通信的队列(SQS)。我如何利用Graphite / Grafana做到这一点?如果没有相同的支持/插件,则可以采用更好的方法。谢谢:)
PS:如果必须是Zipkin,请告诉我它们可以共存,或者使用多个示踪剂很容易。
答案 0 :(得分:0)
好的,所以我将根据您在这里所说的来回答这个问题:
或者有更好的方法,如果没有相同的支持/插件。
我通过Prometheus与cloudwatch_exporter
和alertmanager
结合使用的方式。
用于cloudwatch_exporter
来监视SQS的配置将是这样的(这只是两个指标,您需要根据要监视的内容添加更多):
tasks:
- name: ec2_cloudwatch
default_region: us-west-2
metrics:
- aws_namespace: "AWS/SQS"
aws_dimensions: [QueueName]
aws_metric_name: NumberOfMessagesReceived
aws_statistics: [Sum]
range_seconds: 600
- aws_namespace: "AWS/SQS"
aws_dimensions: [QueueName]
aws_metric_name: ApproximateNumberOfMessagesDelayed
aws_statistics: [Sum]
然后,您需要配置prometheus,以便每隔一段时间就抓取cloudwatch_exporter
端点,例如我要做的事情:
- job_name: 'somename'
scrape_timeout: 60s
dns_sd_configs:
- names:
- "some-endpoint"
metrics_path: /scrape
params:
task: [ec2_cloudwatch]
region: [us-east-1]
relabel_configs:
- source_labels: [__param_task]
target_label: task
- source_labels: [__param_region]
target_label: region
然后,您将alertmanager
配置为基于这些已抓取指标进行警报;我不会提醒您这些指标,因此无法举一个例子。但是,为了让您大致了解这种架构,下面是一个图表:
如果您需要使用类似statsd
的东西,则可以使用statsd_exporter
。而且,以防万一,您想知道的是,Grafana supports prometheus。