亚马逊弹性搜索解释FreeStorageSpace指标

时间:2016-07-14 19:55:31

标签: amazon-web-services elasticsearch logstash elastic-stack amazon-elasticsearch

我有6个类型为m3.large.elasticsearch和storage type instant的实例。

enter image description here

我真的没有得到平均值,最小值,最大值...在这里?

我现在没有收到任何日志到我的群集,虽然它在这里显示FreeStorageSpace为14.95GB:

enter image description here

但我的“最小”FreeStorageSpace图表已达到零!

enter image description here

这里发生了什么?

2 个答案:

答案 0 :(得分:2)

我也对此感到困惑。最小值表示单个数据节点上的大小 - 一个具有最小可用空间的节点。 Sum表示整个集群的大小(所有数据节点上的可用空间总和)。从以下链接获得此信息

http://docs.aws.amazon.com/elasticsearch-service/latest/developerguide/es-managedomains.html

答案 1 :(得分:1)

我们遇到了同样的困惑。平均,最小值,最大值将计算结果分布在所有节点上,总和将整个集群的可用/已用空间合并在一起。

我们假设平均FreeStorageSpace意味着整个集群的平均可用存储空间,并且设置了一个警报,牢记以下计算:

  1. 每天索引= 1 TB
  2. 保留索引的最大天数= 10

因此,在任何时间点,我们的平均利用率均为10 TB。假设我们将增长2倍-即根据https://docs.aws.amazon.com/elasticsearch-service/latest/developerguide/sizing-domains.html#aes-bp-storage得出的实际存储需求为20 TB 复制因子为2的是:

(20 * 2 * 1.1 / 0.95 / 0.8)= 57.89 =〜60 TB

因此,我们将18 X 3.8 TB实例=〜68 TB的资源调配为2x = 60 TB

因此,我们已经设置了警报,如果我们将可用存储空间降至8 TB以下-这​​意味着我们已经达到2倍的限制并且应该扩大规模。因此,我们设置了闹钟

FreeStorageSpace <= 8388608.00(在5分钟内获取4个数据点)+统计=平均+持续时间= 1分钟

FreeStorageSpace的大小为MB,因此-8 TB = 8388608 MB。

但是我们立即收到警报,因为我们每个节点的平均利用率低于8 TB。

意识到要获得准确的存储后,您需要做FreeStorageSpace sum 1分钟-我们将警报设置为

FreeStorageSpace <= 8388608.00在5分钟内获得4个数据点+统计=总和+持续时间= 1分钟

以上计算已签出,我们能够设置正确的警报。

ClusterUsedSpace计算也是如此。

您还应该使用Cloudwatch Math跟踪实际可用空间百分比:

enter image description here