Elasticsearch path.data多个磁盘,添加更多

时间:2017-11-28 23:50:49

标签: elasticsearch

当我最初设置我的Elasticsearch集群时,建议使用" stripe"因此,跨多个磁盘的数据:

  

path.data:[/ disk1,/ disk2,/ disk3]

我做得很好,并且工作正常,但现在我需要添加更多空间(更多磁盘),我打算这样做:

  

path.data:[/ disk1,/ disk2,/ disk3,/ disk4,/ disk5]

我无法找到任何权威性参考,表明数据将如何重新平衡(或不重新平衡)。似乎这些年来/版本的行为有所改变,因此谷歌搜索一直很困难。 所有文档都说:" path.data设置可以设置为多个路径,在这种情况下,所有路径都将用于存储数据"这是相当模糊的。

我正在运行Elasticsearch 5.6。

我想了解当磁盘1,2,3高于85%"低水印时会发生什么? (但尚未达到90%的高分),我将两个新磁盘引入混合。新索引会仅转到2个新磁盘吗?

文档说:"一旦有超过85%的磁盘使用,ES就不会为节点分配新的分片"。这是指整个节点,还是仅占该节点上85%的磁盘?

我的索引是每日记录数据,并且每隔N天会被策展人修剪一次,所以我想在某些时候,事情会变得更糟,但可能需要一段时间。有没有办法主动将分片重新定位到不同的磁盘,还是应该让它随着时间的推移自我平衡?

1 个答案:

答案 0 :(得分:0)

使用多个磁盘(通过数据路径)不是 STRIPING。数据按分片计数而不是磁盘空间使用情况分布在磁盘上。即使单个磁盘超过水印,节点也会受到影响。因此,将新磁盘添加到数据路径不会将数据分发到新磁盘。

要使用数据条带化,请根据您的数据安全要求至少使用 RAID0 或其他选项。

参考Data storage architecture