一般来说,哪些是Elasticsearch中大小索引之间的权衡(在性能和内存使用方面)?
稍微阐述一下:
考虑一个包含8个节点的集群,每个节点有1个分片,30Gb分配给JVM
还要考虑每天有5000万个文档(所有文档都具有相同的结构并使用doc值),保留90天。每天的文件在磁盘上大约有35Gb。
我想在这些群集中运行一些查询,总共包含12小时的数据
这些查询由一些嵌套聚合组成:date-histogram
,后跟cardinality
和percentile
聚合。
考虑数据量,哪个更好:使用每日索引还是只使用一个索引?
PS:我知道这是一个模糊的"题。我的问题更具理论性 我想更好地了解聚合期间发生的事情以及它与索引数量的关系。