ElasticSearch 5字段名称压缩

时间:2017-01-22 15:53:53

标签: elasticsearch

我们将有近50亿个文档来索引ES5.x.我没有找到有关字段名称压缩的信息。

我们正在使用" ca"而不是" created_at"在我们以前的系统中节省空间。

我们是否需要在ES5.x中保持较小的字段名称,否则它已经以某种方式压缩了?

THX

1 个答案:

答案 0 :(得分:1)

您是否拥有MongoDB背景(曾经是/这是一个问题)?

Quoting Lucene的核心贡献者之一,因为存储是Lucene的工作:

  

每个段(* .fnm)有一个文件可以解析该字段   将名称转换为整数ID,然后索引的其余部分使用这些整数   标识。所以只有那个文件,它拥有一个字符串名称的副本   每个领域都会更大。

因此缩短字段名称的效果绝对最小。但是,根据您的映射,Elasticsearch中的存储可能比JSON源更小或更大,但这取决于映射以及数据的合理程度compressed in Elasticsearch