应用错误收集

时间：2017-01-22 15:53:53

标签： elasticsearch

我们将有近50亿个文档来索引ES5.x.我没有找到有关字段名称压缩的信息。

我们正在使用＆＃34; ca＆＃34;而不是＆＃34; created_at＆＃34;在我们以前的系统中节省空间。

我们是否需要在ES5.x中保持较小的字段名称，否则它已经以某种方式压缩了？

THX

答案 0 :(得分：1)

您是否拥有MongoDB背景（曾经是/这是一个问题）？

Quoting Lucene的核心贡献者之一，因为存储是Lucene的工作：

每个段（* .fnm）有一个文件可以解析该字段将名称转换为整数ID，然后索引的其余部分使用这些整数标识。所以只有那个文件，它拥有一个字符串名称的副本每个领域都会更大。

因此缩短字段名称的效果绝对最小。但是，根据您的映射，Elasticsearch中的存储可能比JSON源更小或更大，但这取决于映射以及数据的合理程度compressed in Elasticsearch。