我们将有近50亿个文档来索引ES5.x.我没有找到有关字段名称压缩的信息。
我们正在使用" ca"而不是" created_at"在我们以前的系统中节省空间。
我们是否需要在ES5.x中保持较小的字段名称,否则它已经以某种方式压缩了?
THX
答案 0 :(得分:1)
您是否拥有MongoDB背景(曾经是/这是一个问题)?
Quoting Lucene的核心贡献者之一,因为存储是Lucene的工作:
每个段(* .fnm)有一个文件可以解析该字段 将名称转换为整数ID,然后索引的其余部分使用这些整数 标识。所以只有那个文件,它拥有一个字符串名称的副本 每个领域都会更大。
因此缩短字段名称的效果绝对最小。但是,根据您的映射,Elasticsearch中的存储可能比JSON源更小或更大,但这取决于映射以及数据的合理程度compressed in Elasticsearch。