在elasticsearch中查找文档类型的平均商店大小

时间:2013-04-22 07:31:52

标签: elasticsearch

我如何知道特定文档类型的大小(以字节为单位)(例如,输入1和type2)?

如果我尝试:

curl -XGET 
'http://localhost:9200/my_index/_stats?clear=true&store=true&indexing=true&types=type1,type2'

我只获得索引的总大小(以字节为单位)。

我实际上对某种类型的文档的平均大小感兴趣,但这可以从计数和总体大小推断出来

2 个答案:

答案 0 :(得分:3)

使用相同的索引索引不同类型并共享许多常见结构。因此,如果不考虑另一种类型的影响,就不可能确定一种类型的数量。

答案 1 :(得分:0)

正如上面的回答所说,没有办法在弹性搜索中构建这个。

不确定这是否显而易见,但是我需要完成同样的事情来跟踪一些失控的索引增长,所以我添加了一个可选的调试索引,其中充当我的索引中心点的应用程序实际上记录了每个文档的大小,索引后的ID以及其他一些相关信息,以帮助我找出占据所有空间的文档。

这种方法不是100%准确,因为压缩后最大的压缩并不一定表示压缩后最大(非常确定ES压缩文档,我认为它们以二进制json格式存储?),但它肯定指出我在右边方向。