'字段数据'的大小是多少?在Elasticsearch中,打开了doc_values的字段

时间:2015-05-29 03:44:52

标签: elasticsearch

我有这样的映射:

PUT test
{
  "mappings": {
    "mydoc": {
      "properties": {
         "createdAt": {
         "type": "date",
         "format": "date_optional_time",
         "doc_values": true
        }
      }
    }
  }
}

索引后,我可以找出'字段数据的大小'在HDD上的这个领域? Elasticsearch文档说,通过启用doc_values: true,他们可以构建现场数据'在索引过程中。

提前谢谢你。

2 个答案:

答案 0 :(得分:0)

没有端点可以确切地知道fielddata和doc_values之间的区别。

找出答案的唯一方法是将相同的数据编入索引2次:启用doc_values一次,使用fielddata一次。

如果提供的数据是关于ElasticSearch中存储的blogpost,那么当启用doc_values时,您可以看到索引大小增加了大约20-30%。

答案 1 :(得分:0)

由于doc值存储在dvd and dvm Lucene files中,您只需使用以下命令计算磁盘上这些文件的大小。

ls -laR $ES_HOME/data/* | grep "dv[d|m]" | awk '{ total += $5 }; END { print total }'
  • ls -laR将只列出ES数据文件夹中的所有文件
  • grep只会抓取dvddvm个文件
  • awk将获取第5列(即文件大小,以字节为单位)并将其添加到total变量
  • 最后打印出total,并且应该代表磁盘上所有doc值足迹的总大小(以字节为单位)。