ElasticSearch重要术语聚合:doc_count和bg_count不等于搜索词

时间:2018-02-13 22:46:17

标签: elasticsearch significant-terms

如果我的查询,文档结构或我对doc_countbg_count字段的解释存在错误,我不确定此处。

当按分数运行重要的术语聚合和排序结果时,搜索术语总是可以理解,首先在该列表中。但是,我希望doc_countbg_count匹配搜索字词,因为我理解doc_count是与密钥和过滤条件匹配的文档数,并且后台计数是与过滤条件匹配的文档数。因此,在文件管理器术语是密钥的情况下,doc_countbg_count将是相等的。

相反,我通常会看到doc_count低于bg_count且得分(显着)低于1.

举个例子:

{
"size" : 0,
"timeout" : 1800000,
"query" : {
  "bool" : {
    "filter" : {
      "has_child" : {
        "query" : {
          "term" : {
            "item_id" : 2606
          }
        },
        "child_type" : "item"
      }
    }
  }
},
"aggregations" : {
  "st_agg" : {
    "children" : {
      "type" : "item"
    },
    "aggregations" : {
      "items" : {
        "significant_terms" : {
          "field" : "item_id",
          "size" : 500,
          "exclude" : [ "51713398" ]
         }
       }
     }
   }
 }
}

对于这些查询,我没有使用后台过滤器。这是在ElasticSearch 2.3.2上(不要判断,升级到6.x正在进行中)。

这是预期的吗?

0 个答案:

没有答案