如何使用聚合获取文章中单词的重复次数?

时间:2017-09-29 14:53:34

标签: elasticsearch elasticsearch-5

我使用'term aggregation'来知道在elasticsearch中重复一个单词的次数。此方法适用于短字符串字段。

我的简单术语聚合:

{
  "query": {
    "bool": {
      "must": [
        {
          "query_string": {
            "analyze_wildcard": true,
            "query": "*"
          }
        }
      ],
      "must_not": []
    }
  },
  "size": 0,
  "_source": {
    "excludes": []
  },
  "aggs": {
    "2": {
      "terms": {
        "field": "msgtxt.keyword"
      }
    }
  }
}

但是在长字符串中提交了长篇文章,如“文章”,它会返回一些长句。

是否可以使用“术语聚合”或其他方法查找重复次数? (文章文本用阿拉伯语/波斯语)

1 个答案:

答案 0 :(得分:1)