Elasticsearch:计算每个文档中术语的频率

时间:2015-04-27 14:52:13

标签: elasticsearch

对于条目,我可以使用termvector api轻松找出特定术语的使用频率。

现在我想知道我的索引的每个文档中的术语的频率。

term    | ID1 | ID2 | ID3 | ID4  [...]
'hello' |  2  |  4  |  0  |  12  [...]

除了搜索我的术语并为每个结果调用termvector之外,还有更好/更有效的方法来获取此统计信息吗?

1 个答案:

答案 0 :(得分:1)

您可以使用脚本来实现此目的。 请按照文档herehere进行操作。 同样对scripted field也有一个好主意,它可以帮助您获得每个文档的附加字段。

示例查询 -

{
  "query": {
    "match": {
      "provider": "qbox"
    }
  },
  "script_fields": {
    "test1": {
      "script": "_index['provider']['qbox'].tf()"
    }
  }
}

其中provider是字段,qbox是值。