对于条目,我可以使用termvector api轻松找出特定术语的使用频率。
现在我想知道我的索引的每个文档中的术语的频率。
term | ID1 | ID2 | ID3 | ID4 [...]
'hello' | 2 | 4 | 0 | 12 [...]
除了搜索我的术语并为每个结果调用termvector之外,还有更好/更有效的方法来获取此统计信息吗?
答案 0 :(得分:1)
您可以使用脚本来实现此目的。 请按照文档here和here进行操作。 同样对scripted field也有一个好主意,它可以帮助您获得每个文档的附加字段。
示例查询 -
{
"query": {
"match": {
"provider": "qbox"
}
},
"script_fields": {
"test1": {
"script": "_index['provider']['qbox'].tf()"
}
}
}
其中provider是字段,qbox是值。