通过 Elasticsearch查询,我可以生成大约5000个文档 现在,我正在尝试确定出现最多的非停用词(停用词是辅助动词/非重要词)。
因此,我使用 significant_text 聚合
尝试了此查询$params2 = [
'index' => ["web", "print"],
'type' => 'index',
'from' => 0,
'size' => 10000,
'filter_path' => ['aggregations'],
'body' => [
"query" => //omitted query here
'aggs' => [
'SIGNIFICANT' => [
"significant_text" => [
"field" => "content"
]
]
]
]
];
不幸的是,它仍然显示一些对我来说不重要的garbage words
我的问题:
1. significant_text
聚合有替代方法吗?
terms
主agg之后执行significant_text
子聚合,因为我想组合一个查询以了解流行词,然后根据其他字段过滤文档如果您对如何执行所需的过程和输出有所了解,将不胜感激