我们正在使用Elasticsearch在我们的网站中生成标签云。用于创建标记云的查询如下。
{
"size": 0,
"facets": {
"tagcloud": {
"terms": {
"field": "body.body",
"size": "20",
"exclude": [
"http",
"t.co"
]
}
}
},
"query": {
"bool": {
"must": [
{
"range": {
"body.postedTime": {
"gte": "2015-08-26T00:00:00Z",
"lte": "2015-08-26T23:59:59Z"
}
}
}
]
}
}
}
排除部分正常。我需要的是排除一些模式,如排除所有链接。
弹性搜索有可能吗?如果是的话,我怎么能实现它。
答案 0 :(得分:2)
术语聚合也有排除模式选项。 检查here。 所以,只需使用" http。*"作为排除模式。
要使其正常工作,您需要启用UAX Email tokeznier,以便链接在分析时不会被标记化。