如何从elasticsearch中的tagcloud facet中排除模式

时间:2015-08-30 05:58:31

标签: elasticsearch

我们正在使用Elasticsearch在我们的网站中生成标签云。用于创建标记云的查询如下。

{
"size": 0,
"facets": {
    "tagcloud": {
        "terms": {
            "field": "body.body",
            "size": "20",
            "exclude": [
                "http",
                "t.co"
            ]
        }
    }
},
"query": {
    "bool": {
        "must": [
            {
                "range": {
                    "body.postedTime": {
                        "gte": "2015-08-26T00:00:00Z",
                        "lte": "2015-08-26T23:59:59Z"
                    }
                }
            }
        ]
    }
}
}

排除部分正常。我需要的是排除一些模式,如排除所有链接。

弹性搜索有可能吗?如果是的话,我怎么能实现它。

1 个答案:

答案 0 :(得分:2)

术语聚合也有排除模式选项。 检查here。 所以,只需使用" http。*"作为排除模式。

要使其正常工作,您需要启用UAX Email tokeznier,以便链接在分析时不会被标记化。