从弹性搜索中过滤重复的类似网址

时间:2018-12-08 17:35:32

标签: elasticsearch

使用ES 6.4.2。如何过滤以下结果。

<Button disabled={this.state.disabled}
    type="primary"
    htmlType="submit"
    style={{
      background: '#ff9700',
      fontWeight: 'bold',
      border: 'none',
      float: 'center',
    }}
    loading={this.state.loading}
    onClick={this.enterLoading}
    value="Next"
    id="buttontext"
    onClick="changeText()"
>
    Next 
</Button>

如何获得其中一项记录。标题和内容是相同的url,唯一的一个是需要过滤http和https。任何解决方案。

1 个答案:

答案 0 :(得分:1)

对此可能有多种解决方案,我能想到的最简单的方法是使用匹配短语查询来过滤结果。根据您的情况,这两个查询字词是

  

http:和https:

请注意,我故意在http后使用冒号,以使https短语不匹配。

这是您的查询

GET yourIndexName/_search
{
  "query": {
    "match_phrase": {
      "url": "http:"
    }
  }
}

GET yourIndexname/_search
{
  "query": {
    "match_phrase": {
      "url": "https:"
    }
  }
}