Elasticsearch显示重复的匹配

时间:2015-12-13 12:30:23

标签: javascript elasticsearch

如何修复elasticsearch结果中的重复问题?或者我们可以javascript删除这样的重复重新编码吗?

"hits": [
  {
    "_index": "yourservice",
    "_type": "categories",
    "_id": "AVGbSNBXiBkfr-xhHUl8",
    "_score": 0.40062606,
    "_timestamp": 1450009219159,
    "_source": {
      "name": "Home Theater "
    }
  },
  {
    "_index": "yourservice",
    "_type": "categories",
    "_id": "AVGbR7mdiBkfr-xhHUY2",
    "_score": 0.38263628,
    "_timestamp": 1450009147805,
    "_source": {
      "name": "Home Theater "
    }
  },
  {
    "_index": "yourservice",
    "_type": "categories",
    "_id": "AVGbSNBXiBkfr-xhHUo-",
    "_score": 0.33147845,
    "_timestamp": 1450009219159,
    "_source": {
      "name": "Landscape, Yard & Garden"
    }
  }
]

}

我已经看到使用elasticsearcg aggs进行了一些重复删除但是没有用。

由于

1 个答案:

答案 0 :(得分:1)

有两种方法可以处理这个

  1. 根据定义文档唯一性的字段创建_id。然后使用_create API创建文档。这里将拒绝重复文件的索引。
  2. 使用术语聚合查看重复文档。在require字段组合上使用术语聚合来检测重复元素,然后手动删除它们。
  3. 关于如何在blog中执行这些操作,有大量解释和代码示例。