Elasticsearch:惩罚具有类似邻居的文档以解除群集

时间:2016-05-16 17:09:11

标签: search elasticsearch

我有一个填充了职位列表的Elasticsearch实例,当用户搜索时,它的目的是返回相关结果。但是,我们在每个作业中都有许多副本,但是在不同的位置,由于这些副本都与搜索非常相关,因此它们会出现在列表的顶部,结果很混乱。

以下是一个例子:

Search: facebook

Results:
 - Facebook Engineering Internship
   Atlanta, Georgia
 - Facebook Engineering Internship
   Madison, Wisconsin
 - Facebook Engineering Internship
   Palo Alto, California

我想在这里做的是去群集结果过于相似,有效地根据在它之前返回的文档惩罚特定文档结果。这将使最佳结果具有更多变化,看起来更像这样:

Search: facebook

Results:
 - Facebook Engineering Internship
   Atlanta, Georgia
 - Facebook Marketing Trainee
   Palo Alto, California
 - Social Media Expert: Facebook (Verizon)
   Chicago, Illinois
 - Facebook Engineering Internship
   Madison, Wisconsin

我该怎么做?如果我用基于邻居的文件处罚这个错误的方式概念化,请告诉我。

0 个答案:

没有答案