我有一个填充了职位列表的Elasticsearch实例,当用户搜索时,它的目的是返回相关结果。但是,我们在每个作业中都有许多副本,但是在不同的位置,由于这些副本都与搜索非常相关,因此它们会出现在列表的顶部,结果很混乱。
以下是一个例子:
Search: facebook
Results:
- Facebook Engineering Internship
Atlanta, Georgia
- Facebook Engineering Internship
Madison, Wisconsin
- Facebook Engineering Internship
Palo Alto, California
我想在这里做的是去群集结果过于相似,有效地根据在它之前返回的文档惩罚特定文档结果。这将使最佳结果具有更多变化,看起来更像这样:
Search: facebook
Results:
- Facebook Engineering Internship
Atlanta, Georgia
- Facebook Marketing Trainee
Palo Alto, California
- Social Media Expert: Facebook (Verizon)
Chicago, Illinois
- Facebook Engineering Internship
Madison, Wisconsin
我该怎么做?如果我用基于邻居的文件处罚这个错误的方式概念化,请告诉我。