在我的文档中,我有一个名为Tag和SuperTag的字段。每当一个标签匹配它会提高一些分数,但如果匹配SuperTag它将显着提高,使其成为第一选择。在您看来,我应该在Tag和SuperTag的boost字段中添加什么价值?感谢。
答案 0 :(得分:1)
这很难回答,这取决于两个字段包含的数据和它们拥有的分析器。
显然,如果两者的数据几乎相同,我会将超级字段字段的提升设置为2.0
。
如果他们没有相同的数据我们可以想象这样的场景:
{tag: 'tagnice tagnice tagnice'}
{supertag: 'tagnice'}
即使有提升的超级标签,标签也可能更有意义,因为tf-idf
会给它带来更大的分数。
为了解决这个问题,例如,设置为具有过滤器唯一性的分析器将有所帮助。
如上所述,它在很大程度上取决于数据以及如何将其存储在lucene中。乍一看,在不知道这么多的情况下,加倍可以起作用。