Question

在我的文档中，我有一个名为Tag和SuperTag的字段。每当一个标签匹配它会提高一些分数，但如果匹配SuperTag它将显着提高，使其成为第一选择。在您看来，我应该在Tag和SuperTag的boost字段中添加什么价值？感谢。

Answer 1

这很难回答，这取决于两个字段包含的数据和它们拥有的分析器。

显然，如果两者的数据几乎相同，我会将超级字段字段的提升设置为2.0。

如果他们没有相同的数据我们可以想象这样的场景：

{tag: 'tagnice tagnice tagnice'}

{supertag: 'tagnice'}

即使有提升的超级标签，标签也可能更有意义，因为tf-idf会给它带来更大的分数。

为了解决这个问题，例如，设置为具有过滤器唯一性的分析器将有所帮助。

如上所述，它在很大程度上取决于数据以及如何将其存储在lucene中。乍一看，在不知道这么多的情况下，加倍可以起作用。