当我们在SOLR中输入搜索词附件时,与复数词附件相比,我们得到的结果更少。我们缺少什么?

时间:2016-02-16 01:28:51

标签: solr

我们希望使用单个术语获得更多搜索结果,但我们在SOLR搜索结果中看到相反的情况。附件产生的结果比附件少。销售产生的结果少于销售。我们缺少什么?

1 个答案:

答案 0 :(得分:0)

您的问题是针对salesales的不同结果。您有sales的更多结果。

可能你的问题是关于文本语料库和标记化器。

文本语料库

在文本中使用复数形式的单词并不是单数形式,这并不罕见。

<强>标记生成器

作为默认solr使用standard query parser字段“text”,字段类型为“text_general”。

您可以使用solr analysis screen测试从单词(实际文本)到索引中相应标记的方式。

对于“text_general”,“sales”一词改为“sales”。 但对于“text_en”,“sales”这个词会出现在“sale”中。

因此,对于fieldtype“text_en”,您将获得“sales”和“sale”的相同匹配。

希望这会有所帮助,否则请从schema.xml发布您的搜索字段和定义...