Solr StandardTokenizer外卡标点符号在同一个单词中一起唱怪行为

时间:2015-12-16 08:42:05

标签: solr wildcard punctuation

我遇到了Solr的StandardTokenizer问题。

如果我正在寻找:

text_field:lastname 

它会找到一些东西

如果我正在寻找:

text_field:last*ame

它会找到soething

如果我正在寻找:

text_field:lastname;

但如果我搜索:

text_field:last*ame;

搜索没有返回任何内容。为什么? StandardTokenizer不应该从单词的末尾去掉标点符号吗?基本上,如果我在一个单词中使用外卡和标点符号,则标点符号不再是条纹。即使我们使用通配符,还有一种方法可以删除标点符号吗?

1 个答案:

答案 0 :(得分:1)

当您进行通配符查询时,Solr不会对查询执行任何分析。该术语仅用于对为该字段存储的令牌进行外卡匹配。 StandardTokenizer将在字边界上拆分,;将被视为边界 - 这意味着索引的令牌不包含;,但查询将会。{/ p>

您可能希望删除查询图层中的;

Here是SOLR文档的链接,进一步解释了为什么通配符和其他多项查询不进行分析。