我可以保护Solr中n-gram滤波器的短字吗?

时间:2013-02-21 14:28:50

标签: search solr lucene n-gram

我见过this question关于在Solr中搜索短文的问题。我想知道是否有另一种可能解决类似问题的方法。我正在使用EdgeNGramFilter,其minGramSize为3.我想保护一组特定的较短的单词(主要是两个字母的首字母缩略词),但是我希望将其中的minGramSize保留为3。 EdgeNGramFilter不支持受保护的单词列表。是否有任何过滤器或设置可以在单个字段类型中实现,或者我需要写一个?

或者,我是否以错误的方式思考这个问题?

1 个答案:

答案 0 :(得分:3)

认真思考这一点,但你提到的另一个问题的答案似乎是唯一的方法。这对于EdgeNGramFilter来说是一个有用的功能。

现在,您可以只为所需的首字母缩略词保留一个复制字段和KeepWordFilterFactory。或者,如果您的首字母缩略词列表不是先验的,请使用LengthFilter