如何从Solr的标准令牌生成器中删除字符?

时间:2019-05-13 01:09:20

标签: solr lucene

我有一个新的SOLR索引,在此标准标记器中效果很好。

有一个新的用例,我们希望它不被连字符分开,并且我们希望能够索引和搜索en-us,但是目前它被连字符分开。

我们使用

<tokenizer class="solr.StandardTokenizerFactory" />
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.LengthFilterFactory" min="3" max="30"/>

有没有办法做到这一点?

A)让标准令牌生成器包含连字符,或者

B)用不同的规则重新创建标准令牌生成器?

0 个答案:

没有答案