我有一个新的SOLR索引,在此标准标记器中效果很好。
有一个新的用例,我们希望它不被连字符分开,并且我们希望能够索引和搜索en-us
,但是目前它被连字符分开。
我们使用
<tokenizer class="solr.StandardTokenizerFactory" />
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.LengthFilterFactory" min="3" max="30"/>
有没有办法做到这一点?
A)让标准令牌生成器包含连字符,或者
B)用不同的规则重新创建标准令牌生成器?