我在windows机器上使用apache-solr-3.6.0。我希望在索引之前删除所有标点符号,除了冒号和句号。
我试过了:
<fieldType name="text_ar" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.PatternReplaceFilterFactory" pattern="[\p{Punct}&&[^\.^\:]]" replacement="" replace="all"/>
</analyzer>
</fieldType>
但它没有用。任何想法?
答案 0 :(得分:2)
使用以下模式过滤器代替您的。
<filter class="solr.PatternReplaceFilterFactory" pattern="([^a-zA-Z0-9.:])" replacement="" replace="all"/>