Solr - 删除特定的标点符号

时间:2012-09-24 09:06:58

标签: solr solrj

我在windows机器上使用apache-solr-3.6.0。我希望在索引之前删除所有标点符号,除了冒号和句号。

我试过了:

<fieldType name="text_ar" class="solr.TextField" positionIncrementGap="100">
      <analyzer> 
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <filter class="solr.PatternReplaceFilterFactory" pattern="[\p{Punct}&&[^\.^\:]]" replacement="" replace="all"/>
      </analyzer>
    </fieldType>

但它没有用。任何想法?

1 个答案:

答案 0 :(得分:2)

使用以下模式过滤器代替您的。

<filter class="solr.PatternReplaceFilterFactory" pattern="([^a-zA-Z0-9.:])" replacement="" replace="all"/>