Solr中的空间collasping Tokenizer / Filter

时间:2013-03-28 15:52:14

标签: solr

我在SOLR架构中有一个多值字段。我想知道是否存在可以删除空间的现有标记器/过滤器。例如,给定“solr,apache solr,倒置索引”,我想将它们作为“solr,apachesolr,invertedindex”。

1 个答案:

答案 0 :(得分:1)

在该字段的索引时间内,您可以使用PatternReplaceCharFilterFactory作为分析器链中的第一个条目。因此,在schema.xml中定义一个新的fieldType,如下所示:

<fieldtype name="text_no_ws" class="solr.TextField">
  <analyzer>
    <charFilter class="solr.PatternReplaceCharFilterFactory" 
                pattern=" " replacement=""/>
    ...

然后将其用作字段的类型,例如:

<field name="keywords" type="text_no_ws" multiValued="true" ... />