我在SOLR架构中有一个多值字段。我想知道是否存在可以删除空间的现有标记器/过滤器。例如,给定“solr,apache solr,倒置索引”,我想将它们作为“solr,apachesolr,invertedindex”。
答案 0 :(得分:1)
在该字段的索引时间内,您可以使用PatternReplaceCharFilterFactory作为分析器链中的第一个条目。因此,在schema.xml中定义一个新的fieldType,如下所示:
<fieldtype name="text_no_ws" class="solr.TextField">
<analyzer>
<charFilter class="solr.PatternReplaceCharFilterFactory"
pattern=" " replacement=""/>
...
然后将其用作字段的类型,例如:
<field name="keywords" type="text_no_ws" multiValued="true" ... />