Solr:从字段中删除双引号字符

时间:2015-04-28 16:44:32

标签: java regex solr

我们的一些文档中包含双引号字符,可能会破坏对这些文档的一些搜索。如何设置PatternReplaceCharFilterFactory以删除双引号字符?我尝试了各种转义字符,但无济于事,例如:

<charFilter class="solr.PatternReplaceCharFilterFactory" pattern="[;:\'\"\\*/\),\(\-]" replacement=" "/>

似乎不起作用,因为核心不会加载架构解析错误。

1 个答案:

答案 0 :(得分:1)

显然因为schema.xml是XML,所以我需要使用特殊的XML令牌&quot;