标准分析器,不要将一个字符视为标点符号

时间:2010-09-06 02:46:13

标签: lucene solr

我正在索引一些数据,其中'@'字符应该被视为它的方式。 我还需要标准分析器提供的所有功能(消除标点符号,尾随等),但这也删除了@。 是否有任何地方我可以指定将字符视为不是标点符号?或者任何可以与whitespaceTokenizer一起使用的过滤器来获得这样的结果? 我知道我应该为这样的要求编写我自己的分析仪,但如果有一些非常明显的东西,我不想错过。

谢谢, 卡卡

1 个答案:

答案 0 :(得分:0)

发现this帖子。感谢作者。将PatternTokenizerFactory与适当的过滤器一起使用。