标签: lucene solr
我正在索引一些数据,其中'@'字符应该被视为它的方式。 我还需要标准分析器提供的所有功能(消除标点符号,尾随等),但这也删除了@。 是否有任何地方我可以指定将字符视为不是标点符号?或者任何可以与whitespaceTokenizer一起使用的过滤器来获得这样的结果? 我知道我应该为这样的要求编写我自己的分析仪,但如果有一些非常明显的东西,我不想错过。
谢谢, 卡卡
答案 0 :(得分:0)
发现this帖子。感谢作者。将PatternTokenizerFactory与适当的过滤器一起使用。