如何从Lucene的TokenStream中删除数字?

时间:2012-04-14 02:53:22

标签: java lucene analyzer

我编写了一个自定义分析器,它包含一个带有长度的StandardAnalyzer。现在我想过滤掉只包含数字的所有术语。 实现这个的最佳方法是什么?

2 个答案:

答案 0 :(得分:1)

您可能正在使用自定义TokenFilter。查看其中一个最简单的过滤器LowerCaseFilter。我想你会发现按照这些方式编写自己很容易。

答案 1 :(得分:0)

您可以使用PatternReplaceFilter使用正则表达式检测并删除TokenStream中的数字。