标签: java lucene analyzer
我编写了一个自定义分析器,它包含一个带有长度的StandardAnalyzer。现在我想过滤掉只包含数字的所有术语。 实现这个的最佳方法是什么?
答案 0 :(得分:1)
您可能正在使用自定义TokenFilter。查看其中一个最简单的过滤器LowerCaseFilter。我想你会发现按照这些方式编写自己很容易。
TokenFilter
答案 1 :(得分:0)
您可以使用PatternReplaceFilter使用正则表达式检测并删除TokenStream中的数字。