标签: lucene
我正在使用Lucene标准分析器来解析文本。然而,它正在返回介词以及“i”,“the”,“and”等字样...... 是否有我可以使用的分析器不会返回这些词?
由于
答案 0 :(得分:3)
StandardAnalyzer使用StopFilter。
默认情况下,排除STOP_WORDS_SET中的字词。如果这还不够,那么有一些构造函数允许您传入一个应该从令牌流中删除的停用词列表。您可以使用File,Set或Reader提供列表。
File
Set
Reader