Lucene - 使用哪种分析仪来避免介词

时间:2011-03-28 19:10:21

标签: lucene

我正在使用Lucene标准分析器来解析文本。然而,它正在返回介词以及“i”,“the”,“and”等字样...... 是否有我可以使用的分析器不会返回这些词?

由于

1 个答案:

答案 0 :(得分:3)

StandardAnalyzer使用StopFilter

默认情况下,排除STOP_WORDS_SET中的字词。如果这还不够,那么有一些构造函数允许您传入一个应该从令牌流中删除的停用词列表。您可以使用FileSetReader提供列表。