如何使用Lucene构建我自己的“常用词”过滤器

时间:2013-02-26 15:13:50

标签: java search-engine lucene

我知道Lucene使用停用词(通用)过滤器进行搜索,我也知道,对于这项工作,标准分析器 EnglishAnalyzer 负责。那么,如果我想将自己的常用词添加到分析器过滤器中呢?我怎么能添加计算机,互联网,系统等词语。

1 个答案:

答案 0 :(得分:2)

我认为“常用词”是指停用词

要添加到标准列表,只需使用StandardAnalyzer的另一个构造函数(它接受CharArraySetReader的停用词。要获得标准的限位词集,请使用StopAnalyzer.STOP_WORDS_SET