如何在Lucene中删除给定字符串中的停用词“这是化学方向”
答案 0 :(得分:0)
我认为Lucene的StopFilter正是您所寻找的。 p>
答案 1 :(得分:0)
你应该使用standardAnalyser,它知道某些令牌类型,小写,删除停用词,...... 使用standardAnalyser创建IndexWriter的示例:
public IndexWriter Indexer(String dir) throws IOException {
IndexWriter writer;
Directory indexDir = FSDirectory.open(new File(dir).toPath());
Analyzer analyzer = new StandardAnalyzer();
IndexWriterConfig cfg = new IndexWriterConfig(analyzer);
cfg.setOpenMode(OpenMode.CREATE);
writer = new IndexWriter(indexDir, cfg);
return writer;
}