停止在Lucene中删除单词

时间:2012-09-26 12:30:12

标签: lucene

如何在Lucene中删除给定字符串中的停用词“这是化学方向”

2 个答案:

答案 0 :(得分:0)

我认为Lucene的StopFilter正是您所寻找的。

答案 1 :(得分:0)

你应该使用standardAnalyser,它知道某些令牌类型,小写,删除停用词,...... 使用standardAnalyser创建IndexWriter的示例:

public  IndexWriter Indexer(String dir) throws IOException {
    IndexWriter writer;
    Directory indexDir = FSDirectory.open(new File(dir).toPath());
    Analyzer analyzer = new StandardAnalyzer();
    IndexWriterConfig cfg = new IndexWriterConfig(analyzer);
    cfg.setOpenMode(OpenMode.CREATE);
    writer = new IndexWriter(indexDir, cfg);
    return writer;
}