我使用Apache Lucene 5.1.0进行索引,我也使用自定义StopFilter。
我试图找到一种方法来保存,除了在Lucene索引中保存术语外,还有一个文档ID字典和该文档中已解析术语的列表。
在Lucene分析文档并删除停用词后,我无法理解如何检索这些术语。
任何帮助将不胜感激 - 我基本上试图找到一种方法来使用这些术语并将其链接到原始文档。
Document document = new Document();
Reader reader = new FileReader(file);
document.add(new TextField("fieldname",reader));
iwriter.addDocument(document);