如何在所有文档中获取特定字段的所有频率条款? 我找到了一个解决方案,如何使用termvector获取指定文档的此信息,但我该如何为所有文档执行此操作?
答案 0 :(得分:1)
在Lucene 4.0中,您可以使用MultiFields
访问字段的字词 IndexReader indexReader = IndexReader.open(index);
Terms terms = MultiFields.getFields(indexReader).terms("field");
if(terms != null){
TermsEnum iterator = terms.iterator();
BytesRef byteRef = null;
while((byteRef = iterator.next()) != null) {
String term = byteRef.utf8ToString();
...
}
}