ElasticSearch从所有文档中的字段中获取所有术语

时间:2016-03-16 20:26:38

标签: elasticsearch

如何在所有文档中获取特定字段的所有频率条款? 我找到了一个解决方案,如何使用termvector获取指定文档的此信息,但我该如何为所有文档执行此操作?

1 个答案:

答案 0 :(得分:1)

在Lucene 4.0中,您可以使用MultiFields

访问字段的字词
    IndexReader indexReader = IndexReader.open(index);
    Terms terms = MultiFields.getFields(indexReader).terms("field");
    if(terms != null){
       TermsEnum iterator = terms.iterator();
       BytesRef byteRef = null;
       while((byteRef = iterator.next()) != null) {
         String term =  byteRef.utf8ToString();
         ...
       }
    }