如何获得语料库中所有单词的总数?

时间:2016-10-23 22:38:00

标签: java lucene

例如,集合中有3个文档,文档1有25个单词,文档2有30个单词,文档3有54个单词。我使用Lucene来索引集合。现在,如何获得语料库中的单词总数? (返回109)

1 个答案:

答案 0 :(得分:0)

您可以使用Fields.terms获取字段的条款,使用Terms.size获取字词数。

fields.terms("field").size()