查找包含elasticsearch中的术语的文档数

时间:2017-06-16 13:22:05

标签: search elasticsearch lucene information-retrieval

我有一个Elasticsearch索引,其中包含大约25亿个文档,在分析的字段中有大约1800万个不同的术语。是否可以在不搜索索引的情况下快速计算包含术语的文档数量?

似乎ES会在分析字段时存储该信息,或者可能能够计算倒排索引的长度。如果有办法搜索多个术语并获得每个术语的文档频率,那就更好了。我想定期做几千次,我不知道是否有一种有效的方法。

1 个答案:

答案 0 :(得分:1)

您可以使用Count API只返回查询中的计数,而不是完整的文档列表。

至于Elasticsearch是否为您提供了在没有查询的情况下执行此操作的方法:我有理由相信Elasticsearch在索引之外没有该信息的存储,因为这正是lucene索引已经确实。这就是倒排索引,即按术语索引的文档图。 Lucene旨在通过术语高效查找文档。