我们有一个索引,其中包含以下文档结构:
{
email: "test@test.com",
stuff ..
},
{
email: "test@test.com,
stuff...
},
{
email: anotherEmail@test.com,
stuf..
}
我们需要获取所有记录,其中不同电子邮件的数量是>例如2。我知道我可以使用带有最小文档计数的聚合来查找电子邮件至少有2条记录的所有记录的所有计数。
但我们需要做的是实际获取所有记录,其中不同电子邮件的数量是> X.因此,我们需要查询将结果限制为仅匹配聚合的记录。
我知道我们可以有一个嵌套的TopHits
聚合,但这对我们来说还不够好,因为我们需要能够翻阅这些结果...可能有记录,其中一封电子邮件有10k记录例如。我们需要能够在Hits集合中获得这些结果,以便我们可以对它们进行分页。
我们将如何做这样的事情?