我有一个文件可以每天修改任意次。 我按时间顺序订购了这些文件,为每一天创建索引。 并且每天都会有相同文档的多个版本,并且修改日期不同。
文件样本:
{
id: 1234,
user: kc,
subscriptions: [
'paper1',
'paper2'
],
modified_date: 1466697434020
}
我正在寻找的是为所有用户获取特定时间范围内的最新文档 并在其上应用聚合。
这会产生一个结果,例如,在最后一周/每月,有多少人订阅了每篇论文。
使用top_hits我能够在一个时间范围内获取不同用户的最新文档,但我无法对这组数据进行进一步的聚合。