Question

我正在为这样的列表建立索引：

doc_userid123
{
    followers:[
        {id:5, name:'john'},
        {id:6, name:'mari'},
        {id:7, name:'bart'}
    ]
}

所以，现在我想每天更新此列表并检测新的关注人员并停止关注。

问题是该列表可能有数百万个ID，因此比较整个列表将消耗大量RAM并花费很长时间才能完成。

一种可能的方法是每天索引一个文档，如下所示：

doc_userid123_2014-29-04
{
    followers:[...]
}

但这会存储许多重复信息。

我尝试更好地存储此信息而不会过度消耗RAM / CPU /磁盘。有什么想法吗？

Answer 1

您可以每天创建一个新索引，这样您就可以分别查询每一天或全部查询。这也是logstash在与ElasticSearch结合使用时默认执行的操作。