doc indexing - 如何检测和存储新关注者以及停止关注的人员

时间:2014-04-29 21:04:49

标签: database indexing elasticsearch

我正在为这样的列表建立索引:

doc_userid123
{
    followers:[
        {id:5, name:'john'},
        {id:6, name:'mari'},
        {id:7, name:'bart'}
    ]
}

所以,现在我想每天更新此列表并检测新的关注人员并停止关注

问题是该列表可能有数百万个ID,因此比较整个列表将消耗大量RAM并花费很长时间才能完成。

一种可能的方法是每天索引一个文档,如下所示:

doc_userid123_2014-29-04
{
    followers:[...]
}

但这会存储许多重复信息。

我尝试更好地存储此信息而不会过度消耗RAM / CPU /磁盘。有什么想法吗?

1 个答案:

答案 0 :(得分:1)

您可以每天创建一个新索引,这样您就可以分别查询每一天或全部查询。这也是logstash在与ElasticSearch结合使用时默认执行的操作。