每天一个索尔指数

时间:2015-03-20 11:06:22

标签: solr lucene

我们正在尝试构建的系统的要求是我们创建包含大约350-5亿个文档的SOLR索引所需的每个日期,其中每个文档都是一个包含大约1000个字段的结构化记录。

然后根据索引键和&amp ;;查询相同的内容。例如,我们将尝试在2015年1月1日至2015年1月31日期间搜索与特定用户相关的记录。此查询应仅将此日期范围内的索引加载到内存中,并返回与搜索模式对应的行。

请建议如何使用SOLR实现此目的。

1 个答案:

答案 0 :(得分:0)

好像你可以用SolrCloud做到这一点:

  • 每天一次收集
  • 根据您的需求设置每个集合的分片数/复制数等(您的查询吞吐量是多少......)
  • 另外,如果收集的数量开始太多(请参阅this presentation about this,您可以进一步将数据划分为多个SolrCloud集群(每年一次/ 5年或其他)