如何在不使用DIH的情况下扩展SOLR索引?

时间:2015-05-18 05:25:17

标签: php apache solr dih

我的 SOLR 中有 2000万个文档。我正在使用 DIH 来索引SOLR中的增量更新。最后一小时索引 delta import 需要 2-3小时完全导入大约需要 5-6小时完成。除​​了DIH之外,还有什么方法可以加快这个过程吗?

1 个答案:

答案 0 :(得分:0)

你可以想到

  1. 在多个服务器之间分发索引
  2. 在多台服务器上复制索引
  3. 分发索引:将索引分成多个部分(分片),每个部分在一台单独的机器上运行。 然后,Solr将搜索分区为在单个分片上运行的子搜索,共同报告结果。这样,对于非常大的索引,您将体验到更快的性能。

    以下是有关在solr上进行缩放的精彩内容

    http://www.hathitrust.org/blogs/large-scale-search/scaling-large-scale-search-from-500000-volumes-5-million-volumes-and-beyond