拆分Solr指数1.4

时间:2011-07-29 06:08:21

标签: solr

我有一个Solr索引1.4,其大小超过20 GB。我想将它拆分为2或3个索引。 Lucene 3.3具有PKIndexSplitter功能,但它不能与Solr 1.4索引一起使用。

是否可以拆分Solr指数1.4?

感谢您的帮助 混合

2 个答案:

答案 0 :(得分:2)

Solr 1.4中没有“方法”可以做到这一点。您需要做的是制作索引的两个副本。在每个副本中,删除记录。然后优化。

然后你可以对两个索引进行分布式搜索。

希望它有所帮助。

答案 1 :(得分:0)

我编写了一个命令行实用程序,根据推荐的

方法将Lucene索引拆分为分片

document.uniqueId.hashCode() % numShards

您可以从GitHub抓取它:Hash-Based Index Splitter

另请参阅Multi Pass Index Splitter,它可以按顺序(例如[1,1,1,2,2,2,3,3,3,4,4,4])或循环(例如[1,2,3,4,1,2,3,4,1,2,3,4])拆分索引。

由于文档不包含后者的用法,因此它是:

Usage: MultiPassIndexSplitter -out <outputDir> -num <numParts> [-seq] <inputIndex1> [<inputIndex2 ...]
    inputIndex  path to input index, multiple values are ok
    -out ouputDir   path to output directory to contain partial indexes
    -num numParts   number of parts to produce
    -seq    sequential docid-range split (default is round-robin)