我有一个Solr索引1.4,其大小超过20 GB。我想将它拆分为2或3个索引。 Lucene 3.3具有PKIndexSplitter功能,但它不能与Solr 1.4索引一起使用。
是否可以拆分Solr指数1.4?
感谢您的帮助 混合
答案 0 :(得分:2)
Solr 1.4中没有“方法”可以做到这一点。您需要做的是制作索引的两个副本。在每个副本中,删除记录。然后优化。
然后你可以对两个索引进行分布式搜索。
希望它有所帮助。
答案 1 :(得分:0)
我编写了一个命令行实用程序,根据推荐的
方法将Lucene索引拆分为分片 document.uniqueId.hashCode() % numShards
您可以从GitHub抓取它:Hash-Based Index Splitter
另请参阅Multi Pass Index Splitter,它可以按顺序(例如[1,1,1,2,2,2,3,3,3,4,4,4]
)或循环(例如[1,2,3,4,1,2,3,4,1,2,3,4]
)拆分索引。
由于文档不包含后者的用法,因此它是:
Usage: MultiPassIndexSplitter -out <outputDir> -num <numParts> [-seq] <inputIndex1> [<inputIndex2 ...]
inputIndex path to input index, multiple values are ok
-out ouputDir path to output directory to contain partial indexes
-num numParts number of parts to produce
-seq sequential docid-range split (default is round-robin)