我有几个solr实例,一个有400万个文件,一个有800万个文件,我想分解并转移到新的solr环境。我想导出文档范围,以便最终我可以拥有一组实例,每个实例包含大约100万个文档。我已经读过关于简单地复制索引文件并查看luke之类的工具,但第一个选项强制我复制所有内容,而第二个选项提供范围选项,它只输出我存储的字段而不是我存储的字段已编入索引。
是否有任何工具可以导出我可以导入到另一个solr实例的一系列完整文档?
答案 0 :(得分:1)
这是分割Solr索引splitting lucene index into two halves的常用方法。如果有一个统一分布的逻辑键(如日期范围等),我已经多次这样做了很容易。
有一个Lucene索引splitting tool。我自己没有用过这个。
答案 1 :(得分:0)
为了只是'导出',您可以使用CSVResponseWriter进入csv,稍后您可以在另一个实例中进行索引,但它显然不会包含未存储的字段。
但是,如果您希望将索引划分为较小的索引,请查看IndexSplitter,查看更多信息in this question