导出/导入Solr集合

时间:2019-12-26 14:25:41

标签: solr lucene solrcloud

我正在尝试从一个集合中导出数据并导入到另一个集合中,但是它实际上没有用。有2种不同的Solr实例,它们无法插入,因此我必须手动进行。

导出

curl --negotiate -u : "http://server1.fr.intranet:8983/solr/collection_source/select?q=*:*&wt=json&indent=true&rows=10000" >> collection_source.json

导入

 curl --negotiate -u : "http://server2.fr.intranet:8983/solr/new_collection/update/json?commit=true" --data-binary @/home/toto/collection_source.json -H 'Content-type:application/json'

collection_source.json必须在导入之前进行修改,删除第一个字段(由Solr添加),否则您将无法导入文件。 然后,有一个版本问题。在我的json中的每个文档中,都有一个版本字段“ version ”:12121,其值可以更改,具体取决于我猜该文档何时已上传到Solr。无论如何,这会导致“版本冲突”问题。如果删除版本字段,则可以使用,但是会失去文档层次结构和所有一致性。

那么导出和导入整个Solr集合的最佳方法是什么以及如何正确执行呢?还是我做错了什么?

谢谢

0 个答案:

没有答案