如何从Retrieve和Rank(Solr)下载所有文档?

时间:2016-10-19 14:21:40

标签: solr ibm-cloud cloudant ibm-watson retrieve-and-rank

我们在Bluemix上有一个Cloudant数据库,其中包含大量文档,这些文档是文档转换服务构建的应答单元。这些答案单元用于为我们的应用程序填充Solr Retrieve和Rank 集合。 Cloudant数据库充当我们的答案单元记录系统。

由于不重要的原因,我们的Cloudant数据库不再有效。我们需要的是从Solr集合下载所有内容并重新创建Cloudant数据库的方法。谁能告诉我一种方法呢?

2 个答案:

答案 0 :(得分:0)

您可以将一个Cloudant数据库复制到另一个Cloudant数据库,这将为您创建一个精确的副本。

另一种技术是使用诸如Stream API之类的工具来获取数据库文档的副本(忽略任何删除),并允许您将数据保存在文本文件中。然后,您可以使用 couchrestore 工具将数据文件上载到新数据库。

有关详细信息,请参阅javadoc

答案 1 :(得分:0)

我不知道有任何自动执行此操作的方法。

您需要从Solr获取所有文档(并假设您有很多文档,以分页方式执行此操作 - 有一些示例说明如何在Solr doc中执行此操作)并将它们添加到Cloudant中。

请注意,您只能对您在架构中设置为stored的字段执行此操作。如果Cloudant中您需要的重要字段尚未存储在Solr中,那么您可能会陷入困境。 :(