Solr:从MySQL继续迁移

时间:2015-06-05 15:44:21

标签: mysql solr database-migration continuous

这可能听起来像是一个意见问题,但它实际上是一个技术问题:是否有维护简单数据集的标准流程?

我的意思是这样的:让我说我拥有的是一份清单(我们会说书)。主存储引擎是MySQL。我看到Solr有一个数据导入处理程序。我知道我可以使用它来在第一次运行时提取书籍记录 - 是否可以将其用于连续迁移?如果是这样的话,它是否也可以用于更新已经被拉入Solr的书籍,因为它可以用于提取新的书籍记录?

否则,如果数据导入处理程序不是标准方法,那么还有其他方法吗?想法?

非常感谢您的帮助!

2 个答案:

答案 0 :(得分:0)

如果要从Solr中更新文档,我相信您需要使用UpdateRequestHandler而不是DataImportHandler。我工作的地方从来没有这样做过,所以我对此并不了解。您可以找到感兴趣的链接:Uploading Data With Index Handlers

如果要使用新添加到MySQL数据库的记录更新Solr,可以将DataImportHandler用于delta-import。基本上,它是如何工作的,你在MySQL中有一些字段,显示新记录是新的。如果记录是新的,Solr将导入它。例如,在我工作的地方,我们有一个“更新”字段,Solr用它来确定它是否应该导入该记录。这是访问的一个很好的链接:DataImportHandler

答案 1 :(得分:0)

这个问题与我们正在进行的问题类似,但与SQL不同。它与HBase(hadoop堆栈DB)。但是我们有Hbase索引器,它在使用Solr映射DB之后,监听hbase(DB)中新事件的事件,然后执行代码以从DB中获取这些值并添加到Solr中。不确定是否有这样的SQL。然而,这个概念看起来很相在SQL中我知道可以监听插入和更新的触发器。即便如此,您也可以触发某些操作来执行以连续方式添加它们的步骤。