将MySQL DB和XML Hybrid处理为Solr索引

时间:2012-02-14 15:53:12

标签: mysql solr lucene xml-parsing dataimporthandler

问题:

MySQL中的表格     有一些正常的领域和     一个包含XML的文本字段

我需要使用Solr数据导入处理程序将此表处理为Solr索引     但是,需要将XML字段解析为其他几个solr字段

问题:

  1. 是否可以在不必编写自定义Transformer的情况下执行此操作?如果是的话。我可以将XPathEntityProcessor与我的SQL DB一起用作数据源吗?

  2. 如果我编写自定义变换器,我究竟如何在dataConfig中配置它?

  3. 我使用的是旧版本的solr(1.4.1),所以我可以将一个带有新类的新jar放入我的solr web-app中吗?

  4. 我不太确定的是我需要如何配置data-config.xml来执行此操作。如果有人有任何例子,请分享!感谢。

1 个答案:

答案 0 :(得分:2)

我的建议是编写一个程序,从数据库中选择数据,解析XML数据字段,然后将整个文档插入到SOLR索引中。

solrj Java apis非常容易使用。最难的部分是解析XML,但这是一个更容易的挑战,更容易测试。