把Solraw中的Crawled数据和mysql数据放在一起

时间:2014-12-29 07:36:05

标签: php mysql solr nutch dataimporthandler

我正在使用`

  

Nutch的

`和'

  

Solr的

整合过程。我能够抓取一些网站数据并将其传递到solr系统,我可以轻松访问。现在我也想从mysql导入数据并将两个数据放在一起但不同的索引。我已经尝试从mysql导入数据,我也成功地做到了这一点,但后来它取代了在爬行数据上创建的所有索引,间接地我丢失了我的爬行数据。所以有人可以帮我完成上述过程吗?

1 个答案:

答案 0 :(得分:0)

您需要为MySQL的导入任务创建单独的集合。这些在Solr配置目录中定义 - 请参阅分发中的example/solr以获得最小设置。您可以根据需要创建任意数量的集合,并且每个集合将与现有集合分开处理。

还有可能在同一索引中使用不同的内容,但这可能会导致Nutch出现问题 - 它将要求您更改DataImportHandler中的preImportDeleteQuery,并处理数据中的删除由你自己设定。