我正在使用`
Nutch的
`和'
Solr的
整合过程。我能够抓取一些网站数据并将其传递到solr系统,我可以轻松访问。现在我也想从mysql导入数据并将两个数据放在一起但不同的索引。我已经尝试从mysql导入数据,我也成功地做到了这一点,但后来它取代了在爬行数据上创建的所有索引,间接地我丢失了我的爬行数据。所以有人可以帮我完成上述过程吗?
答案 0 :(得分:0)
您需要为MySQL的导入任务创建单独的集合。这些在Solr配置目录中定义 - 请参阅分发中的example/solr
以获得最小设置。您可以根据需要创建任意数量的集合,并且每个集合将与现有集合分开处理。
还有可能在同一索引中使用不同的内容,但这可能会导致Nutch出现问题 - 它将要求您更改DataImportHandler中的preImportDeleteQuery
,并处理数据中的删除由你自己设定。