我有2个核心, core1 和 core2 ,我正在尝试使用多个内核实现以下功能。
1)如何删除core1中的所有条目(仅core1)
通常,当我只有一个核心时,我使用以下命令删除所有文件
java -Ddata = args -Dcommit = true -jar post.jar" :"
2)使用Nutch,如何仅在core2中索引Web文档。 (不在core1中)
答案 0 :(得分:0)
每个核心都有一个单独的Url(参见下面的示例)。只需为您的删除和索引操作分别引用每个核心。
http://localhost:8983/solr/core1
http://localhost:8983/solr/core2
1)对于删除,我建议使用可以通过curl执行的Delete by ID or Query选项,指定core1的URL。
2)要使用Nutch索引到core2,只需在索引步骤中使用适当的url作为core2。
答案 1 :(得分:0)
问题1: 出于某种原因,我的curl命令给了我错误。 我纠正了它,现在工作正常。
curl localhost:8983/solr/core1/update/?commit=true -H "Content-Type: text/xml" -d "<delete><query>*:*</query></delete>
问题2: 为了使用Nutch将数据索引到不同的核心,我使用了以下命令,它对我有用。因此,与你分享思想。
bin/nutch crawl urls -solr http://localhost:8983/solr/core1/ -depth 3 -topN 5
bin/nutch crawl urls -solr http://localhost:8983/solr/core2/ -depth 3 -topN 5