多个域的nutch和solr

时间:2012-07-26 13:33:16

标签: solr lucene search-engine nutch

我想为多个域创建自定义搜索引擎 如何使用solr with nutch为500多个域创建自定义搜索,而搜索每个域应该能够显示自己的数据。

e.g。
 example.com exapmle2.com example3.com等等,当用户在example.com上搜索时,他应该为example2.com获取属于example.com的数据,依此类推

这些网站可能是博客文章,电子商务网站,分类网站或酒店预订网站。

任何建议将不胜感激。

1 个答案:

答案 0 :(得分:1)

这应该可以开箱即用。当您使用nutch模式索引到solr时,它有一个名为site的字段来存储域。在您选择域(也称为站点)的搜索界面(您将构建)上,您只需传递一个过滤查询,如“site:domain”,以便结果仅限于搜索的域。

注意:如果要限制对已注入域的爬网,请确保将nutch中的external links属性设置为false。

希望能回答你的问题。