我想为多个域创建自定义搜索引擎 如何使用solr with nutch为500多个域创建自定义搜索,而搜索每个域应该能够显示自己的数据。
e.g。
example.com exapmle2.com example3.com等等,当用户在example.com上搜索时,他应该为example2.com获取属于example.com的数据,依此类推
这些网站可能是博客文章,电子商务网站,分类网站或酒店预订网站。
任何建议将不胜感激。
答案 0 :(得分:1)
这应该可以开箱即用。当您使用nutch模式索引到solr时,它有一个名为site的字段来存储域。在您选择域(也称为站点)的搜索界面(您将构建)上,您只需传递一个过滤查询,如“site:domain”,以便结果仅限于搜索的域。
注意:如果要限制对已注入域的爬网,请确保将nutch中的external links属性设置为false。
希望能回答你的问题。