是否可以使用Solr在HTML文件中进行搜索,例如抓取网站?
答案 0 :(得分:1)
Solr只是搜索索引。看看nutch爬网。 http://nutch.apache.org/about.html solr会将HTML编入索引。
答案 1 :(得分:0)
引用http://wiki.apache.org/nutch/NutchTutorial#A4._Setup_Solr_for_search
如果一切都按计划进行,我们现在准备搜索了 http://localhost:8983/solr/admin/。如果要查看原始HTML 由Solr索引,将schema.xml中的内容字段定义更改为: