使用Solr搜索HTML标记?

时间:2012-05-07 14:41:24

标签: html solr

是否可以使用Solr在HTML文件中进行搜索,例如抓取网站?

2 个答案:

答案 0 :(得分:1)

Solr只是搜索索引。看看nutch爬网。 http://nutch.apache.org/about.html solr会将HTML编入索引。

答案 1 :(得分:0)

引用http://wiki.apache.org/nutch/NutchTutorial#A4._Setup_Solr_for_search

  

如果一切都按计划进行,我们现在准备搜索了   http://localhost:8983/solr/admin/。如果要查看原始HTML   由Solr索引,将schema.xml中的内容字段定义更改为: