我正在构建一个搜索引擎,需要抓取网页,对其编制索引并能够搜索数据。
我可以单独使用Apache Solr,还是首先需要Nutch来抓取网络?
答案 0 :(得分:3)
您需要一个抓取工具来收集内容,因此Solr可以将其编入索引。 Nutch和Crawl Anywhere与Solr合作良好。
答案 1 :(得分:1)
Solr是一个索引器,Nutch是一个Crawler! 他们不能做彼此的工作! 如果你想拥有一个搜索引擎,你必须拥有一个爬虫和一个索引器! 您可以更改它们,甚至可以为此创建自己的应用程序!