标签: apache solr web-crawler
我在this question page上读到,solr 5+支持网络抓取,这意味着我们不再需要nutch。是否有任何示例或说明来解释如何设置solr 6.6抓取一组远程网站?
答案 0 :(得分:1)
他们很可能意味着using DIH拥有正确的数据源,但我怀疑这可以在许多场景中取代Nutch等。