应用错误收集

Crawler4j仅访问种子URL

时间：2013-08-05 22:03:34

标签： java web-crawler crawler4j

我正在使用crawler4j抓取rottentomatoes网站来提取结构化数据。我已经设置了一切，并且在项目主页上的示例中给出了默认URL，一切正常，但是当我放置自己的种子时，应用程序只访问我提供的URL。我错过了什么吗？

1 个答案:

答案 0 :(得分：1)

最常见的错误是shouldVisit方法总是返回false，因此抓取工具只访问种子网址。