应用错误收集

即使MaxCrawlDepth＆gt;，NCrawler也不会爬过第一个网址。 1

时间：2012-02-17 18:05:49

标签： web-crawler

即使MaxCrawlDepth＆gt;

NCrawler也不会超过第一个网址。 1.所以，如果我把yahoo.com和MaxCrawlDepth = 3，它只抓取该页面并停止。我还使用数据包嗅探器验证了这一点，因为它所使用的唯一地址是yahoo.com。

如何抓取页面中的每个链接？（我没有时间查看源代码）

2 个答案:

答案 0 :(得分：0)

NCrawler需要一个完整形成的URL。尝试使用http://www.yahoo.com

替换网址

答案 1 :(得分：0)

当我添加HTMLAgilityPack时会发生这种情况，请检查是否有它并将其删除。