nutch 2.3

时间:2016-04-22 18:56:09

标签: nutch

我正在尝试使用Linux Mint 17.2上的nutch 2.3抓取网络数据,但是收到以下错误消息 “失败,出现以下错误:java.net.UnknownHostException:” 我想知道导致此错误的原因以及解决方法。我的观察是,此错误有时会出现另一条错误消息“无法获取robots.txt”。这两个错误之间有什么关系以及如何解决这个问题?感谢。

1 个答案:

答案 0 :(得分:0)

通常当Nutch无法解析给定的网址时会发生这种情况,特定网址会发生这种情况吗?或者当你运行一些特定的Nutch命令时?