运行apache Nutch 2.2.1

时间:2013-07-08 09:18:37

标签: java apache web-crawler nutch

我想使用Apache Nutch 2.2.1进行网页抓取。它只有src文件。我该怎么办呢。有没有可用的教程。我希望结果为Json。 apache 1.6在我的系统中完美运行。

请有人帮助我吗?

1 个答案:

答案 0 :(得分:2)

您可能想要关注此链接http://nlp.solutions.asia/?p=362,但这对Nutch 2.2而言不是2.2.1。您可以查看至少如何开始使用src文件的链接。希望这有帮助!