如何在Java应用程序中使用Nutch API?

时间:2014-11-04 06:31:07

标签: java web-crawler nutch

我想在我的java应用程序中使用Nutch API来从网站抓取 pdf 链接进行分析,如何在我的java应用程序中使用Nutch jar来实现?我能举个例子吗?

1 个答案:

答案 0 :(得分:0)

首先,您需要通过下载并解压缩Nutch然后提供命令来将Nutch作为服务器运行

bin/nutch startserver

之后,您可以使用Java中的 RestTemplate 之类的REST客户端并调用所需的API。以下是Nutch提供的所有REST API的文档。

https://wiki.apache.org/nutch/Nutch_1.X_RESTAPI/RunningJobsTutorial