我想在我的java应用程序中使用Nutch API来从网站抓取 pdf 链接进行分析,如何在我的java应用程序中使用Nutch jar来实现?我能举个例子吗?
答案 0 :(得分:0)
首先,您需要通过下载并解压缩Nutch然后提供命令来将Nutch作为服务器运行
bin/nutch startserver
之后,您可以使用Java中的 RestTemplate 之类的REST客户端并调用所需的API。以下是Nutch提供的所有REST API的文档。
https://wiki.apache.org/nutch/Nutch_1.X_RESTAPI/RunningJobsTutorial