Nutch抓取结果为JSON

时间:2013-06-21 05:03:42

标签: java apache web-crawler nutch

我正在使用apache-nutch-2.1抓取。是否有可能将抓取的结果作为json?我使用apache-nutch-2.1写了一个java程序来抓取。我将如何将已爬网结果作为JSON进行检索。这可能是一个愚蠢的问题,但当我谷歌它。与此无关。

如何添加我获得爬网结果的json?

1 个答案:

答案 0 :(得分:1)

您正在寻找的功能已经实施:Nutch-932 retrieve crawl results as JSON

还有一些例子如何在上面的链接中使用它。