标签: java apache web-crawler nutch
我正在使用apache-nutch-2.1抓取。是否有可能将抓取的结果作为json?我使用apache-nutch-2.1写了一个java程序来抓取。我将如何将已爬网结果作为JSON进行检索。这可能是一个愚蠢的问题,但当我谷歌它。与此无关。
apache-nutch-2.1
如何添加我获得爬网结果的json?
答案 0 :(得分:1)
您正在寻找的功能已经实施:Nutch-932 retrieve crawl results as JSON
还有一些例子如何在上面的链接中使用它。