如何使用apache nutch 1.3 api编写用于抓取网站的java代码?

时间:2011-09-02 08:49:30

标签: web-crawler nutch

我想用java和nutch 1.3 api编写一个程序来抓取这些网站 我在网上搜索,但没有示例代码 我怎样才能做到这一点? 感谢

1 个答案:

答案 0 :(得分:2)

嗯,你不需要编写任何Java代码......只需安装Nutch并关闭即可。但是你应该安装自包含的Nutch 1.2 使用Nutch1.3,你需要自己安装hadoop,你需要安装&用户Solr也适用于webseach。