标签: java eclipse web-crawler nutch
我试图在Nutch 2.x中调用整个爬网管道,它正在使用bin / crawl命令行。但是,我相信它没有运行nutch-sites.xml中定义的parse-html插件。我在维基上发现你可以使用bin / nutch等调用插件...但是,我想知道如何在从喷射器运行所有作业到索引时调用ECLIPSE上的插件。 因此,我的问题是如何在Eclipse上运行Nutch 2.x中的插件?
提前致谢。