我想运行nutch2.3.1来抓取hadoop2上的数据。我有3个节点用于hadoop2:
我将nutch2.3.1部署到crawler1并使用以下命令运行它: / usr / local / nutch / deploy / bin / crawl hdfs://xxx.xxx.xxx.xxx/urls/seed.txt test 5
它可以工作并且可以抓取数据,但看起来爬行作业只在crawler1上运行,其他节点没有为nutch做任何工作。
我的问题是:
抱歉我的英语不好,非常感谢您提供的任何帮助。