我已经使用bin / nutch startserver命令本地启动了在服务器模式下运行nutch的测试。现在我想知道我是否可以在hadoop集群(在分布式环境中)的服务器模式中启动nutch,并使用nutch REST api向服务器提交爬网请求? 请帮忙。
答案 0 :(得分:1)
从进一步的研究中我得到了nutch服务器在分布式模式下工作。
步骤: -
cd $NUTCH_HOME/runtime/deploy
bin/nutch startserver -port <port> -host <host>
注意:端口和主机是可选的。快乐抓取:)