如何为Heritrix3网络抓取编写一个cron作业?

时间:2017-05-17 08:34:21

标签: java web-crawler heritrix

我通过Heritrix3.0构建了一个抓取Web数据的工作。但它必须运行https://localhost:8443作为 Java应用程序,然后构建服务器。我必须打开浏览器键入--- - hosts: debug user: root tasks: - name: check if count ge 15 command: bash -c "ls /root | wc -l" register: ifcount ignore_errors: True - debug: var=ifcount.stdout - name: create new file if above command sucessfull command: touch /tmp/file.html when: ifcount -ge 15 来构建我的工作,然后启动工作。然后取消暂停工作。如何自动创建网络爬网的cron作业?请使用Java语言。

0 个答案:

没有答案