我通过Heritrix3.0构建了一个抓取Web数据的工作。但它必须运行https://localhost:8443
作为 Java应用程序,然后构建服务器。我必须打开浏览器键入---
- hosts: debug
user: root
tasks:
- name: check if count ge 15
command: bash -c "ls /root | wc -l"
register: ifcount
ignore_errors: True
- debug: var=ifcount.stdout
- name: create new file if above command sucessfull
command: touch /tmp/file.html
when: ifcount -ge 15
来构建我的工作,然后启动工作。然后取消暂停工作。如何自动创建网络爬网的cron作业?请使用Java语言。