我们想使用Apache Airflow来安排Scrapy Python Spiders和其他一些脚本。 我们将有成千上万的蜘蛛,而且它们的调度每天都可能有所不同,因此我们希望能够每天从数据库自动创建Airflow dag并将它们全部调度一次。我看到的唯一的气流示例使用python脚本编写DAG文件。
创建dag文件和自动调度的最佳方法是什么?
编辑: 我设法使用YAML文件找到了一个可行的解决方案 https://codeascraft.com/2018/11/14/boundary-layer%E2%80%89-declarative-airflow-workflows/