工作流平台,用于管理传入文件的处理

时间:2019-08-13 10:00:10

标签: workflow airflow cadence-workflow

通常,我只有一个要监视的工作流程。每当有新文件到达时,或者在某些预定的时间(即,我希望能够在工作流中插入新的“作业”)时,工作流就应该开始,并通过多个不同的任务和步骤来处理文件。我希望能够监视执行任务的每个文件。 各个任务的队列和分配负载可能由Celery管理,但尚未决定。

我看过Apache Airflow,据目前了解,它更适合于监视许多不同的工作流程,因此每个工作流程主要是从头到尾运行的,而不是在开始时添加新文件。前一次运行结束之前的流程。 Cadence工作流似乎可以满足我的需要,但似乎有些过大。

我不期望在这里有一个特定的最终解决方案,但是我希望能提出更多关于这些解决方案的建议,以便我研究和解决上述问题。

1 个答案:

答案 0 :(得分:0)

Luigi-https://luigi.readthedocs.io/en/stable/

与Airflow相比,重量极轻且速度快。