应用错误收集

我正在考虑开始将Apache Airflow用于项目，并且想知道人们如何使用气流管理持续集成和依赖性。进一步来说说我有以下设置

3个Airflow服务器：dev staging and production。

我有两个python DAG'，其源代码我想保留在单独的回购中。 DAG本身很简单，基本上只是使用Python运算符来调用main（* args，** kwargs）。但是，main运行的实际代码非常大，并且可以扩展多个文件/模块。每个python代码库都有不同的依赖关系例如，

Dag1使用Python2.7 pandas == 0.18.1，requests = 2.13.0

Dag2使用Python3.6 pandas == 0.20.0和Numba == 0.27以及一些需要编译的cythonized代码

如何使用完全不同的依赖关系来管理运行这两个Dag的Airflow？此外，我如何管理这些Dags的代码持续集成到每个不同的Airflow enivornment（dev，staging，Prod）（我只是将jenkins或其他东西ssh到气流服务器并执行类似git pull origin BRANCH的操作）

希望这个问题不是太模糊，人们会看到我遇到的问题。

Apache Airflow持续集成工作流和依赖关系管理

1 个答案: