Google Dataflow非python依赖项 - 单独的setup.py?

时间:2017-10-31 20:41:14

标签: google-cloud-dataflow

我们需要在我们的Dataflow流程中安装非Python依赖项(我们需要一个ODBC驱动程序来访问MSSQL DB)

我们已经使用以下步骤成功安装了setup.py https://cloud.google.com/dataflow/pipelines/dependencies-python#non-python-dependencies

我们希望保留原始setup.py的包(不会安装那些额外的依赖项);有没有办法使用不同的setup.py进行数据流安装?

我们尝试过:

  • 调用它setup_dataflow.py,但Dataflow引发了一个错误,指出需要调用它setup.py
  • 执行步骤here,并在子路径中使用setup.py到根路径。我们在那
  • 上没有成功

我们可以在if内尝试setup.py语句,以确定它是否已安装在数据流环境中(尽管我无法找到任何可靠的环境变量来识别此情况)

有任何意见/建议吗?

由于

1 个答案:

答案 0 :(得分:0)

目前没有方便的方法来做到这一点。你可以有两个不同的包,如下所示:

+- dataflow_pipeline
++- setup.py
+- original_pipeline
++- setup.py
++- pipeline.py

dataflow_pipeline/setup.py只需导入original_package,并添加额外的依赖项。

这不理想,但应该有效。