我们需要在我们的Dataflow流程中安装非Python依赖项(我们需要一个ODBC驱动程序来访问MSSQL DB)
我们已经使用以下步骤成功安装了setup.py
https://cloud.google.com/dataflow/pipelines/dependencies-python#non-python-dependencies
我们希望保留原始setup.py
的包(不会安装那些额外的依赖项);有没有办法使用不同的setup.py
进行数据流安装?
我们尝试过:
setup_dataflow.py
,但Dataflow引发了一个错误,指出需要调用它setup.py
。 setup.py
到根路径。我们在那我们可以在if
内尝试setup.py
语句,以确定它是否已安装在数据流环境中(尽管我无法找到任何可靠的环境变量来识别此情况)
有任何意见/建议吗?
由于
答案 0 :(得分:0)
目前没有方便的方法来做到这一点。你可以有两个不同的包,如下所示:
+- dataflow_pipeline
++- setup.py
+- original_pipeline
++- setup.py
++- pipeline.py
dataflow_pipeline/setup.py
只需导入original_package
,并添加额外的依赖项。
这不理想,但应该有效。