附加设置2.10.0时的Dataflow SDK 2.7.0

时间:2019-03-18 05:16:41

标签: python google-cloud-platform sdk google-cloud-dataflow apache-beam

我正在尝试运行数据流作业,具有以下setup.py文件:

import setuptools

setuptools.setup(
              name='Some-Name',
              version='0.0.1',
              install_requires=[
                  'apache-beam==2.10.0',
                  'tensorflow-transform==0.12.0'
                  ],
              packages=setuptools.find_packages(),
              )

但是当我将作业提交给GCP时,SDK显示为2.7.0,并且该作业将无法运行。它会在1小时后停止,并显示以下错误:

工作流程失败。原因:数据流作业似乎被卡住了,因为在最近1小时内未发现任何工人活动。

1 个答案:

答案 0 :(得分:1)

我通过更新提交数据流作业的本地虚拟环境中的tensorflow-transform和apache-beam解决了此问题。更新本地apache-beam和tensorflow-transformtensorflow后,它似乎可以工作了。我不确定为什么自setup.py声明了软件包的版本。