我正在尝试运行数据流作业,具有以下setup.py文件:
import setuptools
setuptools.setup(
name='Some-Name',
version='0.0.1',
install_requires=[
'apache-beam==2.10.0',
'tensorflow-transform==0.12.0'
],
packages=setuptools.find_packages(),
)
但是当我将作业提交给GCP时,SDK显示为2.7.0,并且该作业将无法运行。它会在1小时后停止,并显示以下错误:
工作流程失败。原因:数据流作业似乎被卡住了,因为在最近1小时内未发现任何工人活动。
答案 0 :(得分:1)
我通过更新提交数据流作业的本地虚拟环境中的tensorflow-transform
和apache-beam解决了此问题。更新本地apache-beam和tensorflow-transform
和tensorflow
后,它似乎可以工作了。我不确定为什么自setup.py
声明了软件包的版本。