为什么Dataflow步骤无法启动?

时间:2018-05-11 21:04:42

标签: google-cloud-platform google-cloud-dataflow apache-beam

我有一个线性的三步数据流管道 - 由于某种原因,最后一步开始,但前面的两个步骤挂在Not started很长一段时间才放弃并杀死了这个工作。我不确定是什么导致这种情况,因为这条管道过去已成功运行,我很惊讶它没有在日志中显示任何阻止前两步的错误从开始。什么可能导致这种情况,我该如何防止它发生?

1 个答案:

答案 0 :(得分:2)

这是因为工人启动时出错。某些数据流步骤似乎不需要工作人员(例如写入GCS),这就是该步骤能够启动的原因 - 即该步骤启动并不意味着正确地创建了工作人员。默认情况下,工作日志中不显示工作人员启动 - 您需要单击作业日志中的Stackdriver链接,然后在日志下拉列表中添加worker-startup以查看任何错误