Google云数据流因重复错误“同步Pod出错...通过CrashLoopBackOff未能针对“ sdk”而针对“ sdk”失败到“ StartContainer””

时间:2018-12-12 02:15:16

标签: go google-cloud-dataflow apache-beam

SDK:适用于Go 0.5.0的Apache Beam SDK

我们的Golang作业在Google Cloud Data流上运行良好已有数周了。我们尚未对作业本身进行任何更新,并且SDK版本似乎与以前相同。昨晚失败了,我不确定为什么。到了1小时的时间限制,并且由于没有工人活动而取消了工作。

看看Stackdriver日志,我唯一能看到的就是Error syncing pod...failed to "StartContainer" for "sdk" with CrashLoopBackOff的重复错误

似乎无法同步pod(?),因此等待5分钟再重试。

任何人都可以阐明造成这种情况的原因以及我们如何找到更多信息或诊断问题的原因吗?

注意:我检查了Google Cloud Data流的状态,该服务似乎没有任何中断。

2 个答案:

答案 0 :(得分:1)

我们有类似的发现,发现这无法启动工作程序(对我们来说,由于slf4j问题,但这可能会阻止工作程序以任何语言启动。)

如果您查看Stackdriver Logs(在UI中查看日志,然后单击链接转到Stackdriver),则应该能够查看worker_startup日志。

答案 1 :(得分:0)

我今天遇到了同样的问题,并按照说明here来构建自己的图像,将其推送到公共仓库中,并与--worker_harness_container_image选项一起使用,它对我有用。