“数据流似乎陷入困境”

时间:2017-08-21 08:47:35

标签: google-cloud-dataflow

我正在运行几个月前我上次运行的数据流。来自同一客户端,具有相同的数据流版本(0.7.0dev0)。不幸的是,它以前所未有的神秘方式失败。

我正在开始工作,第一阶段是:

  

(8733429d016bc2fb):执行从数据存储区读取操作/拆分查询+从数据存储区读取/ GroupByKey / Reify +从数据存储区读取/ GroupByKey /写入

但它在1小时后出现以下错误:

  

(e88cb3c076926976):工作流程失败。原因:(e88cb3c07692626f):.   数据流似乎被卡住了。请联系Dataflow团队   http://stackoverflow.com/questions/tagged/google-cloud-dataflow

如果有帮助,JobID 2017-08-21_00_30_03-3588685705436948852 。我会升级到更新版本的库,但这需要更多的API更改,并弄清楚如何让所有部分再次运行。所以我现在正在努力。我希望“一个以前工作并且当前失败的简单用例”可能比更改甚至更多的东西更容易调试。

我不确定如何进一步调试或调查。它在几个月前使用相同的代码工作,但现在不起作用(使用大于4-5倍的数据集,200-300K记录,没什么可疯狂的......)

1 个答案:

答案 0 :(得分:2)

这是通过升级到2.0.0来解决的(感谢Ben Chambers!)看来0.7.0在云数据流方面不再有效。