我正在运行几个月前我上次运行的数据流。来自同一客户端,具有相同的数据流版本(0.7.0dev0)。不幸的是,它以前所未有的神秘方式失败。
我正在开始工作,第一阶段是:
(8733429d016bc2fb):执行从数据存储区读取操作/拆分查询+从数据存储区读取/ GroupByKey / Reify +从数据存储区读取/ GroupByKey /写入
但它在1小时后出现以下错误:
(e88cb3c076926976):工作流程失败。原因:(e88cb3c07692626f):. 数据流似乎被卡住了。请联系Dataflow团队 http://stackoverflow.com/questions/tagged/google-cloud-dataflow
如果有帮助,JobID 2017-08-21_00_30_03-3588685705436948852 。我会升级到更新版本的库,但这需要更多的API更改,并弄清楚如何让所有部分再次运行。所以我现在正在努力。我希望“一个以前工作并且当前失败的简单用例”可能比更改甚至更多的东西更容易调试。
我不确定如何进一步调试或调查。它在几个月前使用相同的代码工作,但现在不起作用(使用大于4-5倍的数据集,200-300K记录,没什么可疯狂的......)
答案 0 :(得分:2)
这是通过升级到2.0.0来解决的(感谢Ben Chambers!)看来0.7.0在云数据流方面不再有效。