在Cloud Dataflow中,我如何知道何时同步或异步执行管道代码?

时间:2018-11-18 20:07:39

标签: google-cloud-dataflow apache-beam

我在理解Cloud Dataflow如何知道何时同步或异步执行管道代码时遇到问题。

例如,在我开发的管道中,我读取了一个包含ID列表的文件,并在其中创建了sideInput。 ParDo转换将这个sideinput与通过读取另一个文件创建的另一个PCollection一起使用。

从这种意义上讲,在执行ParDo转换之前,数据流首先需要完全构建sideInput。

我如何知道管道何时以“同步或异步模式”执行?我对此有任何控制权吗?

0 个答案:

没有答案