标签: google-cloud-dataflow apache-beam
我在理解Cloud Dataflow如何知道何时同步或异步执行管道代码时遇到问题。
例如,在我开发的管道中,我读取了一个包含ID列表的文件,并在其中创建了sideInput。 ParDo转换将这个sideinput与通过读取另一个文件创建的另一个PCollection一起使用。
从这种意义上讲,在执行ParDo转换之前,数据流首先需要完全构建sideInput。
我如何知道管道何时以“同步或异步模式”执行?我对此有任何控制权吗?