标签: google-cloud-dataflow apache-beam
我们正在使用Beam 2.2 java sdk和Google Dataflow跑步者。
我们收到4小时的批次' PubSub中的数据(没有时间戳),我们需要逐个限制和处理生成的窗口,因为每个窗口都需要一些状态信息。我们可以为此数据分配时间戳并创建窗口,但这可能会导致同时准备和发出多个窗口。 Beam是逐个处理这些窗口还是我们需要明确确保这个处理?