应用错误收集

在Dataflow的当前实现中，它存储在永久磁盘上（以防止机器故障）并在机会中缓存在内存中。
计算机数量会影响缓存性能和可用磁盘IOps数，从而影响每台计算机的吞吐量。中间数据也可能需要在机器之间进行混洗，从而增加了CPU的需求
窗户可能会发生两件事;它在触发器触发时触发，当水印通过窗口结束并允许延迟时关闭（并且是垃圾收集）。

当窗口触发时，行为取决于正在使用的window accumulation mode。对于.accumulatingFiredPanes，数据会一直保留到.withAllowedLateness中的值为止。对于.discardingFiredPanes，每次触发后都会丢弃数据。

当窗口关闭时，所有剩余数据（增量或总值）将发送到下一个变换，并清除窗口的所有数据。如果您使用的是默认触发器且0允许延迟（也是默认值），则两者都会立即发生。
是的！如果使用关联操作（称为Combiner），则中间结果将以紧凑格式存储。