Dataflow中无限制流的总计聚合

时间:2015-10-22 18:44:33

标签: google-cloud-dataflow

许多示例显示了对无界流的窗口进行聚合,但是假设我们需要获得在某个时间点看到的整个流的按键计数。 (想想到目前为止看到的所有内容的总计数量,而不是每个窗口的总数。)

看起来这可能是一个Combine.perKey和一个以某个间隔发出窗格的触发器。在这种情况下,窗口基本上是全局的,我们在整个作业生命周期内为同一窗口发出窗格。这是安全/合理的,还是有另一种计算滚动总计的方法?

1 个答案:

答案 0 :(得分:1)

Ryan您使用全局窗口和周期性触发器的解决方案是推荐的方法。只需确保在触发器上使用累积模式而不是丢弃模式。 Triggers页面应该包含更多信息。

如果您需要其他帮助,请告诉我们。