Combine.perKey和GroupByKey对于后期数据的行为不正确

时间:2017-11-02 12:11:31

标签: java google-cloud-dataflow apache-beam

我的简化方案是,我想计算每分钟收到多少A和B事件。我还需要支持后期数据。

我们假设我在同一个窗口收到2个A和2个B事件(00:00:00-00:00:001) 所以预期的结果是2个A事件和2个B事件 然后我在同一个(00:00:00-00:00:001)窗口收到2个晚B事件 我希望在最后一个窗格中我会得到2个A事件和4个B事件

但实际上我从之前的窗格中得到了一些累积的结果 这是显示我的问题的Gist with the sample code

下面我概述了实际和预期的结果。

<!DOCTYPE html>
<html>
<body>

<iframe frameborder="0" scrolling="no" src="https://www.w3schools.com" width="100%" onload='javascript:(function(ifrm){
var nheight =ifrm.contentWindow.document.body.scrollHeight;
var nwidth = document.body.clientWidth50;
ifrm.contentWindow.document.body.style.wordBreak ="break-all";
ifrm.contentWindow.document.body.style.overflow ="auto";
ifrm.width=nwidth+"px";
ifrm.height=nheight+"px";}(this));'></iframe>

  <p>Your browser does not support iframes.</p>
</iframe>

</body>
</html>

0 个答案:

没有答案