在流处理中,基于计数(也称为基于元组的)窗口和翻滚窗口之间的区别是什么? 从我的角度来看,它们是相同的: 翻滚窗口设置其新的(开始,结束)指针,每次到达一定数量的元素(它是一个尺寸=幻灯片的滑动窗口)。这也是基于计数的窗口的作用。
有人可以向我解释一下这个区别吗?
答案 0 :(得分:1)
计数窗口的大小取决于其内部的事件数。计数窗口没有任何特定的有效时间。
翻滚窗口具有固定的时间跨度,并将根据配置的时间跨度创建新的数据窗口。任何属于该时间跨度的事件都将在窗口的聚合函数中使用。
需要一点点挖掘才能找到这个链接,但它用图形时间线描绘了一个非常清晰的窗口类型图,以说明数据在每个内部的行为。
Windows in StreamInsight: The Basics
这个页面有一个可靠的图形示例,表明它是一个翻滚窗口。