跳跃与滑动窗口

时间:2017-04-03 15:48:47

标签: hadoop streaming windowing

我理解为一个间隔设置翻滚窗口,并且事件不重叠并在设定的时间间隔到期。现在,跳跃窗口和滑动窗口都重叠,并且在跳跃窗口的情况下,我们具有跳跃间隔以及正常窗口间隔,并且滑动窗口具有除窗口间隔之外的滑动间隔。我查看Hopping Window上的这个链接,我明白了,但滑动间隔似乎也是一样的。有人可以帮我解释一下这个区别。

1 个答案:

答案 0 :(得分:0)

微软有一个很好的解释(link)。基本上,跳跃窗口总是从时间序列的开始前进特定的时间间隔。只有在要评估的时间序列中的数据时,滑动窗口才会前进。

数据集:

  • 时间T:18
  • T + 1:12
  • T + 7:20
  • T + 11:15
  • T + 16:19
  • T + 27:107

跳频: 从时间T开始,10秒窗口的总和值,提前5秒

  • T-T10:50(18 + 12 + 20)
  • T5-T15:35(20 + 15)
  • T10-T20:24(15 + 19)
  • T15-T25:19(19)
  • T20-T30:107

滑动:从时间T开始,为10秒窗口的总和值

  • T:50(18 + 12 + 20)
  • T1:47(12 + 20 + 15)
  • T7:44(20 + 15 + 19)
  • T11:24(15 + 19)
  • T16:19(19)
  • T27:107(107)

跳跃窗口更基于时间表,在该时间段的每个时间段产生输出。 Streaming窗口更基于事件,仅在数据存在时才生成输出。