在Apache Flink中使用允许的延迟有什么好处? 例如:为什么不使用水印(乱序10个单位)代替水印(乱序5个单位)+允许的延迟时间(5个单位)?
答案 0 :(得分:0)
允许延迟是窗口API中的一个概念-它不是通用构造。
在加水印+允许延迟的情况下,优点是,一旦水印到达窗口结束时间,窗口将被触发并产生一些(初始)结果。因此,窗口产生某些结果之前的延迟减少了,并且随着延迟事件的到来,可能会更新结果-与-等待更长的时间,并得到一个结果。
选择对您的用例更有意义的一个。例如,有些人加水印的延迟很短(以秒为单位),允许的延迟时间以数十分钟为单位。如果他们总是不得不等待30或60分钟(例如)才能获得任何结果,他们将不会高兴。