在Apache Spark Streaming中, reduceByKeyAndWindow 使用户能够在旧数据过期时提供反函数。程序员可以使用此函数来减少已删除事件的计数值。
我想知道如何在Apache Flink中实现相同的效果。
答案 0 :(得分:1)
这是Flink不使用的特定于Spark的构造,因为它的窗口实现工作方式不同。它用于滑动窗户,以及"撤消"聚合"
由于Flink不需要在迷你批次之间进行最终聚合(但只是跨越内部窗格),并且不需要将窗口与小批量对齐,所以这个技巧不是必需的,它也可以非常快速地运行。