我正在检查火花窗口功能,以每30秒检查一次页面点击,但它也继续增加前一个窗口时间的价值。
假设位于**12:00:30 count is 10**
和**12:01:00 count is 10**
。
但是火花给**output as 20**
添加以前的窗口值。我正在使用Kafka-spark流式传输。
val rs=words.reduceByKeyAndWindow((x,y)=>(x._1 + y._1,x._2 + y._2),Durations.seconds(30))
请提供帮助,以及如何在Kafka的KSQL中重置窗口翻转之类的值。