标签: apache-spark
我们需要计算一些流数据并考虑使用火花流来完成它。
我们需要生成三种报告。报告基于
报告的频率为5分钟。
阅读文档后,最明显的解决方法似乎是设置一个间隔为5分钟的火花流和两个1小时1天的窗口。
但我担心,如果窗户太大,不能持续一天一小时。我对火花流没有太多经验,那么你环境中的窗口长度是多少?