标签: scala apache-spark spark-dataframe
我有一个大约12000行的大型数据集。数据由位移值和时间戳组成。对于每10行,我想计算平均值,std dev方差等。
我可以使用窗口功能吗?或者有人可以提出更简单的方法吗?
答案 0 :(得分:1)
是使用rolling windows与lag,lead,rowsBetween等等,根据您的使用案例,有大量选项可供选择:windows explained {{3 }}
rolling windows
lag
lead
rowsBetween