如何在Pyspark中实现Rollapply功能(来自R)?

时间:2019-05-14 15:27:55

标签: r pyspark apache-spark-sql pyspark-sql rollapply

我希望找到与以下R代码等效的Pyspark:

result = rollapply(column_vals,3,mean,align='right',fill=NA)

此处rollapply来自软件包“ zoo”,该软件包用于将功能应用于 数组的滚动边距。

样本输出

enter image description here

但是,我需要在Pyspark中找到与之等效的东西。

修改

我添加了更多详细信息。结果基本上包含(-2到0单元格中的值的平均值,即0是当前单元格,而-2是该单元格中的值,落后两步)

例如19.866 =(19.020 + 24.515 + 16.06)/ 3

0 个答案:

没有答案