populate Rows(具有移动平均值)是Spark SQL 1.6.0 Imputing行

时间:2016-03-22 09:10:15

标签: apache-spark apache-spark-sql spark-dataframe

我有这样的数据作为DF,我想用第2列的移动平均值(最后2的窗口)填充行,直到我到达column1为2000

输入DataFrame:

Column1 column2 column3
100          2       89
200          6       102
300          10      105
400          15      125

预期结果DataFrame:

Column1 column2 column3
100          2       89
200          6       102
300          10      105
400          15      125
500      (10+15)/2  (105+ 125) /2
600   (15 + 25/2)/2 (125+ 230/2 )/2 

0 个答案:

没有答案