如何使用SCALA

时间:2018-02-01 12:17:45

标签: scala apache-spark

我的数据框如下:

C_ID| Month  |Usage
------------------
1   |January | 10 
2   |February|100
1   |March   | 20
2   |April   | 40
1   |June    | 50

我需要找到Usage值的增量(差异)。条件是,对于每个C_ID我必须每个月循环,并找出当前行/月的使用值与前一个的差异。

结果如下所示:

C_ID| Month  |Usage| Delta
--------------------------
1   |January | 10  |  0    // Since there is nothing before January so 0
2   |February|100  |  0    // Similar as above
1   |March   | 20  | 10
2   |April   | 40  | -60
1   |June    | 50  | 30

我想到的是首先按C_ID分组。但我将如何继续发现差异?

任何帮助将不胜感激。

提前非常感谢。

此致 拉胡

0 个答案:

没有答案