Spark:前一行的总和

时间:2016-11-07 19:56:20

标签: sql apache-spark apache-spark-sql

我使用spark来创建DataFrame。我有一个像这样的专栏:

+---+
|cid|
+---+
|  0|
|  0|
|  0|
|  1|
|  0|
|  1|
|  0|
+---+

并且想用它来创建一个新列,其中每一行都包含前面所有行的总和值以及它自己的值,所以它最终看起来像:

+---+
|sid|
+---+
|  0|
|  0|
|  0|
|  1|
|  1|
|  2|
|  2|
+---+

0 个答案:

没有答案