标签: sql apache-spark apache-spark-sql
我使用spark来创建DataFrame。我有一个像这样的专栏:
+---+ |cid| +---+ | 0| | 0| | 0| | 1| | 0| | 1| | 0| +---+
并且想用它来创建一个新列,其中每一行都包含前面所有行的总和值以及它自己的值,所以它最终看起来像:
+---+ |sid| +---+ | 0| | 0| | 0| | 1| | 1| | 2| | 2| +---+