我有以下Spark DataFrame:
+---+--------------+
| id| var1|
+---+--------------+
| a| [1,2,3,4,5]|
| b| [6,7]|
+---+--------------+
我想将var1
分成多行,一次要取两个项目。我还想为id
附加一个序列号。所需的输出如下所示:
+---+--------------+
| id| var1|
+---+--------------+
|a-1| [1,2]|
|a-2| [3,4]|
|a-3| [5]|
|b-1| [6,7]|
+---+--------------+
如何在DataFrame中划分列表并分成多行?