将列表列拆分为多行,每行2个

时间:2018-11-14 06:57:01

标签: python apache-spark pyspark apache-spark-sql

我有以下Spark DataFrame:

+---+--------------+
| id|          var1|
+---+--------------+
|  a|   [1,2,3,4,5]|
|  b|         [6,7]|
+---+--------------+

我想将var1分成多行,一次要取两个项目。我还想为id附加一个序列号。所需的输出如下所示:

+---+--------------+
| id|          var1|
+---+--------------+
|a-1|         [1,2]|
|a-2|         [3,4]|
|a-3|           [5]|
|b-1|         [6,7]|
+---+--------------+

如何在DataFrame中划分列表并分成多行?

0 个答案:

没有答案