我有一个pyspark数据框,如下所示。 我想知道pyspark中熊猫的“爆炸”效果。谢谢。
我的pyspark数据框如下。项目列是字符串类型(而不是列表类型)
ID item
1 a, b, c
2 a, s
3 NA
5 f, j, l
我需要将列表列(字符串)中的每个项目分解为独立的行,如下所示:
ID item
1 a
1 b
1 c
2 a
2 s
3 NA
5 f
5 j
5 l
谢谢。