以特定方式取消旋转PySpark数据框

时间:2020-10-07 14:47:37

标签: pyspark

我有一个如下的PySpark数据框:

df2 = spark.createDataFrame([('101', '1', ['a','aa'], ['aa', 'bb']),
                             ('101', '2', ['b','bb'], ['xx', 'yy']),
                             ('101', '10',['c','cc'], ['cc', 'dd']),
                             ('102', '11',['d','dd'], ['dd', 'ee'])
                            ],
                           ['id', 'other_id', 'col_a', 'col_b']
                           )

如何取消旋转/转置数据框,使输出看起来像:

enter image description here

我尝试过的解决方案:

  1. 但是在expr中使用堆栈,但是val_one列中的值是动态的,我不确定我可以拥有什么(没有预定义的静态列表)

0 个答案:

没有答案