列名称作为同一数据框中其他列的数据

时间:2019-06-26 22:19:31

标签: pyspark

有一个由3列组成的数据框。

+-----+----+-------+    
| name| id |Subject|    
+-----+---+--------+    
|  one|  1 |Science|    
|  two|  2 |  Maths|    
|three|  3 |Science|   
| four|  4 | random|    
+-----+---+--------+

我的要求是将第一列的数据替换为第三列的列名,以便结果表如下:

+-------+---+-------+
|   name| id|Subject|
+-------+---+-------+
|Subject|  1|Science|
|Subject|  2|  Maths|    
|Subject|  3|Science|    
|Subject|  4| random|    
+-------+---+-------+

列表项

有人可以帮助我如何在pyspark中实现这一目标。

0 个答案:

没有答案