有一个由3列组成的数据框。
+-----+----+-------+
| name| id |Subject|
+-----+---+--------+
| one| 1 |Science|
| two| 2 | Maths|
|three| 3 |Science|
| four| 4 | random|
+-----+---+--------+
我的要求是将第一列的数据替换为第三列的列名,以便结果表如下:
+-------+---+-------+
| name| id|Subject|
+-------+---+-------+
|Subject| 1|Science|
|Subject| 2| Maths|
|Subject| 3|Science|
|Subject| 4| random|
+-------+---+-------+
列表项
有人可以帮助我如何在pyspark中实现这一目标。