Pyspakr,行到列

时间:2018-09-24 07:08:27

标签: pyspark-sql

我正在尝试使用pyspark转换一个看起来像这样的表

Key         Value       Creation date   Last Update
key1        Value 1.1   Date 1.1        Udate 1.1
key1        Value 1.2   Date 1.2        Udate 1.2
key1        Value 1.3   Date 1.3        Udate 1.3
key2        Value 2.1   Date 2.1        Udate 2.1
key3        Value 3.1   Date 3.1        Udate 3.1
key3        Value 3.2   Date 3.2        Udate 3.2

变成这样

Key     Value 1     Laste Update 1  Value 2     Last Update 2
key 1   Value 1.1   Udate 1.1       Value 1.2   Udate 1.2
key 2   Value 2.1   Udate 2.1       
key 3   Value 3.1   Udate 3.1       Value 3.2   Udate 3.2

我应该在for循环中查看所有值,然后将新值复制到我想要的内容中吗?还是有更聪明的方法来解决此问题?

非常感谢您的帮助

0 个答案:

没有答案