如何使用pyspark从数据框中的单个列创建两列

时间:2016-12-01 08:29:04

标签: apache-spark pyspark apache-spark-sql pyspark-sql apache-spark-2.0

我有一个变换数据框,看起来像这样

+---------+------+
|  Country|Status|
+---------+------+
|[AW,null]|    14|
|[UG,null]|    47|
|[CY,null]|  1324|
|[AO,null]|    20|
|[US,null]|325242|
|[KE,null]|   246|
|[DK,true]|     1|
|[ES,null]|  2127|
|[IT,true]|     2|
+----------------+

现在我必须将它转换为一个由三列组成的数据框,看起来像这样

+---------+--------+------+
|  Country|status  |Count |
+---------+--------+------+
|AW       |null    |    14|
|UG       |null    |    47|
|CY       |null    |  1324|
|AO       |null    |    20|
|US       |null    |325242|
|KE       |null    |   246|
|DK       |true    |     1|
|ES       |null    |  2127|
|IT       |true    |     2|
+---------+-------+-------+

0 个答案:

没有答案