使用python将空列添加到Spark中的数据框

时间:2016-02-09 12:31:37

标签: pyspark rdd spark-dataframe

我有一个数据帧,我想用一个nother数据帧创建一个unionAll。问题是第二个数据帧的列多于第一个数据帧。有没有办法在我的第一个数据框中添加三列只有空单元格?

3 个答案:

答案 0 :(得分:1)

使用spark-dataframe的withColumn对象 DF.withColumn("NewCol","Value")

答案 1 :(得分:1)

df.withColumn('NewColumn',lit(None).cast(StringType()))

答案 2 :(得分:0)

也许这会有所帮助

要添加字符串类型列:

from pyspark.sql.types import StringType

df.withColumn("COL_NAME", lit(None).cast(StringType()))

要添加整数类型

from pyspark.sql.types import StringType

df.withColumn("COL_NAME", lit(0).cast(IntegerType()))