如何在pyspark中添加带字符串常量的新列

时间:2017-05-04 22:19:04

标签: apache-spark pyspark

如何将字符串值添加到pyspark中的列。 使用withColumn(" status"," online")会出错

我在这里使用Spark 1.6

1 个答案:

答案 0 :(得分:-1)

可以添加新列,如下所示

df.withColumn("status",df.online)

这可以明确地转换为字符串类型,如下面的

df.withColumn("status",df.online.cast("String"))