如何使用一些静态值在DataFrame中添加列?

时间:2016-11-24 10:22:14

标签: scala apache-spark-sql spark-dataframe

我有一个包含很少列的Spark SQL DataFrame,但我想在该DataFrame中添加一些静态值。我怎么能这样做?

我尝试了withColumn方法,但期待Column

预计会:

df.withColumn(col("newColumn", "static value")

更新

我得到了答案,我们需要为此目的使用lit

例如:

df.withColumn("newColumn", lit("some value")

1 个答案:

答案 0 :(得分:1)

您可以使用UDF简单地创建它,以便您可以定义返回默认值的UDF,然后添加列并设置默认值,如下所示

val defaultValue=spark.udf.register("defaultValue",()=>"default")

df.withColumn(col("newColumn", defaultValue)

df.show()