我有一个包含很少列的Spark SQL DataFrame,但我想在该DataFrame中添加一些静态值。我怎么能这样做?
我尝试了withColumn
方法,但期待Column
预计会:
df.withColumn(col("newColumn", "static value")
更新
我得到了答案,我们需要为此目的使用lit
。
例如:
df.withColumn("newColumn", lit("some value")
答案 0 :(得分:1)
您可以使用UDF简单地创建它,以便您可以定义返回默认值的UDF,然后添加列并设置默认值,如下所示
val defaultValue=spark.udf.register("defaultValue",()=>"default")
df.withColumn(col("newColumn", defaultValue)
df.show()