将列添加到sparkR中的DataFrame

时间:2016-05-19 15:22:39

标签: r sparkr

我想在SparkR的DataFrame中添加一个填充了字符N的列。我会像非SparkR代码那样做:

df$new_column <- "N"

但是使用SparkR,我收到以下错误:

Error: class(value) == "Column" || is.null(value) is not TRUE

我已经尝试过疯狂的东西来管理它,我能够使用另一个(现有的)df <- withColumn(df, "new_column", df$existing_column)创建一个列,但是这个简单的事情,没有......

任何帮助?

感谢。

2 个答案:

答案 0 :(得分:14)

直接的解决方案是使用SparkR::lit()函数:

df_new = withColumn(df, "new_column_name", lit("N"))

答案 1 :(得分:0)

有一种更简单的方法来使用SparkR::lit(),它可以更紧密地模仿您首先尝试的语法:

df$new_column <- lit("N")