Spark:DataFrame重命名列并更新行值

时间:2017-01-04 21:52:26

标签: apache-spark dataframe

我想使用spark数据框重命名列并添加条件。

例如:我有一个专栏" Code"我想重命名为"源代码"我想添加一个条件。当列中的值等于" A"它应该被重命名为" Agent"当值为" O"它应该重命名为"其他"。

1 个答案:

答案 0 :(得分:1)

重命名列

df.withColumnRenamed("oldName", "newName")

更新价值

val newColumnValue = df("c")... //some calculation
df.withColumn("updatedValue", newColumn)