我想使用spark数据框重命名列并添加条件。
例如:我有一个专栏" Code"我想重命名为"源代码"我想添加一个条件。当列中的值等于" A"它应该被重命名为" Agent"当值为" O"它应该重命名为"其他"。
答案 0 :(得分:1)
重命名列
df.withColumnRenamed("oldName", "newName")
更新价值
val newColumnValue = df("c")... //some calculation
df.withColumn("updatedValue", newColumn)