无法从df列中提取字符串

时间:2019-08-08 15:54:31

标签: string scala dataframe apache-spark

我想在DF中添加一列。新列的内容基于其他列。这就是我所做的:

val dfr = DFRejID.withColumn("CAUSE_REJET", lit("Reg_ctrl_axe/pas de correspondance pour " + DFRejID.select("COD_ENTREP").as[String].collect()))

这是结果:

Reg_ctrl_axe/pas de correspondance pour ID_ENTITE=[Ljava.lang.String;@9d1fe08

请问如何解码。谢谢

1 个答案:

答案 0 :(得分:2)

这应该有效!

val dfr = DFRejID.withColumn("CAUSE_REJET", concat(lit("Reg_ctrl_axe/pas de correspondance pour "), $"COD_ENTREP"))

您不想在第一个命令中嵌套.select。另外,调用.collect将在您的主节点(而不是执行者)上创建一个集合,您也希望避免这种情况。