如何在Spark数据框中使用\ N替换空字符串

时间:2018-07-19 16:37:17

标签: scala apache-spark apache-spark-sql

如何在火花\N中将空字符串替换为dataframe

我尝试了以下方法:

Df.na.replace(Seq("column1"),Map("" -> null)).na.fill("\N", Seq("column1"))

这使我出错。

1 个答案:

答案 0 :(得分:3)

您必须像下面这样

//Input df

+-----+-------+
| name|address|
+-----+-------+
|Manoj|Chennai|
|     |  Delhi|
|Alice|       |
+-----+-------+

//Replacement logic

df.na.replace(Seq("name","address"),Map(""->"\\n")).show

//Output df
+-----+-------+
| name|address|
+-----+-------+
|Manoj|Chennai|
|   \n|  Delhi|
|Alice|     \n|
+-----+-------+