我需要替换Spark数据框中的列中存在的空值。下面是我尝试过的代码
df=df.na.fill(0,Seq('c_amount')).show()
但这会抛出一个错误NameError: name 'Seq' is not defined
下面是我的桌子
+------------+--------+
|c_account_id|c_amount|
+------------+--------+
| 1| null|
| 2| 123 |
| 3| null|
+------------+--------+
预期产量
+------------+--------+
|c_account_id|c_amount|
+------------+--------+
| 1| 0|
| 2| 123|
| 3| 0|
+------------+--------+
答案 0 :(得分:1)
您需要这样使用
df = df.fillna("<BLANK>", subset=['col_name'])