Python / Pyspark - 计数NULL,空和NaN

时间:2018-01-12 15:13:33

标签: python pyspark

我想计算列中的NULL,空和NaN值。 我试过这样的话:

df.filter( (df["ID"] == "") | (df["ID"].isNull()) | ( df["ID"].isnan()) ).count()

但我总是收到此错误消息:

TypeError: 'Column' object is not callable

有没有人知道可能出现什么问题?

非常感谢提前!

1 个答案:

答案 0 :(得分:7)

isnan不是属于Column类的方法,您需要导入它:

from pyspark.sql.functions import isnan

并使用它:

df.filter((df["ID"] == "") | df["ID"].isNull() | isnan(df["ID"])).count()