我想计算列中的NULL,空和NaN值。 我试过这样的话:
df.filter( (df["ID"] == "") | (df["ID"].isNull()) | ( df["ID"].isnan()) ).count()
但我总是收到此错误消息:
TypeError: 'Column' object is not callable
有没有人知道可能出现什么问题?
非常感谢提前!
答案 0 :(得分:7)
isnan
不是属于Column
类的方法,您需要导入它:
from pyspark.sql.functions import isnan
并使用它:
df.filter((df["ID"] == "") | df["ID"].isNull() | isnan(df["ID"])).count()