循环删除列超过缺失值的数量

时间:2018-11-16 03:50:25

标签: python for-loop missing-data

我正在尝试创建一个循环,以创建一个循环,该循环可以帮助我删除具有一定数量缺失值的任何列。有人可以帮我吗?

for col in df:

"""Delete columns with over 200 missing values"""

if df[col].isnull().sum() > 200:
    pd.DataFrame.drop(col)

1 个答案:

答案 0 :(得分:1)

for col in df:
    if df[col].isnull().sum() > 200:
        df=df.drop(col)

不要从pd.DataFrame掉线,而是从df掉线,并且也要重新分配它。

甚至更好:

df=df.dropna(thresh=len(df)-200,axis=1)