我正在尝试创建一个循环,以创建一个循环,该循环可以帮助我删除具有一定数量缺失值的任何列。有人可以帮我吗?
for col in df:
"""Delete columns with over 200 missing values"""
if df[col].isnull().sum() > 200:
pd.DataFrame.drop(col)
答案 0 :(得分:1)
for col in df:
if df[col].isnull().sum() > 200:
df=df.drop(col)
不要从pd.DataFrame
掉线,而是从df
掉线,并且也要重新分配它。
甚至更好:
df=df.dropna(thresh=len(df)-200,axis=1)