我有一个数据框,其中有两个名为 nan 的列,它们不是字符串。我如何删除这些?
我尝试过
df.drop(np.nan, axis=1)
这不起作用。
通过重命名nans,我发现了一种肮脏的方法:
df.columns= df.columns.fillna('type')
df.drop('type', axis=1)
但是,我认为这不是最有效的方法。有没有更好的方法来删除名为nans的列?
答案 0 :(得分:0)
对我来说,您的解决方案有效:
df = df.drop(np.nan, axis=1)
另一种解决方案是通过布尔掩码删除:
df = pd.DataFrame({'A':list('abcdef'),
'B':[4,5,4,5,5,4],
np.nan:[7,8,9,4,2,3],
'D':[1,3,5,7,1,0],
'E':[5,3,6,9,2,4],
'F':list('aaabbb')})
df = df.loc[:, pd.notnull(df.columns)]
print (df)
A B D E F
0 a 4 1 5 a
1 b 5 3 3 a
2 c 4 5 6 a
3 d 5 7 9 b
4 e 5 1 2 b
5 f 4 0 4 b
详细信息:
print (pd.notnull(df.columns))
[ True True False True True True]