我有一个数据集,我想在其中计算每列的缺失值。如果缺少值,我想打印标题名称。我使用以下代码来查找每列的缺失值
isnull().sum()
如果我打印结果一切正常,如果我尝试将结果放入列表然后处理标题,我就不能!
newList = pd.isnull(myData).sum()
print(newList)
在这种情况下,输出为:
Name 5
Surname 0
Age 3
我想只打印Surname,但我找不到如何将它返回到变量。
newList = pd.isnull(myData).sum()
print(newList[0])
此印刷品5(列'名称'的缺失值数量)
答案 0 :(得分:2)
将boolean indexing
与Series
:
df = pd.DataFrame({'A':list('abcdef'),
'B':[4,5,4,5,5,4],
'C':[np.nan,8,9,4,2,3],
'D':[1,3,5,np.nan,1,0],
'E':[5,3,6,9,2,4],
'F':list('aaabbb')})
print (df)
A B C D E F
0 a 4 NaN 1.0 5 a
1 b 5 8.0 3.0 3 a
2 c 4 9.0 5.0 6 a
3 d 5 4.0 NaN 9 b
4 e 5 2.0 1.0 2 b
5 f 4 3.0 0.0 4 b
newList = df.isnull().sum()
print (newList)
A 0
B 0
C 1
D 1
E 0
F 0
dtype: int64
#for return NaNs columns
print(newList.index[newList != 0].tolist())
['C', 'D']
#for return non NaNs columns
print(newList.index[newList == 0].tolist())
['A', 'B', 'E', 'F']