拥有DF med562。类别变量的分布如下
I 6119923
O 764905
166666
Name: IND, dtype: int64
只想使用I值(含6119923行)来估算166666缺失值。写下来
med562['IND']=med562['IND'].fillna(value='I')
Catcounts=med562.IND.value_counts(dropna=False)
Catcounts
它没有变化,仍然是相同的分布。它在Python 3.7.3上运行。不应是软件问题。任何想法?谢谢。
答案 0 :(得分:1)
不是NaN
,而是空格,如果在进行NaN
时是value_counts
,它将不会显示在结果中,因为{{1 }}默认为True
dropna=True