不选择缺少的值吗?

时间:2019-05-30 01:18:23

标签: python pandas imputation

拥有DF med562。类别变量的分布如下

I    6119923

O     764905

      166666

Name: IND, dtype: int64

只想使用I值(含6119923行)来估算166666缺失值。写下来

med562['IND']=med562['IND'].fillna(value='I')

Catcounts=med562.IND.value_counts(dropna=False)

Catcounts

它没有变化,仍然是相同的分布。它在Python 3.7.3上运行。不应是软件问题。任何想法?谢谢。

1 个答案:

答案 0 :(得分:1)

不是NaN,而是空格,如果在进行NaN时是value_counts,它将不会显示在结果中,因为{{1 }}默认为True

dropna=True