熊猫value_counts:计数列以上的数字含义

时间:2018-07-25 10:21:37

标签: python pandas

我在pandas数据框中的不同列上具有value_counts的以下输出。这些列包含空白字符串。我想知道计数栏上方的数字代表什么。我似乎找不到答案。

编辑:原始数据框列很难共享,因为它有30个条目和470个空条目。如果有帮助,请参考以下专栏文章

190       
191    June   
192        
193    May   
194    Apr

195    May
196       
197    Feb
198    Oct
199    Jan
200    Jul
201    Dec
202    May
203    Sep
204    Mar
205    Jan
206    Oct
207    Aug
208    Sep
209    Jul
210    Aug
211    Apr
212    Jul
213    Jul
214    Sep
215       
216    Nov

我也试图重复这种情况,但是没有在计数栏上方得到一个数字:

b = {'col1': [1, 2, 3, 3, 5, 6, 8], 'col2': [3, 4, 4, 5, 5, np.nan, ""]}
df3 = pd.DataFrame(data=b)
df3['col2'].value_counts()

enter image description here

用于每个输出的代码:

return FullDatesDF["Month2"].value_counts()
return FullDatesDF["Month3"].value_counts()

和输出

enter image description here

enter image description here

非常感谢

1 个答案:

答案 0 :(得分:2)

检查是否有非空值,例如''之类的字符串。

Value_counts()自动排除NA值,但是如果有内容(例如空格),它将对其进行计数。

修改:

如果“”是您最常用的值,它将显示在顶部,看起来像列名。

您说您的df大约有470个空条目,与您排名靠前的数字匹配。

另一种查看方式:

""     468
7      5
9      4
...
Name: Month3b, dtype: int64