我在pandas数据框中的不同列上具有value_counts的以下输出。这些列包含空白字符串。我想知道计数栏上方的数字代表什么。我似乎找不到答案。
编辑:原始数据框列很难共享,因为它有30个条目和470个空条目。如果有帮助,请参考以下专栏文章
:190
191 June
192
193 May
194 Apr
195 May
196
197 Feb
198 Oct
199 Jan
200 Jul
201 Dec
202 May
203 Sep
204 Mar
205 Jan
206 Oct
207 Aug
208 Sep
209 Jul
210 Aug
211 Apr
212 Jul
213 Jul
214 Sep
215
216 Nov
我也试图重复这种情况,但是没有在计数栏上方得到一个数字:
b = {'col1': [1, 2, 3, 3, 5, 6, 8], 'col2': [3, 4, 4, 5, 5, np.nan, ""]}
df3 = pd.DataFrame(data=b)
df3['col2'].value_counts()
用于每个输出的代码:
return FullDatesDF["Month2"].value_counts()
return FullDatesDF["Month3"].value_counts()
和输出
非常感谢
答案 0 :(得分:2)
检查是否有非空值,例如''之类的字符串。
Value_counts()自动排除NA值,但是如果有内容(例如空格),它将对其进行计数。
修改:
如果“”是您最常用的值,它将显示在顶部,看起来像列名。
您说您的df大约有470个空条目,与您排名靠前的数字匹配。
另一种查看方式:
"" 468
7 5
9 4
...
Name: Month3b, dtype: int64