计算Pandas系列中元素出现次数的最快方法是什么?
我目前最快的解决方案是.groupby(columnname).size()
。熊猫中有什么更快的东西吗?例如。我想要以下内容:
In [42]: df = DataFrame(['a', 'b', 'a'])
In [43]: df.groupby(0).size()
Out[43]:
0
a 2
b 1
dtype: int64
答案 0 :(得分:3)
pandas中的value_counts()
函数完全正确。
在所需的列上使用该功能。 即。
df['column_i_want'].value_counts()