我想计算每个值出现在数据帧中的次数。
这是我的数据框 - df
:
status
1 N
2 N
3 C
4 N
5 S
6 N
7 N
8 S
9 N
10 N
11 N
12 S
13 N
14 C
15 N
16 N
17 N
18 N
19 S
20 N
我想要计算字典:
离。 counts = {N: 14, C:2, S:4}
我已尝试df['status']['N']
,但它提供了keyError
和df['status'].value_counts
,但没有用。
答案 0 :(得分:39)
您可以使用value_counts
和to_dict
:
print df['status'].value_counts()
N 14
S 4
C 2
Name: status, dtype: int64
counts = df['status'].value_counts().to_dict()
print counts
{'S': 4, 'C': 2, 'N': 14}
答案 1 :(得分:6)
使用失败者Counter
的替代单线:
In [3]: from collections import Counter
In [4]: dict(Counter(df.status))
Out[4]: {'C': 2, 'N': 14, 'S': 4}
答案 2 :(得分:4)
你可以这样试试。
df.stack().value_counts().to_dict()
答案 3 :(得分:1)
您可以将df
转换为列表吗?
如果是这样的话:
a = ['a', 'a', 'a', 'b', 'b', 'c']
c = dict()
for i in set(a):
c[i] = a.count(i)
使用词典理解:
c = {i: a.count(i) for i in set(a)}
答案 4 :(得分:1)
在此线程中查看我对Pandas DataFrame输出的响应,
count the frequency that a value occurs in a dataframe column
对于字典输出,可以进行如下修改:
def column_list_dict(x):
column_list_df = []
for col_name in x.columns:
y = col_name, len(x[col_name].unique())
column_list_df.append(y)
return dict(column_list_df)