Question

我想计算每个值出现在数据帧中的次数。

这是我的数据框 - df：

我想要计算字典：

离。 counts = {N: 14, C:2, S:4}

我已尝试df['status']['N']，但它提供了keyError和df['status'].value_counts，但没有用。

Answer 1

您可以使用value_counts和to_dict：

print df['status'].value_counts()
N    14
S     4
C     2
Name: status, dtype: int64

counts = df['status'].value_counts().to_dict()
print counts
{'S': 4, 'C': 2, 'N': 14}

Answer 2

使用失败者Counter的替代单线：

In [3]: from collections import Counter

In [4]: dict(Counter(df.status))
Out[4]: {'C': 2, 'N': 14, 'S': 4}

Answer 3

你可以这样试试。

df.stack().value_counts().to_dict()

Answer 4

您可以将df转换为列表吗？

如果是这样的话：

a = ['a', 'a', 'a', 'b', 'b', 'c']
c = dict()
for i in set(a):
    c[i] = a.count(i)

使用词典理解：

c = {i: a.count(i) for i in set(a)}

Answer 5

在此线程中查看我对Pandas DataFrame输出的响应，

count the frequency that a value occurs in a dataframe column

对于字典输出，可以进行如下修改：

def column_list_dict(x):
    column_list_df = []
    for col_name in x.columns:        
        y = col_name, len(x[col_name].unique())
        column_list_df.append(y)
    return dict(column_list_df)

计算pandas DataFrame列中的值的频率

5 个答案: