在pandas数据框的列中计算每种类型的标签

时间:2017-04-23 08:02:52

标签: python sklearn-pandas

我有一个以下数据框。我需要为每个捐赠者找到每种类型的MNTPCODE的计数。

    CONTID  MEDIUMCODE  MNTOPCODE   CLASCODE    EXTRELNO    CONTDIREC   CONTDATE
   000405402     CI        CTS        CT         0000020       O           1994-05-09
    000430904   CI       CTS          CT         0000020        O       1994-06-14
   000592732    CI       CTS          CT        0000020         O       1994-10-21

1 个答案:

答案 0 :(得分:1)

使用DataFrame.groupby(index)

尝试.size()

我添加了额外的行' FAKECODE'为了更好地理解

df

      CONTID MEDIUMCODE MNTOPCODE CLASCODE EXTRELNO CONTDIREC    CONTDATE
0  000405402         CI       CTS       CT  0000020         O  1994-05-09
1  000430904         CI       CTS       CT  0000020         O  1994-06-14
2  000592732         CI       CTS       CT  0000020         O  1994-10-21
3  000592733         CI  FAKECODE       CT  0000020         O  1994-10-21

然后使用df.groupby('MNTOPCODE').size() =>

MNTOPCODE
CTS         3
FAKECODE    1
dtype: int64