精确行的频率计数

时间:2017-02-05 21:43:27

标签: python python-3.x pandas statistics

我有一个如下数据集:

Col1.    Col2.    Col3.        Col4 
A        123      D            J
B        234      E            M
A        234      D            J

我需要在col1 col3和col4列上添加一个频率计数完全匹配的第5列。

预期产出:

Col1.    Col2.    Col3.        Col4.   Col5 
A        123      D            J.      2 
B        234      E            M.      1 
A        234      D            J.      2

1 个答案:

答案 0 :(得分:1)

您可以使用groupby + transform('count')

In [70]: df['Col5'] = df.groupby(['Col1','Col3'])['Col2'].transform('count')

In [71]: df
Out[71]:
  Col1  Col2 Col3 Col4  Col5
0    A   123    D    J     2
1    B   234    E    M     1
2    A   234    D    J     2