我有一个如下数据集:
Col1. Col2. Col3. Col4
A 123 D J
B 234 E M
A 234 D J
我需要在col1 col3和col4列上添加一个频率计数完全匹配的第5列。
预期产出:
Col1. Col2. Col3. Col4. Col5
A 123 D J. 2
B 234 E M. 1
A 234 D J. 2
答案 0 :(得分:1)
您可以使用groupby
+ transform('count')
:
In [70]: df['Col5'] = df.groupby(['Col1','Col3'])['Col2'].transform('count')
In [71]: df
Out[71]:
Col1 Col2 Col3 Col4 Col5
0 A 123 D J 2
1 B 234 E M 1
2 A 234 D J 2