我想计算数据帧中出现的事件,基本上是我现在正在做的事情:
dfhelp = df.groupby('Art')['Number'].count().reset_index()
dfhelp = dfhelp.groupby('Number')['Art'].count().reset_index()
dfhelp.head(2)
Number Art
0 1 4
1 2 118855
这给了我正确的输出,但是如何以更简单的方式运行它呢?
在第一步中,我计算“艺术”有多少行,在第二步中,我计算出现这种情况的频率。
原始数据框如下所示:
Art Number
A 1001
A 20101
A 11
B 2
B 3
C 2
C 2
将导致:
Number Art
3 1
2 2
请注意第一个{by {1}}分组会导致:
dfhelp = df.groupby('Art')['Number'].count().reset_index()